当前位置: 首页 > news >正文

python爬取京东评论 -

使用DrissionPage模块进行爬取,DrissionPage是一个自动化的模块,可以模拟人的操作,进行翻页等操作,比传统爬取更加方便
在使用DrissionPage之前,需要先初始化路径运行下面的代码,需要将r'D:\Chrome\Chrome.exe' 替换为本地Chrome的执行路径,如果没有Chrome浏览器,也可以切换其他浏览器

from DrissionPage import ChromiumOptionspath = r'D:\Chrome\Chrome.exe'  # 请改为你电脑内Chrome可执行文件路径
ChromiumOptions().set_browser_path(path).save()

通过开发者工具找到评论数据对应的请求网址,全部评价,定位页面等

image

具体代码

# 导入自动化模块
import time
from DrissionPage import ChromiumPage
# 导入csv
import csv# 创建文件对象
f = open('data.csv',mode='w',encoding='utf-8',newline='')
# 字典写入方法
csv_writer = csv.DictWriter(f,fieldnames=['昵称','用户等级','评分','评论','时间','产品',
])
# 写入表头
csv_writer.writeheader()
# 打开浏览器(实例化浏览器对象)
dp = ChromiumPage()# 访问网站
dp.get('https://item.jd.com/10058384218794.html')
# 等待页面加载
time.sleep(3)
# 监听数据包
dp.listen.start('client.action')
# 点击全部评价
dp.ele('css:.all-btn').click()
# 构建循环翻页
for page in range(1,201):print(f'正在采集第{page}页的数据')# 等待数据包加载r = dp.listen.wait()# 获取数据内容json_data = r.response.body# 键值对取值,提取评论所在列表datas = json_data['result']['floors'][2]['data']# for循环提取列表元素for index in datas:try:dit = {'昵称':index['commentInfo']['userNickName'],'用户等级': index['commentInfo']['officerLevel'],'评分': index['commentInfo']['commentScore'],'评论': index['commentInfo']['commentData'],'时间': index['commentInfo']['commentDate'],'产品': index['commentInfo']['wareAttribute'][0]['颜色'],}# 写入数据csv_writer.writerow(dit)print(dit)except:pass# 定位页面tab = dp.ele('css:._rateListContainer_1ygkr_45')# 下滑tab.scroll.to_bottom()

运行代码即可爬取出评论,并输出为.csv文件

image

http://www.fuzeviewer.com/news/392/

相关文章:

  • 中考_体育
  • 常见问题处理 --- phpstudy启动mysql失败
  • 20232308 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • 【密码学实战】openHiTLS PKCS12命令行程序: PKCS12文件生成与解析
  • 「CTSC2017-游戏」题解
  • vue3 vue3-form-element表单生成工具 输入框增加后缀
  • 20232402 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • 掘金2025年:数字化商业浪潮下,如何选对平台与伙伴?一站式多商户商城系统推荐榜发布,多商户商城代理招募/多商户项目合伙人加盟/一站式开店代理项目加盟
  • 为医疗器械行业搭建“数字桥梁”,破解协同效率与合规难题
  • PostgreSQL 服务版
  • 20232307 2025-2026-1 《网络与系统攻防技术》实验三实验报告
  • 2025年10月办公家具公司评价榜:基于真实数据的权威推荐清单
  • vue+antv/x6项目使用问题
  • 《程序员修炼之道:从小工到专家》前五分之一观后感
  • 坐标系与投影关系
  • 用gdb的动态视角看ret2text的实现
  • 1027随笔
  • ask_skill
  • SVN 主分支合并之通过主分支合并子分支执行流程
  • 现代c++编程体验2
  • 化繁为简:解密国标GB28181算法算力平台EasyGBS如何以兼容性与易用性赋能安防集成
  • 计算机毕业设计springboot音乐畅听系统 基于Spring Boot框架的智能音乐播放系统编写 Spring Boot驱动的音乐在线欣赏平台构建
  • vue2 封装组件使用 v-mode【el-radio,el-input】
  • P11993 [JOIST 2025] 迁移计划 题解
  • ERP和CRM、SRM、MES之间的关系,怎么理解?
  • 2025年市面上氟碳铝单板品牌、市场氟碳铝单板公司、国内氟碳铝单板生产厂家、2025年氟碳铝单板品牌、口碑好的氟碳铝单板产品综合评测
  • 扩展欧几里德算法
  • 嵌入式基础--第七周作业--OLED显示
  • Luogu P3237 [HNOI2014] 米特运输 题解 [ 蓝 ] [ 树形 DP ] [ 哈希 ]
  • 各个版本的sqlite-jdbc jar下载链接