抖音直播弹幕捕获【转载 + 修改】
前言
- 无意在精易论坛看到了这个帖子
- 简单浏览了下这个源码的逻辑就是运行
webDriver.py
把弹幕下载下来并且存放在douyinLiveFile
文件夹中 - 然后运行
webChat.py
去读douyinLiveFile
文件夹中下载好的弹幕并解析 - 是通过
playwright
检测网页响应状态,对于爬虫来说就是自动抓取指定的内容,不需要任何算法,反爬将毫无意义,这让我想起了另一款神器selenium
- 这里很有必要去了解一下Playwright是什么
- 补充:这个方法比wss连接的要好,物理外挂最为致命,并且playwright是
支持异步
的,也就是可以执行多个
直播间的任务,具体转到playwright官方文档查阅 - 简单的加密已经不能防范这个方式的爬虫了,只要浏览器可以看的它都可以获取
- 此源码需要有python基础,不太适合新手,因为这个只是做了个获取演示,你需要再去修改处理获取后的内容,要更方便的使用最好部署在服务器中
- 我博客很多内容都是一个结果而没有分析过程导致好像是搬运而来的一样,我只是不太喜欢写教程以及过程这样太麻烦了,后面会慢慢改正
代码
注意事项
- 只能使用网页版直播链接
- 我这里只放
修改
处 - 点击此处下载完整版
# -*- coding: utf-8 -*- |
结束
本源码仅限学习交流
请勿用于非法途径

评论