Python网络爬虫（五）：b站弹幕

🕗 发布于 2024-04-08 13:53 python 爬虫 开发语言

上一篇对b站的视频评论爬取进行了探讨，这一篇是弹幕。直接上代码：

import csv
import json
import re
import chardet
import requests

headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 SLBrowser/8.0.1.3162 SLBChan/105'}


# 对爬取的页面内容进行json格式处理
def get_text(url):
    res = requests.get(url=url, headers=headers)
    res.encoding = chardet.detect(res.content)['encoding']  # 统一字符编码
    res = res.text
    data = json.loads(res)  # json格式化
    return data


def get_cid(bv):
    url_1 = 'https://api.bilibili.com/x/player/pagelist?bvid={}'.format(bv)
    response = get_text(url_1)
    cid = response['data'][0]['cid']  # 获取cid
    return cid


def get_content_list(cid):
    content_list = []
    url = f'https://comment.bilibili.com/{cid}.xml'
    r2 = requests.ge

原文地址：https://blog.csdn.net/lyccomcn/article/details/137380344

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

富格林：领悟可信经验避免暗箱
请不要和别人过多地作比较，因为每个人需要的学习时间都不同，收获的经验也是不一样的。在模拟投资的学习过程中，我们的主要目标就是发展自己的个人操作策略和风格。当我们的盈利概率逐日增加、月盈利逐渐增加时，可
阅读更多2024-10-07
【信号与系统第六章】15、用拉普拉斯变换解微分方程
对于若令则对于式，画成框图形式为：再将式。
阅读更多2024-10-07
【MySQL】MySQL表的操作
这个语句创建了一个 users 表，其中 id 是自动递增的主键，username 和 email 是非空字段，并且每个字段都有相应的注释。综上所述，这些文件的存在和它们的内容反映了MySQL数据库d
阅读更多2024-10-07
微信小程序开发-调试及配置文件介绍
这样，来自相同来源的系统日志就会被隐藏，不再显示在控制台中。如果你需要再次查看这些日志，可以通过控制台的过滤(Filter)功能来重新显示它们。
阅读更多2024-10-07
Github优质项目推荐-第四期
《Github 优质项目推荐 - 第四期》为你带来六个热门项目。涵盖文字识别工具、知识库平台、无代码平台、改良版 VIM、AIGC 课程及 Windows 实用程序。每个项目都在 Github 上拥有
阅读更多2024-10-07
昇思MindSpore进阶教程--单节点数据缓存(上)
大家好，我是刘明，明志科技创始人，华为昇思MindSpore布道师。技术上主攻前端开发、鸿蒙开发和AI算法研究。努力为大家带来持续的技术分享，如果你也喜欢我的文章，就点个关注吧。
阅读更多2024-10-07
Charles安卓抓包环境配置
官网搜索然后直接下载就可以了。
阅读更多2024-10-07
深度学习：深度学习的主流框架
深度学习框架是用于构建、训练和部署深度学习模型的软件库和接口。这些框架大多数提供了高效的数值计算功能，并支持数据流图、自动微分以及高效的资源管理。选择合适的深度学习框架取决于项目的需求、预期的功能性、
阅读更多2024-10-07
Qt Creator安卓环境配置【筑基篇】
由于我的Qt Creator目前就先的14版本IDE老是存在各种莫名奇妙的bug，我都已经成为官方Qt Forum官方论坛的常客了。有一说一新版本的各种设置不小心误触是真的坑死人。不说了给我小主机配置
阅读更多2024-10-07
Exams/ece241 2014 q4
因为always 内语句是同时执行所以存在 z 输出不对的情况。
阅读更多2024-10-07

Python网络爬虫（五）：b站弹幕

相关文章