BeautifulSoup4在爬虫中的使用
一、Beautiful Soup4简介
Beautiful Soup 提供一些简单的python函数来处理导航、搜索等功能。
它是一个工具箱,是python的一个库,最主要的功能是从网页获取数据。
二、Beautiful Soup4安装
在cmd下安装
pip install beautifulsoup4
三、BeautifulSoup4支持的主要解析器:
1、Python标准库中的HTML解析器(html.parser)
在创建BeautifulSoup对象时,将解析器指定为"html.parser"
2、lxml解析器
在创建BeautifulSoup对象时,将解析器指定为'lxml'
。注意,使用lxml解析器需要先安装lxml库。
3、html5lib解析器
在创建BeautifulSoup对象时,将解析器指定为"html5lib"
。注意,使用html5lib解析器需要先安装html5lib库。
原文地址:https://blog.csdn.net/m0_74139820/article/details/142534788
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!