自学内容网 自学内容网

BeautifulSoup4在爬虫中的使用

一、Beautiful Soup4简介

Beautiful Soup 提供一些简单的python函数来处理导航、搜索等功能。

它是一个工具箱,是python的一个库,最主要的功能是从网页获取数据。

二、Beautiful Soup4安装

在cmd下安装

pip install beautifulsoup4

三、BeautifulSoup4支持的主要解析器:

1、Python标准库中的HTML解析器(html.parser)

        在创建BeautifulSoup对象时,将解析器指定为"html.parser"

2、lxml解析器

        在创建BeautifulSoup对象时,将解析器指定为'lxml'。注意,使用lxml解析器需要先安装lxml库。

3、html5lib解析器

        在创建BeautifulSoup对象时,将解析器指定为"html5lib"。注意,使用html5lib解析器需要先安装html5lib库。


原文地址:https://blog.csdn.net/m0_74139820/article/details/142534788

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!