python爬虫/引用requests/基本使用

🕗 发布于 2024-09-24 13:56 python 爬虫 开发语言 css3

1.安装requests

进入控制台使用该命令安装requests

pip3 install requests

2.对网站使用get请求

这里用对网站进行get请求，然后打印。

import requests //引用requests

response = requests.get(url='https://www.bilibili.com/')

print(response.text)

3.对网站使用post请求

这里用对网站进行post请求，然后打印。

import requests

data = {"name","测试"}
# post请求页面数据，并向页面传递数据
response = requests.patch("https://www.bilibili.com/");
print(response.text)

4.对网站使用get带参数的请求

import requests

data = {"key1":"value1","key2":"value2"}

response = requests.get("https://www.jd.com",params=data)

print(response.url)
print(response.headers)
print(response.text)

5.获取网站的动态数据

网址可以使用浏览器的F12查询图片地址

#使用requests模块可以获得整个页面数据
#如果希望获得页面中的某一个数据改如何获取
#https://i0.hdslb.com/bfs/new_dyn/b4f40893e8c7b1f07a79f92aef9551fc3546568116406964.jpg@.webp

import requests

#获得图片
response =  requests.get('https://i0.hdslb.com/bfs/new_dyn/b4f40893e8c7b1f07a79f92aef9551fc3546568116406964.jpg@.webp')
with open('tupian.webp','wb') as f:
     f.write(response.content)

6.获得本机ip

import requests


#获得JSON
response =  requests.get("http://httpbin.org/ip")
data = response.json()
print(data)
print(data['origin'])

7. 自定义头部信息

import requests
header={
    'user-agent':'haha/v'
}
response = requests.get('http://httpbin.org/get',headers = header)
print(response.headers)#获得请求头信息
print(response.request.headers)#获得响应头信息

8.查看coolkies_arg

import requests


url = 'http://httpbin.org/cookies'
cookies = dict(coolkies_arg='hello python')
response = requests.get(url=url,cookies=cookies)
print(response.text)

9.如何查看网站头部

1.访问网站打开发F12这里使用百度演示

2.点击网络选项刷新页面

3.找到该文件一般在第一个的位置，点击查看信息

最后一样就是我们需要的信息。

原文地址：https://blog.csdn.net/ededabo/article/details/142458565

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：JUC并发编程_ReadWriteLock
下一篇：设计模式之中介者

组合优化与凸优化学习笔记4 凸优化问题
假如f(x)是方圆R以内（R只要大于0就行）最好的一个解。
阅读更多2024-09-24
【Python语言初识(一)】
计算机中的变量是实际存在的数据或者说是存储器中存储数据的一块内存空间，变量的值可以被读取和修改，这是所有计算和控制的基础。计算机能处理的数据有很多种类型，除了数值之外还可以处理文本、图形、音频、视频等
阅读更多2024-09-24
Edge SCDN助力应对SQL注入漏洞
企业应积极采用快快网络SCDN等安全产品，结合内部安全措施，共同构建坚不可摧的安全屏障，确保用户数据和业务系统的安全。近期，某知名大厂的内部管理系统被曝存在SQL注入漏洞，这再次提醒我们，在享受数字化
阅读更多2024-09-24
Register Two Point Sets 注册两个点集
与图像配准类似，可以对 n 维“移动”点集进行重新采样，以与“固定”点集对齐。可以使用 ITK 点集度量和 ITK 优化器来注册这两个集合。在此示例中，我们创建两个具有任意偏移量的 itk.Point
阅读更多2024-09-24
C++从入门到入土（五）——再谈构造函数
前面我们通过介绍C++的六个默认成员函数，从而实现了日期类，但对于C++的类和对象而言，还有一些零碎的知识，比如：初始化列表，匿名对象，友元等问题，因此，本篇文章我将从以上几个方面再谈构造函数，由浅入
阅读更多2024-09-24
js发送邮件至指定邮箱功能实现方式和技巧？
无论是前端还是后端，js发送邮件至指定邮箱的功能都需要开发者精心设计和实现。AokSend，JS集成API与SMTP接口，一键发送邮件至指定邮箱，自动化通信，高效无忧！
阅读更多2024-09-24
使用双向 LSTM 和 CRF 进行中文命名实体识别
本文介绍了使用双向 LSTM 和 CRF 进行中文命名实体识别的方法，并对代码进行了详细分析。通过设置合适的超参数、进行数据预处理、构建模型和设置回调函数，可以有效地训练模型并进行准确的预测和评估。这
阅读更多2024-09-24
分布式锁实现与原理探究:介绍总结
分布式锁的用途、基本特征以及实现方式，作为一篇总结性的文章
阅读更多2024-09-24
植物检测系统源码分享
数据集信息展示在本研究中，我们使用了名为“plant detect”的数据集，以改进YOLOv8的植物检测系统。该数据集专注于植物的识别与分类，具有独特的结构和丰富的样本，为深度学习模型的训练提供了坚
阅读更多2024-09-24
lasticsearch实战应用操作指南
Elasticsearch是一个基于Lucene的开源搜索引擎，它提供分布式搜索和分析功能，能够存储和快速检索大量的结构化和非结构化数据。它通常与数据流处理工具（如Logstash、Kibana等）结
阅读更多2024-09-24