Python爬虫速成之路(3):下载图片
hello hello~ ,这里是绝命Coding——老白~💖💖 ,欢迎大家点赞🥳🥳关注💥💥收藏🌹🌹🌹
💥个人主页:绝命Coding-CSDN博客
💥 所属专栏:后端技术分享
这里将会不定期更新有关后端、前端的内容,希望大家多多点赞关注收藏💖
历史文章:
教程:使用Python下载网页中的图片
在本教程中,我们将学习如何使用Python来下载网页中的图片。使用Python进行网页图片下载可以非常方便,只需要几行代码即可完成任务。
首先,我们需要导入所需的Python库,即urllib.request
和os
。这两个库分别用于发起HTTP请求和处理文件目录。
接下来,我们需要指定想要下载的网页地址,可以是任何包含图片的网页。
然后,我们需要指定图片下载的保存路径,也就是imgPath
变量。你可以根据自己的需要修改保存路径。
在代码中,我们使用urllib.request.urlopen()
方法打开指定的网页,并使用.read().decode('utf-8')
方法对网页内容进行读取和解码。然后,我们使用正则表达式re.findall()
方法查找网页中的图片链接。
接着,我们使用os.mkdir()
方法创建图片保存的文件夹。
接下来,我们使用一个循环遍历所有的图片链接,并通过urllib.request.urlopen()
方法下载每张图片。如果下载成功,就将其保存到指定的文件夹中。
#Python3下载网页中的图片 - Lavi的专栏 - CSDN博客 http://blog.csdn.net/liuweiyuxiang/article/details/52750367
# 教程 利用Python实现从百度下载图片到本地磁盘 - 森语音 - 博客园 https://www.cnblogs.com/593213556wuyubao/p/4972305.html
import urllib.request
import os
import re
#暴走_百度图片搜索 http://image.baidu.com/search/index?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq=1513512946231_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&word=%E6%9A%B4%E8%B5%B0
url = r'http://image.baidu.com/search/index?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq=1513512946231_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&word=%E6%9A%B4%E8%B5%B0'
imgPath = r'F:\img'
imgHtml = urllib.request.urlopen(url).read().decode('utf-8')
# test html
# print(imgHtml)
urls = re.findall(r'"objURL":"(.*?)"', imgHtml)
if not os.path.isdir(imgPath):
os.mkdir(imgPath)
index = 1
for url in urls:
print("下载:", url)
# 未能正确获得网页 就进行异常处理
try:
res = urllib.request.urlopen(url)
if str(res.status) != '200':
print('未下载成功:', url)
continue
except Exception as e:
print('未下载成功:', url)
filename = os.path.join(imgPath, str(index) + '.jpg')
with open(filename, 'wb') as f:
f.write(res.read())
print('下载完成\n')
index += 1
print("下载结束,一共下载了 %s 张图片" % (index - 1))
其实下载图片的本质就是创建一个对应文件,然后将数据写入
import urllib.request
import os
#下面是想要下载图片的地址
url = r'https://bkimg.cdn.bcebos.com/pic/a2cc7cd98d1001e952722fb2ba0e7bec55e797c4?x-bce-process=image/watermark,image\_d2F0ZXIvYmFpa2UxNTA=,g\_7,xp\_5,yp\_5'
#imgPath = r'/home/JueMingCoding/视频' #Linux路径
imgPath = r'C:\\py'
if not os.path.isdir(imgPath): # 如果不存在这个目录,则创建这个目录
os.mkdir(imgPath)
# 未能正确获得网页 就进行异常处理
try:
res = urllib.request.urlopen(url)
if str(res.status) != '200': #状态不对
print('未下载成功:', url)
except Exception as e:
print('未下载成功:', url)
filename = os.path.join(imgPath, '暴走.jpg') #创建
with open(filename, 'wb') as f:
f.write(res.read()) #写入数据
print('下载完成\n')
使用requests(优化,简洁版)
import requests
import os
#下面是想要下载图片的地址
url = r'https://bkimg.cdn.bcebos.com/pic/a2cc7cd98d1001e952722fb2ba0e7bec55e3.下载图片797c4?x-bce-process=image/watermark,image\_d2F0ZXIvYmFpa2UxNTA=,g\_7,xp\_5,yp\_5'
#imgPath = r'/home/JueMing/视频' #Linux路径
imgPath = r'C:\\py'
if not os.path.isdir(imgPath): # 如果不存在这个目录,则创建这个目录
os.mkdir(imgPath)
# 未能正确获得网页 就进行异常处理
try:
res = requests.get(url)
if str(res.status) != '200': #状态不对
print('未下载成功:', url)
except Exception as e:
print('未下载成功:', url)
filename = os.path.join(imgPath, '暴走.jpg') #创建
with open(filename, 'wb') as f:
f.write(res.content) #写入数据
print('下载完成\n')
更多精彩内容请关注:绝命Coding
原文地址:https://blog.csdn.net/qq_33445788/article/details/140412384
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!