Python爬虫速成之路（6）：Selenium的使用

🕗 发布于 2024-07-21 04:58 python 爬虫 selenium

hello hello~ ，这里是绝命Coding——老白~💖💖 ，欢迎大家点赞🥳🥳关注💥💥收藏🌹🌹🌹

💥个人主页：绝命Coding-CSDN博客
💥 所属专栏：后端技术分享
这里将会不定期更新有关后端、前端的内容，希望大家多多点赞关注收藏💖

爬虫就三大种实现方式。第一种是获取网页源代码来获取数据，这种也只能在特定网站生效；第二种是直接get或者post提交数据，这种难度有时候会较大，因为接口往往有一些限制；第三种就是直接模拟浏览器点击操作，第三种就比较无脑，可以实现很多第一第二种实现不了，比如Boss海投工具等。本文介绍的就是Selenium的基本用法。

Python3中使用Selenium进行Web自动化测试是一种非常常见的方法。

#Python3中Selenium使用方法（连载）  https://www.toutiao.com/a6425040355548397825/
# Selenium 调用IEDriverServer打开IE浏览器 - 天高地阔的专栏 - CSDN博客  
#2018/2/*
#http://blog.csdn.net/jichuang123/article/details/53008581
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time

brower = webdriver.Ie()
url = 'https://hao.360.cn/?wd_xp1'
brower.get(url)
intput = brower.find_element_by_id('search-kw')
intput.send_keys('python')
intput.send_keys(Keys.ENTER)
time.sleep(3)
brower.quit()

知识点

1.新版本的写法（需要写Service，否则好像会报错）

from selenium import webdriver  
from selenium.webdriver.chrome.service import Service  
from selenium import webdriver  
from webdriver_manager.chrome import ChromeDriverManager

s = Service(path)      # path为chromedriver安装路径
bro = webdriver.Chrome(service=s)  
bro.get("https://www.shixiseng.com/")

2.chromedriver安装对应浏览器版本的方法（推荐这种方法安装驱动！可以避免版本不一致的问题）
（会安装在类似“C:\Users\czh\.wdm\drivers\chromedriver\win32\107.0.5304\chromedriver.exe”的文件夹下）

from webdriver_manager.chrome import ChromeDriverManager
# 下载驱动  
def downdriver():  
    driver = webdriver.Chrome(ChromeDriverManager().install())

3.根据classname找元素的方法
（1）class name有空格的写法

bro.find_element('css selector', "[class='tiktok-q9aj5z-PCommentText e1g2efjf6']")

（2）class name（点开头）

bro.find_element('css selector', ".qaq")

4.根据class的id找元素的方法
class id（#开头）

bro.find_element('css selector', "#qaq")

5.点击按钮写法

button = bro.find_element('css selector', ".qaq")
button.click()

6.如果找同个classname的多个元素，在find_element补个s即可（然后用for循环遍历）

bro.find_elements('css selector', ".qaq")

7.如果等待页面加载出某个元素再进行下一步操作，用try，封装函数如下

# 检查存在再进行数据的  
def check_find_elements(bro,by,value):  
    # 等待元素加载完毕  
    while (True):  
        try:  
            # 注意.是class name的意思  
            bro.find_element(by, value)  
            #print(value + "找到")  
            break  
        except Exception:  
            continue  
    return bro.find_elements(by, value)  
  
# 检查存在再进行数据的  
def check_find_element(bro,by,value):  
    # 等待元素加载完毕  
    while (True):  
        try:  
            # 注意.是class name的意思  
            bro.find_element(by, value)  
            #print(value + "找到")  
            break  
        except Exception:  
            continue  
    return bro.find_element(by, value)

现在就可以写成check_find_element(bro, "css selector","[class='nickname']")就会在元素加载完成后再进行下步操作

8.打开了新窗口后，想进入新窗口完成操作，结束后回到上个窗口

# 进入新窗口
cls = bro.window_handles  
bro.switch_to.window(cls[1])

# 这里应该进行新窗口的操作

# 关闭新窗口，回到旧窗口
bro.close()  
bro.switch_to.window(cls[0])

9.浏览器最小化，窗口缩小

bro.set_window_size(300, 300)  
bro.minimize_window()       # 最小化窗口，不影响

更多历史精彩文章（篇幅过多，不一一列出）：

（简历相关）

求职经验分享（1）：一份合格的简历应该如何写？-CSDN博客（推荐）

求职经验分享（2）：简历如何优化以及如何应对面试【后端篇】-CSDN博客

（项目亮点相关）

大厂面试官赞不绝口的后端技术亮点【后端项目亮点合集（1）：Redis篇】-CSDN博客

大厂面试官赞不绝口的后端技术亮点【后端项目亮点合集（2）】-CSDN博客
（八股文）
大厂面试官问我：Redis处理点赞，如果瞬时涌入大量用户点赞（千万级），应当如何进行处理？【后端八股文一：Redis点赞八股文合集】_java中redis如何实现点赞-CSDN博客

大厂面试官问我：布隆过滤器有不能扩容和删除的缺陷，有没有可以替代的数据结构呢？【后端八股文二：布隆过滤器八股文合集】_布隆过滤器不能扩容-CSDN博客

………

（算法篇）
大厂面试：算法考前必看汇总（全）_大厂面试算法题-CSDN博客

感兴趣的小伙伴可以给个三连~

原文地址：https://blog.csdn.net/qq_33445788/article/details/140579835

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【人工智能 | 机器学习 | 理论篇】模型评估与选择
下一篇：前端TS语法基础篇

论文《基于现实迷宫地形的电脑鼠设计》深度分析（二）——超声波环境感知算法
《基于现实迷宫地形的电脑鼠设计》是由吴润强、庹忠曜、刘文杰、项璟晨、孙科学等人于2023年发表的一篇优秀期刊论文。其针对现阶段电脑鼠计算量庞大且不适用于现实迷宫地形的问题，特基于超声波测距与传统迷宫算
阅读更多2024-11-18
笔记整理—linux驱动开发部分（13）块设备
整理一下学习的内容，个人观点可能存在错误。本章介绍了什么是块设备，对比了块设备与字符设备的区别，并说明块设备更适合驱动内存类设备的原因。
阅读更多2024-11-18
【Linux】进程状态，优先级，环境变量
进程状态，优先级，环境变量
阅读更多2024-11-18
【Spring】循环引用解决流程，只用一二级缓存？
循环依赖：循环依赖其实就是循环引用，也就是bean互相持有对方，最终形成闭环。比如A依赖于B，B依赖于A循环依赖在spring中是允许存在，spring框架依据三级缓存已经解决了大部分的循环依赖三级缓
阅读更多2024-11-18
Windows、Linux多系统共享蓝牙设备
不需要配对的其实非常不可靠，单独使用可能感受不到，当在很近的距离内使用多套无线鼠标或者无线话筒，就会发现相互干扰的现象，因为它们都是基于一个简单的标签或者信道来区分，而这种划分很容易重复。在网上查资料
阅读更多2024-11-18
自然语言处理技术之细粒度实体识别
细粒度实体识别是自然语言处理（NLP）领域中的一个重要研究方向，其目标是从文本中识别出更加具体和详细的实体类型。相比于传统的实体识别（NER），细粒度实体识别不仅关注常见的实体类别（如。
阅读更多2024-11-18
Linux 域通信
【代码】Linux 域通信。
阅读更多2024-11-18
正则表达式从入门到精通
正则表达式从入门到入土
阅读更多2024-11-18
linux alsa-lib snd_pcm_open函数源码分析（四)
alsa源码分析
阅读更多2024-11-18
算法日记 26-27day 贪心算法
贪心算法
阅读更多2024-11-18

Python爬虫速成之路（6）：Selenium的使用

知识点

相关文章