在python爬虫中xpath方式提取lxml.etree._ElementUnicodeResult转化为字符串str类型

🕗 发布于 2024-09-22 12:10 python 爬虫 xpath 数据类型转换

简单提取网页中的数据时发现的

当通过xpath方式提取出需要的数据的text文本后想要转为字符串，但出现lxml.etree._ElementUnicodeResult的数据类型不能序列化，在网上查找到很多说是编码问题Unicode编码然后解码什么的；有些是(导入的xml库而不是lmxl库)[https://blog.51cto.com/u_16213415/11531934]，后来在(一个博文)[https://www.cnblogs.com/biyeee/p/9429392.html]中,作者直接把数据转为浮点flaot型的数据，那么直接强制转换为string应该也是没问题的。

代码中可以看出

import requests

import json
from lxml import etree

# from jsonpath import jsonpath
url = ''   # 需要写入自己的url
headers = {
"user-agent":""   ##填写自己的浏览器代理
 }
ret = requests.get(url,headers=headers)

rel_html = etree.HTML(ret.text)
# print(ret.text)
# 选择合适的xpath条件
end = rel_html.xpath('//*[@id="userSkin"]/div[1]/div[2]/div[1]/div/div[2]/div[2]/ul/li[4]/a/div[1]/text()')
print(end)      
print(type(end[0]))
xml_str = str(end[0])
print(xml_str.replace(',',''))

在这里插入图片描述

xpath中的语法导致最终获取对象不同

一个是标签节点，一个是节点下的文本，导致最终结果的数据类型不同
在这里插入图片描述

原文地址：https://blog.csdn.net/weixin_43794311/article/details/142420407

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：网络安全：腾讯云智、绿盟、美团、联想的面经
下一篇：FFmpeg中结构释放小函数

如何将py文件打包成exe文件?---pyinstaller使用方法
是一个用于将 Python 应用程序打包成独立可执行文件的工具。它能够在不同的操作系统上运行，包括 Windows、Linux 和 macOS。通过将 Python 解释器和应用程序的所有依赖项打包在
阅读更多2024-09-23
网络光纤滑环的技术特点与品质把控
网络光纤滑环凭借其独特的技术特点和严格的品质把控，正在成为现代通信和工业设备中不可或缺的重要组件。随着技术的发展，网络光纤滑环的前景将更加广阔，必将在未来的智能设备中占据重要地位。网络光纤滑环的多通道
阅读更多2024-09-23
智能制造与工业互联网公益联播∣企企通副总经理杨华：AI的浪潮下，未来智慧供应链迭代方向
包括准确需求预测、采购流程自动化、库存优化、物流规划、风险管理、供应商管理、质量控制、智能决策支持等等，极大提升了企业运营效率，确保合规性，并推动行业创新。于供应链发展而言，人工智能的发展将加速企业供
阅读更多2024-09-23
Unity3d开发的C#编码规范
如果方法是修改一个成员变量的值，则方法名一般为：Set + 成员变量名，如SetName（设置名称）。一般来说，在一个开发团队开始一个项目以前都会制定一套编码规范，以便使大家的代码保持一致，所有人更容
阅读更多2024-09-23
【原创】java+springboot+mysql党员教育网系统设计与实现
使用java+springboot+mysql开发的党员教育网，系统包含管理员、用户角色，功能如下：管理员：登录系统；用户管理；文章类别管理；文章管理；留言管理；系统公告；修改个人信息；修改密码。用户
阅读更多2024-09-23
JS中的for...in和for...of有什么区别？
for...in和for...of在遍历数组、对象、字符串、Set、Map等数据结构时有什么区别？
阅读更多2024-09-23
基于Python+SQLServer实现（界面）书店销售管理管理子系统
PyCharm 是一种 Python IDE，带有一整套可以帮助用户在使用 Python 语言开发时提高其效率的工具，比如调试、语法高亮、Project 管理、代码跳转、智能提示、自动完成、单元测试、
阅读更多2024-09-23
C++学习笔记（37）
overwrite 0-如果环境不存在，增加新的环境变量，如果环境变量已存在，不替换其值；cout << "第" << ii << "
阅读更多2024-09-23
实时数据的处理一致性
实时数据的处理一致性如何保证？
阅读更多2024-09-23
大数据新视界 --大数据大厂之SaaS模式下的大数据应用：创新与变革
本文探讨了 SaaS 模式下大数据的应用，包括 SaaS 的定义及优势、为大数据带来的新机遇、大数据的创新应用及解决方案、成功案例、应用场景以及面临的挑战与应对。文章强调了 SaaS 模式在大数据处理
阅读更多2024-09-23

在python爬虫中xpath方式提取lxml.etree._ElementUnicodeResult转化为字符串str类型

简单提取网页中的数据时发现的

代码中可以看出

xpath中的语法导致最终获取对象不同

相关文章