猿人学 — 第1届第13题（解题思路附源码）

🕗 发布于 2024-10-10 21:53 网络爬虫 js逆向 python 猿人学

猿人学 — 第1届第13题（解题思路附源码）

发现在翻页过程中，只要中途有几秒的间隔，那么就会显示拉取数据失败，然后网页重新加载回到刚进来显示的第一页的情况
重新加载时，会发送一系列的请求，发现其中向地址https://match.yuanrenxue.cn/match/13发送一前一后两个请求，
在前一个请求中，发现响应头中有Set-Cookie，因此猜测若想访问各个页面则需要先访问这个请求获取sessionid
另外还发现，后一个请求中携带的Cookie中的yuanrenxue_cookie与前一个请求中携带的不一样，并且在目标页面访问过程中
携带的yuanrenxue_cookie和后一个请求中携带的是一样的
那么后面请求中的yuanrenxue_cookie是从哪里来的呢？这个Cookie值的改变发生在第一次向https//match.yuanrenxue.cn/match/13请求后，
但是在chrome中又没有看到这个请求的返回值，猜想是不是返回值在chrome中不支持显示，因此用Fildder抓包再看一看各个请求的具体情况，验证一下猜想
果然发现这个请求其实是有返回值的，我们把关键信息放入Console面板一输出再比对请求，发现这就是我们想要的yuanrenxue_cookie

源码如下

import re
import requests

# 创建会话并设置请求头和cookie
obj = requests.session()
obj.headers={
    'Referer':'https://match.yuanrenxue.cn/list',
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/129.0.0.0 Safari/537.36',
}
# 设置成自己的sessionid
obj.cookies.set('sessionid','k0tkqbv28g7ubtjyr1e5a3mjcyzz98uf')

# 获取更新后的yuanrenxue_cookie值
res = obj.get(url='https://match.yuanrenxue.cn/match/13')
cookie_list = eval(re.findall('\(.*\)',res.text)[0]).split('=')
obj.cookies.update(
    {cookie_list[0]:cookie_list[1]}
)
# 访问具体页面时一定要注意先更新请求头信息中的Referer
obj.headers.update({'Referer':'https://match.yuanrenxue.cn/match/13'})

# 向各个页面发送请求并获取数据
total_value = 0
for pid in range(1,6):
    res = obj.get(url=f'https://match.yuanrenxue.cn/api/match/13?page={pid}')
    data = res.json()['data']
    print(f"第{pid}页数据:{data}")
    for item in data:
        total_value += int(item['value'])

print(f"前5页数字总和:{total_value}")

运行结果
笔者为刚接触逆向的小白，若上面有错误、不合理和值得优化的地方，欢迎各位大佬批评指正！

原文地址：https://blog.csdn.net/Learner_HJ/article/details/142830898

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Cocos 2 使用 webview 嵌入页面，摄像头调用没权限问题
下一篇：每天认识一个新职业——网络安全工程师

第九章-algo挖矿
服务器场景操作系统 Linux服务器账号密码 root password ssh端口222。
阅读更多2024-10-11
【C++差分数组】3229. 使数组等于目标数组所需的最少操作次数|2066
给你两个长度相同的正整数数组 nums 和 target。在一次操作中，你可以选择 nums 的任何子数组，并将该子数组内的每个元素的值增加或减少 1。返回使 nums 数组变为 target 数组所
阅读更多2024-10-11
使用Qt Creator创建项目
如何使用Qt Creator创建项目?看完你将会彻底掌握!!!
阅读更多2024-10-11
Centos7安装RocketMQ[图文教程]
官网地址：https://rocketmq.apache.org/zh/‌RocketMQ是一个分布式消息中间件，具有高性能、高可靠、高实时和分布式等特点。‌ 它支持事务消息、顺序消息、批量消息、定时
阅读更多2024-10-11
java线程池详解
在Java中，线程池是一种重要的多线程处理方式，通过管理和复用线程，提高应用程序的性能和响应速度，减少线程创建和销毁的开销，避免线程数量过多导致系统负载过高的问题。本文将详细介绍Java线程池的概念、
阅读更多2024-10-11
机房建设及运维方案重构：迎接信息技术新时代的挑战
通过智能化的机房建设布局、先进的运维管理软件以及升级后的机房动力环境监控系统，我们能够确保机房设备的稳定运行和业务的连续性。同时，软件还应提供智能化的数据分析工具，如数据挖掘、关联分析等，帮助运维人员
阅读更多2024-10-11
SpringBoot开发部署（热部署+常规部署+Docker部署）
项目部署
阅读更多2024-10-11
服装生产管理：SpringBoot框架的设计与实现
对于不同的模块独立的分装起来，在传统测试的时候要进行数据的统一测试，完成对系统的概要设计详细解读资料、需要解决的问题，及操作的详细应用说明等内容来视作测试的突破口，对测试的对象进行逐一对照检查，并针对
阅读更多2024-10-11
集群搭建-nacos
配置ip地址和端口和数据库信息（和上一个文件ip一样）nginx反向代理 nginx-t测试格式。
阅读更多2024-10-11
精密夹治具加工：推动制造业升级的重要力量
在当今竞争激烈的制造业领域，精密夹治具加工正发挥着越来越重要的作用。它不仅是提高生产效率和产品质量的关键因素，更是推动制造业升级的重要力量。
阅读更多2024-10-11

猿人学 — 第1届第13题（解题思路附源码）

猿人学 — 第1届第13题（解题思路附源码）

相关文章