mysql-分页升级版，token

🕗 发布于 2024-07-24 22:03 数据库 oracle 服务器 mysql python

-数据库分页查询时，必须返回一个用于分页的token，这个token可以直接用于定位下一页的第一条数据。不能简单的使用limit offset的偏移量作为page token，在数据量大时无法降低查询时间复杂度。

简介

这个观点的核心在于提高大数据集分页查询的效率。当数据量非常大时，使用 LIMIT 和 OFFSET 语句分页可能会导致性能问题，因为数据库需要跳过 OFFSET 指定数量的行来检索数据，这就意味着随着 OFFSET 的增加，查询效率会逐渐降低。

为了解决这个问题，可以使用基于游标（Cursor）或者称为 "Seek Method" 的分页方法。这种方法不是通过指定要跳过的记录数量来检索下一页，而是通过记录上一页最后一条记录的某个唯一键（通常是主键或者唯一索引），然后查询所有排序后的下一组记录。

这里是一个简单的示例，假设我们有一个 users 表，其中包含一个自增的 id 字段作为主键。

首先，我们需要一个 API，它不是接受一个页码，而是接受一个 last_seen_id（上一页最后一个用户的 ID）作为参数来获取下一页的数据。

代码

下面是一个示例代码，它使用 Flask 框架创建一个分页 API。为了简单起见，这个例子不包括数据库连接的细节：

from flask import Flask, request, jsonify

app = Flask(__name__)

# 假设我们有一个数据库查询函数
def query_db(query, args=(), one=False):
    # 这里应该是执行数据库查询的代码，比如使用 pymysql 或者 sqlalchemy
    # 这里只是为了示例，不提供具体实现
    pass

# 分页查询的API
@app.route('/users', methods=['GET'])
def get_users():
    # 设置默认每页数量和最大数量
    default_page_size = 10
    max_page_size = 100
    
    # 从请求中获取 last_seen_id 和每页数量参数
    last_seen_id = request.args.get('last_seen_id', None)
    page_size = int(request.args.get('page_size', default_page_size))
    
    # 限制page_size不能超过最大限制
    if page_size > max_page_size:
        page_size = max_page_size
    
    # 创建查询，使用 last_seen_id 定位下一页数据
    if last_seen_id:
        query = "SELECT * FROM users WHERE id > %s ORDER BY id ASC LIMIT %s"
        args = (last_seen_id, page_size)
    else:
        # 如果没有提供 last_seen_id，就返回第一页数据
        query = "SELECT * FROM users ORDER BY id ASC LIMIT %s"
        args = (page_size,)
    
    # 执行查询
    users = query_db(query, args)
    
    # 将查询结果转换为字典列表
    # 假设每个 user 是一个元组(id, name)
    users_list = [{'id': user[0], 'name': user[1]} for user in users]
    last_seen_id = users[-1][0] if users else None
    
    # 返回JSON响应
    return jsonify({
        'users': users_list,
        'last_seen_id': last_seen_id
    })

# 启动Flask应用
if __name__ == '__main__':
    app.run(debug=True)

使用这个 API，客户端可以通过指定 last_seen_id 参数来获取下一页的数据，例如 /users?last_seen_id=100&page_size=20 将获取 ID 大于 100 的下一页 20 条用户记录。

这种方法的优点是，无论你要获取的是第一页还是第一百万页，查询的效率都是一样的，因为数据库总是从上一页的最后一个 id 开始查找下一组记录，而不需要跳过任何行。这样可以大大提高查询的效率，尤其是在处理大型数据集时。

原文地址：https://blog.csdn.net/hebtu666/article/details/140629597

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：TS config
下一篇：算法学习笔记（Hello算法）—— 空间复杂度

linux线程cp模型，posix信号量，线程池，线程封装，单例模型，懒汉饿汉实现方式，自旋锁，读者写者模型
前面的同步，我们并没有一个很好的场景来模拟同步，只是简单的将有序的现象输出出来；现在我们来讲解一个比较合理且常见的模型——生产者消费者模型；
阅读更多2024-09-07
Qt/C++开源项目 TCP服务器调试助手（源码分享+发布链接下载）
该TCP服务器调试助手是用于测试和监控基于TCP协议的网络通信工具，能够帮助开发者便捷地进行网络通信调试。通过简洁的界面设计，用户可以轻松配置、管理TCP端口的连接，收发消息并进行数据监控分析。123
阅读更多2024-09-07
vue3整合antv x6实现图编辑器快速入门
例如：在上面节点基础上，我们有一个新的需求：给节点加上右键菜单。X6 支持使用 SVG、HTML 来渲染节点内容，在此基础上，我们还可以使用 React、Vue 组件来渲染节点，这样在开发过程中会非常
阅读更多2024-09-07
linux使用samba共享目录，其他虚拟机和windows都可以访问
linux使用samba共享目录，其他虚拟机和windows都可以访问
阅读更多2024-09-07
Linux系统编程实现ls -l | wc -l指令
由于该指令是通过管道的形式实现的，所以我们要使用系统函数pipe。ls -l |wc -l的作用就是统计当前目录有多少文件。由于父子间通过管道实现，所以存在读写阻塞问题，不用担心僵尸进程的产生，所以可
阅读更多2024-09-07
MySQL表操作及约束
MySQL表操作及约束
阅读更多2024-09-07
1.2CubeMAX创建FREERTOS入门示例
内核参数设置，用户根据自己的实际应用来裁剪定制。：相关宏的定义，可以自建一些常量在工程中使用。User Constants（用户常量）：定时器和信号量的创建。：用于查看堆使用情况。：任务与队列
阅读更多2024-09-07
YOLOv9改进策略【注意力机制篇】| PSA极化自我关注：实现高质量像素回归
本文记录的是基于PSA注意力模块的YOLOv9目标检测方法研究。PSA模块。本文将其应用到YOLOv9的检测任务中，使模型能够更好地捕捉图像中的细节信息，以实现目标检测任务中准确识别和定位。
阅读更多2024-09-07
爆改YOLOv8|利用yolov10的SCDown改进yolov8-下采样
yolov8改进，yolov10, 下采样SCDown, 即插即用
阅读更多2024-09-07
PDF样本图册转换为一个链接，随时打开无需印刷
想象一下，您手中有一本厚重的样本图册，里面包含了丰富多样的内容，如产品介绍、项目方案、学术论文等。在过去，您需要逐一翻阅、筛选，甚至为了便于查看，不得不将其印刷出来。如今，借助先进的数字化技术，还能实
阅读更多2024-09-07

mysql-分页升级版，token

简介

代码

相关文章