深度分页介绍及优化建议 @ Lin | 2025-02-21T14:21:26+08:00 | 3 分钟阅读 | 更新于 2025-02-21T14:21:26+08:00

深度分页问题及优化策略解析

定义：深度分页指在数据库查询中，当使用 LIMIT offset, size 且偏移量（offset）极大时，导致查询性能显著下降的现象。
核心问题：

原理：利用有序且连续的ID字段，直接定位数据范围，避免全量扫描。
示例：

SELECT * FROM t_order WHERE id > 100000 LIMIT 10;

适用场景：
• ID连续递增（如自增主键）。
• 支持“上一页/下一页”跳转，但不支持随机跳页。
限制：
• ID不连续时无法使用（如存在删除操作）。
• 仅适用于单一排序条件。

原理：通过子查询快速定位起始ID，减少无效数据扫描。
示例：

SELECT * FROM t_order 
WHERE id >= (SELECT id FROM t_order LIMIT 1000000,1) 
LIMIT 10;

优点：
• 减少主查询的扫描范围。
缺点：
• 子查询生成临时表，可能影响性能。
• 仅适用于ID正序排列的场景。
• 复杂过滤条件可能导致ID离散化失效。

原理：通过连接操作将过滤条件转移到索引层面，减少回表次数。
示例：

SELECT t1.* FROM t_order t1
INNER JOIN (SELECT id FROM t_order LIMIT 1000000,1) t2 
ON t1.id >= t2.id 
LIMIT 10;

优势：
• 比子查询更高效，避免临时表生成。
• 强制使用索引覆盖，减少回表。
适用场景：
• 主键有序且查询条件可映射到索引。

原理：通过索引直接返回查询列，避免回表。
示例：

-- 建立联合索引 (code, type, id)
SELECT id, code, type FROM t_order 
ORDER BY code LIMIT 1000000,10;

关键点：
• 索引需包含所有查询字段（如id, code, type）。
• 结果集过大时可能退化为全表扫描。
限制：
• 仅适用于特定列查询，无法覆盖所有业务场景。
• 需权衡索引维护成本与查询性能。

业务层限制：
• 禁止深度跳页（如仅允许查看前100页）。
• 使用滚动加载（无限滚动）替代传统分页。
游标分页（Cursor Pagination）：
• 基于最后一条记录的ID或时间戳分页，避免偏移量。
• 示例：WHERE id > last_id ORDER BY id LIMIT 10。
异步分页与缓存：
• 对高频查询结果缓存，缓解实时分页压力。
分库分表：
• 数据量极大时，通过水平分片减少单表数据量。

Lin 的 ❤️ 博客

记录一些 🌈 生活上，技术上的事

🛠️ 技术阵地： 深耕 Java 开发，目前向 AI 应用领域探索与拓展。这里主要记录我从后端架构到 AI 赋能的进阶之路、技术思考以及日常的 debug 血泪史。始终致力于写出优雅且没有 bug 的代码（尽量）。
🌈 生活侧写： 偶尔脱下极客的外衣，我也会在这里分享生活中的灵光一现。不管是好用的效率工具，还是周末的一场骑行，都是构成我真实生活的一部分。