数据库内存管理遇到的麻烦事儿，今天给一点解法

2023年02月07日21:48:13 科技 3176

oom是实例使用内存超过实例规格内存上限导致进程被kill，实例存在秒级的不可用。mysql的内存管理比较复杂，内存监控需要开启performance schema查询(默认关闭)，会带来额外的内存消耗和性能损失，在不开启performance schema情况下排查内存使用情况又比较困难。本文将基于tdsql-c（基于mysql5.7）总结一下在线上经常出现的一些oom的场景、排查手段及相应的优化方案。

一、mysql线上常见oom问题

1.1 表数量较多导致innodb数据字典内存占用多

查询命令：show engine innodb status; 如下，dictionary memory allocated 显示数据字典内存已经占用约8g了，这部分内存不包含在 buffer pool 总内存大小中。

数据字典内存占用和innodb表的数量，表定义，table_open_cache，并发连接数等因素有关。

可以看到数据字典表有20w+，索引有70w+，对于这种场景要解决oom风险，在不损失性能的前提下可以考虑升级内存规格。若能接受性能损失，可以降低innodb_buffer_pool_size或者table_open_cache来缓解内存开销。

1.2 大query带来内存上涨

若观察到实例内存抖动与业务流量增长一致，基本确定实例内存增长是用户连接内存开销导致。

通过performance schema来查看具体是哪一块内存占用过多：

通过show detail processlist(tdsql-c 自研功能)对单个连接占用内存情况进行查询：

server_memory_used: 该连接server层内存大小

innodb_memory_used: 该连接innodb层内存大小

pfs_memory_used: 该连接performance schema内存大小

os_memory_used: 从jemalloc层面上统计该连接内存大小

query_memory_used: 从jemalloc层面上统计当前query的内存大小

单个连接占用内存过多，可以采用开启线程池限制并发连接数，或者升级内存规格。对于insert多value占用过多内存可以在业务侧进行sql拆分。

1.3 业务sql使用了prepare statement缓存

prepare statement cache用来缓存语句解析后的执行计划，缓存的语句越多，每个session所占用的内存也就越多。以sysbench为例，sysbench 1.1 默认打开了ps，导致prepare_statement缓存占用内存过大触发oom。

升级内存规格可以缓解oom，若能接受少量性能损失可以不使用ps缓存(例如sysbench--db-ps-mode=disable关闭ps)，或者限制max_prepared_stmt_count大小。

1.4 业务连接数过多

小内存规格的实例出现过万的连接数，连接占用过多内存导致频繁oom，可以通过开启线程池进行限制。

1.5 net buffer过大导致实例频繁oom

如下有个实例的内存增长随负载的变化呈螺旋上升趋势：

开启performance schema后观察到是net::buffer的内存在持续上涨。

通过以下sql查询具体哪些连接占用了net::buffer的内存：

大量连接使用了16mb大小的net buffer内存，这里的具体原因是用户的sql比较大(大于max_packet_length，16mb)，对于长连接来说执行完query这16mb缓存不会立即释放，用作下一次query的connection buffer，用户使用了大量的长连接导致这部分内存增长很快。

升级实例内存规格、业务侧减小每个sql的大小或者降低连接数可以解决。

1.6 内核bug导致内存泄露引起oom

使用valgrind查看是否有内存泄漏：

1. 下载valgrind

2. 安装valgrind：1 ./configure 2 make 3 make install 4 valgrind -h

3. 使用valgrind拉起mysqld

4. 给实例加负载

5. shutdown实例，内存检查结果输出到valgrind_log中

6. valgrind_log最后会打印内存泄漏的总体情况，再去找各堆栈的情况

"definitely lost"：确认丢失。程序中存在内存泄露，应尽快修复。当程序结束时如果一块动态分配的内存没有被释放且通过程序内的指针变量均无法访问这块内存则会报这个错误。

"indirectly lost"：间接丢失。当使用了含有指针成员的类或结构时可能会报这个错误。这类错误无需直接修复，他们总是与"definitely lost"一起出现，只要修复"definitely lost"即可。

"possibly lost"：可能丢失。大多数情况下应视为与"definitely lost"一样需要尽快修复，除非你的程序让一个指针指向一块动态分配的内存（但不是这块内存起始地址），然后通过运算得到这块内存起始地址，再释放它。

二、tdsql-c简介

随着互联网的发展，各种业务数据快速膨胀，用户对数据库计算和存储能力的需求日益增长。在应对业务需求持续增长时，传统数据库的迭代和优化已经变得举步维艰，而分布式架构的优势则愈发明显。借助计算存储分离的架构，新硬件优势，物理复制特点，分布式系统优势，tdsql-c对比传统mysql具有高性能，低成本，大存储，主从复制延迟低，秒级扩缩容，极速回档，serverless化等优势。

前面讲了tdsql-c相对传统数据库的优势，接下来介绍tdsql-c在内存使用方面相对传统mysql在内存使用方面存在哪些弊端。

从下面的对比图可以看出，传统mysql的数据，逻辑日志，物理日志，元数据都是存在本地盘，主从管理各自的数据，通过逻辑日志进行主从同步。

tdsql-c分为计算层和存储层，本地不再存储任何数据，共享存储层数据，主从通过物理日志进行同步，存储层通过接受主库发送的物理日志进行回放生成数据及元数据，不再需要逻辑日志。架构的巨大改变带来了以下问题：

1. tdsql-c卸载了本地io, 不再保留redo log file，而是在内存中增加了一个可以覆盖写的日志发送缓存区，相对传统mysql会带来额外的内存开销。

2. tdsql-c增加了主备之间、计算节点和存储节点之间的通信节点管理，计算节点远程page io任务队列维护，相关监控信息采集，备机物理日志回放等也会带来相应的内存开销。

三、tdsql-c oom 优化

3.1 tdsql-c server端参数优化

我们在不影响数据库性能的前提下修改实例默认配置来降低内存占用(括号内为优化后的默认值)，主要包括以下参数的调整：

innodb_log_buffer_size: 用来设置缓存还未提交的事务的缓冲区的大小

innodb_ncdb_log_buffer_size：该参数对主库来说相当于innodb_log_file_size，对于备机来说相当于日志接受缓冲buffer

key_buffer_size：key_buffer主要用于缓存myisam index block，tdsql-c不支持myisam存储引擎

innodb_ncdb_wait_queue_size：开启异步组提交后，innodb_ncdb_wait_queue_size表明最少可以同时容纳的事务异步提交数量，超过后需要同步等待

innodb_ncdb_log_flush_events：唤醒等待log flush的event的个数

实验验证性能是否下降以及内存占用是否减少：

实例规格：2c4g 一主一从

测试场景：分别用1g和100g的数据量对应cpu bound和io bound场景进行sysbench读写性能测试

测试结论：在性能无显著变化的情况下，2c4g规格的实例实际内存占用减少了约200mb。

压测后观察实例的实际内存占用情况：

3.2 支持information_schema.detail_processlist快捷查询各连接数内存使用

进一步支持将show detail processlist的结果存储到information_schema.detail_processlist，便于以下查询:

按内存使用量排序查询出使用量top n的链接；

计算所有连接内存使用量的总大小；

其他查询类似聚合或者top类的字段；

3.3 支持innodb buffer pool冷热page数量查询，为用户推荐合理的innodb_buffer_pool

统计在一段时间内没被访问的page的数量，反映出来用户真正需要多大的buffer pool，便于自动缩容到用户需要用的 bp 上。

内核新增参数：innodb_hot_page_time，单位秒，表示一定时间内访问过的page都是热page。

新增命令：show coldpage status，表明在buffer pool中，在innodb_hot_page_time时间内没有被访问过的page数量。

用户可以根据业务情况设置innodb_hot_page_time计算出准确的热数据量，根据热数据设置合理的buffer pool size。

3.4 限制innodb_buffer_pool的最大使用率，降低oom的风险

实例启动后，innodb buffer pool随着使用率的增长，内存分配也逐渐增加，假如innodb buffer pool使用率未达到100%，但是实例存在oom的风险，通过设置

innodb_max_lru_pages_pct限制innodb buffer pool的实际使用率，避免innodb buffer pool内存进一步增加导致oom。

3.5 resize innodb buffer pool 性能优化，减小动态设置innodb buffer pool对业务的影响

对于有oom风险的实例可以通过动态调整innodb buffer pool大小进行规避。但是对大实例进行调整innodb buffer pool往往会造成性能抖动。

如下图所示分别是动态增大和减小innodb buffer pool的过程。增大buffer pool size的过程比较简单，对并发负载没有太大影响。减小buffer pool size的过程需要将回收区的page转移到非回收区，这个过程需要长时间持有buffer pool mutex，阻塞其他线程无法访问buffer pool。

tdsql-c对resize buffer pool回收page过程进行了性能优化，优化后仅需对回收区的page持有buffer pool mutex。

以下是bp在33g和22g之间每隔60s resize 一次，同时利用sysbench进行读写压测，持续观察qps变化情况。

根据结果可以看到优化后的性能抖动减小，性能下降维持时间缩短。大大减小了动态设置innodb buffer pool对业务的影响。

四、总结

内存溢出一直是软件开发的“老大难”问题，更何况数据库环境更加复杂，sql语法、数据类型、数据大小、并发数、mysql参数配置等这些因素都与内存有关。tdsql-c内核团队在tdsql-c的内存管理上进行一系列的优化，包括优化server端参数配置降低内存占用、丰富内存监控、增加buffer pool冷热page数查询方便用户设置更合理的buffer pool大小、在即将面临oom风险时限制innodb_buffer_pool的最大使用率避免内存用尽触发oom、优化动态调整buffer pool大小对并发业务的影响。后续我们也会持续进行优化，不断提升tdsql-c的稳定性和可用性，为用户带来更好的产品体验。

科技

小鹏G7配置解密：L2+智驾+8295芯片，23万级纯电市场要变天了？ - 天天要闻

小鹏G7配置解密：L2+智驾+8295芯片，23万级纯电市场要变天了？

官方数据显示，2025年6月份，小鹏汽车销量达到了34611辆，连续8个月销量稳定在3万辆以上，表现可以说相当抢眼。不过中国新能源市场竞争非常激烈，因此小鹏汽车需要推出更多有竞争力的车型。根据小鹏汽车官方消息，5座中型纯电SUV小鹏G7将会于7月3日正式上市，目前预售价为23.58万元，符合小鹏汽车的品牌定位。中型SUV是一个...

07月02日 1012

618旗舰机销量排名：华为第二名，小米第三名，苹果断层式领先 - 天天要闻

618旗舰机销量排名：华为第二名，小米第三名，苹果断层式领先

在今年618期间，国产手机销量迎来新一波大幅增长，不少品牌发布战报宣称创造纪录。有博主统计真实销量对发现，苹果iPhone16系列断崖式领先，华为和小米居第二三名，行业再次洗牌。博主智慧芯片案内人公布618期间主流旗舰机销量，统计时间为20

07月02日 1960

今日数据精选：AI眼镜热销偷拍咋办；互联网企业的利润也在下降啦 - 天天要闻

今日数据精选：AI眼镜热销偷拍咋办；互联网企业的利润也在下降啦

【宏观经济及政策】1—5月份规上互联网企业完成互联网业务收入7735亿元，利润下降2.2%7月1日，工信部发布数据，1—5月份，规模以上互联网和相关服务企业完成互联网业务收入7735亿元，同比增长0.9%。1—5月份，规模以上互联网企业实现

07月02日 1049

提前预定爆款，但没小米YU7那么夸张，试驾体验小鹏G7 - 天天要闻

提前预定爆款，但没小米YU7那么夸张，试驾体验小鹏G7

小米YU7上市发布之后，再一次颠覆了人们对于汽车行业的基本认知，短短3分钟的时间就有高达20万的下订量，这可是一台起步价25.35万元，顶配32.99万元的车啊，为什么给人一种买手机的即视感......

07月02日 1619

支付宝公积金查询小程序突然崩了，客服回应 - 天天要闻

支付宝公积金查询小程序突然崩了，客服回应

7月1日，一年一度的公积金结息来了。不少网友在查询了自己的利息收入后，纷纷晒图打卡。极目新闻记者在社交平台看到，一大早就有网友晒出了自己的结息情况，有的到账了几百元，也有网友收到了数千元。

07月02日 1840

用微信就能查社保和医保，简单又方便,全程只需要一分钟 - 天天要闻

用微信就能查社保和医保，简单又方便,全程只需要一分钟

用微信就能查社保和医保，简单又方便,全程只需要一分钟大家好，以前我们查社保卡，医保卡需要专门携带身份证跑一趟社保中心，就不定还要排长队，非常麻烦。那现在有了新版电子社保卡，我们用手机的微信就可以查到社保各种服务。

07月02日 1118

互联网大厂争当“AI张雪峰” 抢夺志愿填报10亿市场蛋糕 - 天天要闻

互联网大厂争当“AI张雪峰” 抢夺志愿填报10亿市场蛋糕

制图:杨存海(元宝AI)2025年，全国高考报名人数为1335万人，虽比2024年的峰值略有回落，但仍是近十年里的第二高位；而今年本科招生计划预计仍维持在490万左右。艾媒咨询最新报告显示，2025年中国高报市场付费规模预计达10.9亿元，超九成考生愿借助专业服务规划志愿。这，或许正是技术展现价值的关键时刻。必须承认的是，在志...

07月02日 2362

美国要强推可穿戴设备，但中国反而更领先！未来最值钱的资产来了！ - 天天要闻

美国要强推可穿戴设备，但中国反而更领先！未来最值钱的资产来了！

抓住风口本期要点：健康理念的变革，将造福每个人！你好，我是王煜全，这里是王煜全要闻评论。6月24日，美国新任卫生部长小罗伯特•肯尼迪（Robert F. Kennedy Jr.）在国会听证会上，宣布了一项雄心勃勃的政策提议：在未来四年内，通过史上最大规模广告宣传和激励措施，推动每一位美国公民佩戴可穿戴健康设备，这项计划将由...

07月02日 8387

Nothing 首款头戴式耳机 Headphone (1) 发布，复古透明设计 - 天天要闻

Nothing 首款头戴式耳机 Headphone (1) 发布，复古透明设计

IT之家 7 月 2 日消息，Nothing 首款头戴式耳机 —— Nothing Headphone (1) 今日正式发布。这款耳机延续了该品牌复古、透明的设计风格，摒弃了触控设计，采用了更复古的物理滚轮和按键控制。Nothing Headphone (1) 采用 CNC 铝制外壳，内部记忆泡沫耳垫可以贴合耳朵。硬件方面，Nothing 与音响品牌 KEF

07月02日 3974

Mate80延期发布！华为9月新招曝光，三折叠硬刚苹果17系列？ - 天天要闻

Mate80延期发布！华为9月新招曝光，三折叠硬刚苹果17系列？

苹果iPhone17系列要来了，华为Mate80却缺席，这一消息让不少等“华为正面硬刚苹果”的用户有点空落落的。但问题来了，华为真的会“错过”9月这波关键节点？真不打算跟苹果刚正面了？还真未必。

07月02日 1201