MySQL 批量写入性能暴增 10 倍!资深工程师的 7 个狠招(附实战代码)

导语
“同事的批量写入脚本跑 2 小时,我的代码只需 12 分钟!” 本文揭秘京东、美团都在用的 MySQL 写入优化方案,文末送【批量写入压测脚本】,关注+转发抽奖送《MySQL 内核优化手册》!


痛点共鸣

"INSERT 语句写满 3 屏,跑批任务等到天荒地老?"
先看触目惊心的数据对比(真实压测):

优化前:10万条数据写入耗时 182 秒

优化后:同数据量仅需 9.7 秒


核心优化方案(附代码)

1. 一箭三雕:事务+批处理+参数调优(80% 场景适用)

java

// 错误示范:逐条提交
for (User user : userList) {
    stmt.executeUpdate("INSERT INTO users VALUES (...)");
}

// 正确姿势:批处理+事务
Connection conn = dataSource.getConnection();
conn.setAutoCommit(false); // 关闭自动提交
PreparedStatement ps = conn.prepareStatement("INSERT ...");

for (int i=0; i<100000; i++) {
    ps.setString(1, "name"+i);
    ps.addBatch();
    
    if (i % 5000 == 0) { // 每5000条提交一次
        ps.executeBatch();
        conn.commit(); 
        ps.clearBatch();
    }
}

参数调优

sql

innodb_buffer_pool_size = 80%内存  # 缓冲池
innodb_flush_log_at_trx_commit = 2 # 事务提交策略
bulk_insert_buffer_size = 256M     # 批量插入缓存

2. 核弹级提速:LOAD DATA INFILE(提速 10 倍+)

sql

-- 将CSV导入MySQL(秒级完成百万数据)
LOAD DATA INFILE '/tmp/users.csv' 
INTO TABLE users 
FIELDS TERMINATED BY ',' 
LINES TERMINATED BY '\n';

性能对比

方式

10万条耗时

100万条耗时

逐条INSERT

182s

1800s+

LOAD DATA

4.2s

38s


高阶技巧

3. 空间换时间:内存磁盘混合架构

sql

-- 使用内存临时表中转
CREATE TEMPORARY TABLE tmp_users (...) ENGINE=MEMORY;
-- 批量插入临时表
INSERT INTO tmp_users ...;
-- 一次性导入主表
INSERT INTO users SELECT * FROM tmp_users;

4. 并行写入黑科技(Python示例)

python

from concurrent.futures import ThreadPoolExecutor

def batch_insert(chunk):
    # 每个线程处理1万条数据
    with connection.cursor() as cursor:
        cursor.executemany(sql, chunk)

with ThreadPoolExecutor(max_workers=8) as executor:
    # 将10万数据拆分为10个chunk
    executor.map(batch_insert, [chunk1, chunk2,...])

避坑指南

  • 索引陷阱:写入前禁用非必要索引,完成后重建
    ALTER TABLE users DISABLE KEYS; ... ENABLE KEYS;
  • 日志深渊:关闭binlog(SET sql_log_bin=0)或使用ROW模式
  • 连接池误区:HikariCP 配置不当引发雪崩(附配置模板)

实战压测报告

使用 sysbench 对比不同方案的 TPS(Transactions/sec):

方案

TPS

资源消耗

逐条写入

62

CPU 8%

批量+事务

5400

CPU 31%

LOAD DATA

21000

CPU 68%



相关文章

推荐几个有深度的java项目

【文末获取】不同于世面上常见的商城,外卖系统,以下项目对netty,设计模式,系统架构设计等要求都比较高1.尼恩内部社群netty+zk千万级别im系统2.小傅哥知识星球netty网关抽奖系统3.鱼皮...

学Java真的没前途了吗?

学Java真的没前途了吗?Java真的凉了?转行还是硬刚?“培训班刚毕业没人要”、“投了3个月简历全挂”、“面到35岁HR直接劝退”...最近后台每天收到Java人的灵魂拷问:“现在学Java是不是4...

用考完试的旧书可以换盆栽?浙大学霸们的献爱心活动启动啦!

盆栽发烧友们注意!(敲黑板)几本不需要了的旧书,就可以换来心爱的小盆栽,各位真爱粉们能放过这么好的机会吗?NO WAY3月18日至19日,浙大第三届旧书换盆栽活动即将开展啦!第二届旧书换盆栽活动,让许...

回顾一下Redis吧!

1、Redis是什么?Redis(REmote DIctionary Server)是一个开源的高性能键值对存储数据库,也被称为数据结构服务器。它是一个内存中的数据存储系统,可以用作数据库、缓存和消息...

学习笔记:深入浅出redis

redisredis是当前最流行的非关系型数据库,很多场景都可以使用到redis,所以有了这篇文章的诞生为什么使用redis?在项目中,很多场景的并发量很大,如秒杀之类,若不使用redis缓存直接让其...

Spring Boot3 整合 Redis 实现库存扣减管理全解析

在当今竞争激烈的互联网大厂后端开发领域,高效且准确的库存管理系统对于电商、抽奖等各类业务场景至关重要。超卖现象一旦发生,不仅严重损害用户体验,还会对企业声誉造成负面影响。利用 Spring Boot3...