13号凌晨,公司线上项目出了一个问题,从00:17之后的数据就一直入表失败,早上到公司之后发现几千封报错邮件,根据报警邮件和错误日志,分析到问题和解决方案如下。
问题现象:
SQL执行时间超长,耗时几十秒才返回错误提示,后台日志中出现Lock wait timeout exceeded; try restarting transaction的错误
Laravel5框架记录的异常错误日志内容:
时间:2019-03-13 10:41:21
异常: Illuminate\Database\QueryException
错误码: [err_code: HY000] err_msg: SQLSTATE[HY000]: General error: 1205 Lock wait timeout exceeded; try restarting transaction
mysql> SELECT * FROM information_schema.INNODB_TRX\G
*************************** 1. row ***************************
trx_id: 27458213
trx_state: RUNNING
trx_started: 2019-03-13 00:17:18
trx_requested_lock_id: NULL
trx_wait_started: NULL
trx_weight: 120267
trx_mysql_thread_id: 9950436
trx_query: NULL
trx_operation_state: NULL
trx_tables_in_use: 0
trx_tables_locked: 0
trx_lock_structs: 1720
trx_lock_memory_bytes: 194088
trx_rows_locked: 83926
trx_rows_modified: 118547
trx_concurrency_tickets: 0
trx_isolation_level: READ COMMITTED
trx_unique_checks: 1
trx_foreign_key_checks: 1
trx_last_foreign_key_error: NULL
trx_adaptive_hash_latched: 0
trx_adaptive_hash_timeout: 10000
trx_is_read_only: 0
trx_autocommit_non_locking: 0
1 row in set (0.00 sec)
解决方案:
kill 9950436
注意:进程号是上面trx_mysql_thread_id的值
问题定位:
2019-03-13 10:41:21时候的报错信息,有一个MySQL事务从2019-03-13 00:17:18到当前时间一直是RUNNING状态,出现了死锁,导致正常的事务进程无法执行。
问题场景:
1、在同一事务内先后对同一条数据进行插入和更新操作;
2、多台服务器操作同一数据库;
3、瞬时出现高并发现象;
4、代码逻辑中,有未闭合的事务提交。
问题原因:
1、在高并发的情况下,Spring事物造成数据库死锁,后续操作超时抛出异常。
2、Mysql数据库采用InnoDB模式,默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s,一旦数据库锁超过这个时间就会报错
相关SQL命令:
正在执行的慢SQL记录线程
mysql> show processlist;
当前运行的所有事务
mysql> SELECT * FROM information_schema.INNODB_TRX;
当前出现的锁
mysql> SELECT * FROM information_schema.INNODB_LOCKs;
锁等待的对应关系
mysql> SELECT * FROM information_schema.INNODB_LOCK_waits;
旁门左道方案:
查看MySQL的autocommit配置:
mysql> select @@autocommit;
修改为自动提交:
mysql> set global autocommit=1;
这个方法个人不是很建议使用,事务的提交或者回滚还是要在业务代码中控制,最好不要设置自动提交。
参考文档:https://cloud.tencent.com/developer/article/1356959
本文为 陈华 原创,欢迎转载,但请注明出处:http://ichenhua.cn/read/10
- 上一篇:
- Laravel框架项目下的安全最大化