溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

MySQL如何快速導(dǎo)入數(shù)據(jù)

發(fā)布時(shí)間:2020-09-02 02:41:53 來源:腳本之家 閱讀:291 作者:MySQL技術(shù) 欄目:開發(fā)技術(shù)

前言:

日常學(xué)習(xí)和工作中,經(jīng)常會遇到導(dǎo)數(shù)據(jù)的需求。比如數(shù)據(jù)遷移、數(shù)據(jù)恢復(fù)、新建從庫等,這些操作可能都會涉及大量數(shù)據(jù)的導(dǎo)入。有時(shí)候?qū)脒M(jìn)度慢,電腦風(fēng)扇狂轉(zhuǎn)真的很讓人崩潰,其實(shí)有些小技巧是可以讓導(dǎo)入更快速的,本篇文章筆者會談一談如何快速的導(dǎo)入數(shù)據(jù)。

注:本篇文章只討論如何快速導(dǎo)入由邏輯備份產(chǎn)生的SQL腳本,其他文件形式暫不討論。

1.盡量減小導(dǎo)入文件大小

首先給個(gè)建議,導(dǎo)出導(dǎo)入數(shù)據(jù)盡量使用MySQL自帶的命令行工具,不要使用Navicat、workbench等圖形化工具。特別是大數(shù)據(jù)量的時(shí)候,用MySQL自帶的命令行工具導(dǎo)出和導(dǎo)入比用Navicat等圖形化工具要快數(shù)倍,而且用Navicat等圖形化工具做大數(shù)據(jù)量的操作時(shí)很容易卡死。下面簡單介紹下怎么用MySQL自帶的命令行工具做導(dǎo)入導(dǎo)出。

# 導(dǎo)出整個(gè)實(shí)例
mysqldump -uroot -pxxxxxx --all-databases > all_database.sql

# 導(dǎo)出指定庫
mysqldump -uroot -pxxxxxx --databases testdb > testdb.sql

# 導(dǎo)出指定表
mysqldump -uroot -pxxxxxx testdb test_tb > test_tb.sql

# 導(dǎo)入指定SQL文件 (指定導(dǎo)入testdb庫中)
mysql -uroot -pxxxxxx testdb < testdb.sql

導(dǎo)入的SQL腳本內(nèi)容大多是先建庫建表,然后插入數(shù)據(jù),其中耗時(shí)最長的應(yīng)該是insert插入數(shù)據(jù)了。為了減小文件大小,推薦使用擴(kuò)展插入方法,即多行一起批量insert,類似這樣:insert into table_name values (),(),(),...,(); 。使用擴(kuò)展插入比一條條插入,文件大小要小很多,插入速度要快好幾倍。使用mysqldump導(dǎo)出的文件默認(rèn)是使用批量插入的方法,導(dǎo)出時(shí)可使用--skip-extended-insert 參數(shù)改為逐條插入。下面以一張一千萬的數(shù)據(jù)表為例,測試下不同方式導(dǎo)出的文件插入時(shí)的速度。

MySQL如何快速導(dǎo)入數(shù)據(jù)

上圖可以看出,使用擴(kuò)展插入的SQL腳本導(dǎo)入大概需要10分鐘左右,而一條條插入的SQL腳本導(dǎo)入時(shí)間過長,大概1個(gè)小時(shí)仍然沒有導(dǎo)完,一個(gè)2個(gè)多G的文本導(dǎo)入一個(gè)多小時(shí)仍未結(jié)束,等不及的筆者就手動取消了? 不過還是可以看出多條一起insert比一條條插入數(shù)據(jù)要節(jié)省數(shù)倍的時(shí)間。

2.嘗試修改參數(shù)加快導(dǎo)入速度

在MySQL中,有一對大名鼎鼎的“雙一”參數(shù),即 innodb_flush_log_at_trx_commit 與 sync_binlog 。為了安全性這兩個(gè)參數(shù)默認(rèn)值為1,為了快速導(dǎo)入腳本,我們可以臨時(shí)修改下這兩個(gè)參數(shù),下面簡單介紹下這兩個(gè)參數(shù):

innodb_flush_log_at_trx_commit默認(rèn)值為1,可設(shè)置為0、1、2

如果innodb_flush_log_at_trx_commit設(shè)置為0,log buffer將每秒一次地寫入log file中,并且log file的flush(刷到磁盤)操作同時(shí)進(jìn)行.該模式下,在事務(wù)提交的時(shí)候,不會主動觸發(fā)寫入磁盤的操作。
如果innodb_flush_log_at_trx_commit設(shè)置為1,每次事務(wù)提交時(shí)MySQL都會把log buffer的數(shù)據(jù)寫入log file,并且flush(刷到磁盤)中去.
如果innodb_flush_log_at_trx_commit設(shè)置為2,每次事務(wù)提交時(shí)MySQL都會把log buffer的數(shù)據(jù)寫入log file.但是flush(刷到磁盤)操作并不會同時(shí)進(jìn)行。該模式下,MySQL會每秒執(zhí)行一次 flush(刷到磁盤)操作。

sync_binlog默認(rèn)值為1,可設(shè)置為[0,N)
當(dāng)sync_binlog =0,像操作系統(tǒng)刷其他文件的機(jī)制一樣,MySQL不會同步到磁盤中去而是依賴操作系統(tǒng)來刷新binary log。
當(dāng)sync_binlog =N (N>0) ,MySQL 在每寫 N次 二進(jìn)制日志binary log時(shí),會使用fdatasync()函數(shù)將它的寫二進(jìn)制日志binary log同步到磁盤中去。

這兩個(gè)參數(shù)可以在線修改,若想快速導(dǎo)入,可以按照下面步驟來操作:

# 1.進(jìn)入MySQL命令行 臨時(shí)修改這兩個(gè)參數(shù)
set global innodb_flush_log_at_trx_commit = 2;
set global sync_binlog = 2000;

# 2.執(zhí)行SQL腳本導(dǎo)入
mysql -uroot -pxxxxxx testdb < testdb.sql

# 3.導(dǎo)入完成 再把參數(shù)改回來
set global innodb_flush_log_at_trx_commit = 1;
set global sync_binlog = 1;

還有另外一種場景是你的需求是新建從庫,或者是不需要產(chǎn)生binlog,這時(shí)候?qū)隨QL腳本時(shí)可以設(shè)置暫時(shí)不記錄binlog,可以在腳本開頭增加 set sql_log_bin=0; 然后再執(zhí)行導(dǎo)入,這樣速度會進(jìn)一步加快。如果你的MySQL實(shí)例沒有開啟binlog則不需要再執(zhí)行該語句了。

總結(jié):

本篇文章主要介紹快速導(dǎo)入數(shù)據(jù)的方法,可能還有其他方法快速導(dǎo)入數(shù)據(jù),比如load data或者寫程序多線程插入。本文中介紹的方法只適合手動導(dǎo)入SQL腳本,下面總結(jié)下本文中提到的方法。

  1. 使用MySQL自帶的命令行工具進(jìn)行導(dǎo)出導(dǎo)入。
  2. 使用擴(kuò)展插入方法,一個(gè)insert對于多個(gè)值。
  3. 臨時(shí)修改innodb_flush_log_at_trx_commit和sync_binlog參數(shù)。
  4. 關(guān)閉binlog或者臨時(shí)不記錄binlog。

其實(shí)還有一些其他方案,比如先不創(chuàng)建索引,插入數(shù)據(jù)后再執(zhí)行添加索引操作;或者先將表改為MyISAM或MEMORY引擎,導(dǎo)入完成后再改為InnoDB引擎。不過這兩種方法實(shí)施起來較為麻煩且不知效果如何。以上方法只是筆者依據(jù)個(gè)人經(jīng)驗(yàn)總結(jié)得出,可能不太全面,歡迎各位補(bǔ)充哦。

以上就是MySQL如何快速導(dǎo)入數(shù)據(jù)的詳細(xì)內(nèi)容,更多關(guān)于MySQL導(dǎo)入數(shù)據(jù)的資料請關(guān)注億速云其它相關(guān)文章!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI