溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

數(shù)據(jù)庫(kù)中如何處理帶有引號(hào)文本限定符的CVS

發(fā)布時(shí)間:2021-11-09 09:40:00 來源:億速云 閱讀:195 作者:小新 欄目:關(guān)系型數(shù)據(jù)庫(kù)

這篇文章給大家分享的是有關(guān)數(shù)據(jù)庫(kù)中如何處理帶有引號(hào)文本限定符的CVS的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過來看看吧。

公司需要導(dǎo)入數(shù)據(jù)到MSSQLSERVER,但是對(duì)方給出的奇葩cvs文件是這樣的:

aa,bb,cc,dd,ee
1,"this 
is a",1,"this is a",1
2,"this is
" a",2,"this is a",2

普通的bcp處理會(huì)有悲催的錯(cuò)位,而且mssql個(gè)坑貨也不能像mysql自動(dòng)區(qū)分文本限定符的"
研究了一下,用這個(gè)方式處理:

1. 在DB里建立對(duì)應(yīng)的表

此處)折疊或打開

  1. /*generaate thebcp fmt file*/

  2. exec xp_cmdshell 'bcp test.dbo.table_1 format nul -t "," -c -x -f C:\test\table_1.xml  -U****  -P****  '

  3. go

3,修改xml,請(qǐng)注意高亮部分。 這個(gè)你們用ie來打開的話也可以明確的看到"
此外還有這些特殊字符,大家先備著,萬一哪天被不靠譜的豬隊(duì)友坑了還能用。
單引號(hào)是' 
雙引號(hào)是" 
&是&
>是>
<是&lt;
空格是&nbsp; 等

點(diǎn)擊(此處)折疊或打開

  1. <?xml version="1.0"?>

  2. <BCPFORMAT xmlns="http://schemas.microsoft.com/sqlserver/2004/bulkload/format" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">

  3.  <RECORD>

  4.   <FIELD ID="1" xsi:type="CharTerm" TERMINATOR=",&quot;" MAX_LENGTH="12"/>

  5.   <FIELD ID="2" xsi:type="CharTerm" TERMINATOR="&quot;," MAX_LENGTH="50" COLLATION="Chinese_PRC_CI_AS"/>

  6.   <FIELD ID="3" xsi:type="CharTerm" TERMINATOR=",&quot;" MAX_LENGTH="12"/>

  7.   <FIELD ID="4" xsi:type="CharTerm" TERMINATOR="&quot;," MAX_LENGTH="50" COLLATION="Chinese_PRC_CI_AS"/>

  8.   <FIELD ID="5" xsi:type="CharTerm" TERMINATOR="\r\n" MAX_LENGTH="12"/>

  9.  </RECORD>

  10.  <ROW>

  11.   <COLUMN SOURCE="1" NAME="aa" xsi:type="SQLINT"/>

  12.   <COLUMN SOURCE="2" NAME="bb" xsi:type="SQLVARYCHAR"/>

  13.   <COLUMN SOURCE="3" NAME="cc" xsi:type="SQLINT"/>

  14.   <COLUMN SOURCE="4" NAME="dd" xsi:type="SQLVARYCHAR"/>

  15.   <COLUMN SOURCE="5" NAME="ee" xsi:type="SQLINT"/>

  16.  </ROW>

  17. </BCPFORMAT>

然后再把cvs的首列的標(biāo)題去掉, 雖說微軟說可以通過firstrow來指定第一行,但我之前用了firstrow=2居然是從第二行開始的。
如果不去掉,會(huì)報(bào)錯(cuò),由于趕時(shí)間,報(bào)錯(cuò)測(cè)原因和具體原理暫時(shí)不考慮再去深入研究了,之后有時(shí)間慢慢測(cè)。

4. 從cvs里取值,這里我用了openrowset來做驗(yàn)證,其實(shí)這個(gè)時(shí)候也可以直接用bcp加指定 format file來進(jìn)行導(dǎo)入操作了。

點(diǎn)擊(此處)折疊或打開

  1. select * from

  2. openrowset(bulk 'C:\Booker\test.csv', --要讀取的文件路徑和名稱

  3.     formatfile='C:\Booker\Table_1.xml', --格式化文件的路徑和名稱

  4.      --fieldterminator='","',

  5.     firstrow = 1,--要載入的第一行

  6.     --lastrow  = 1000, --要載入的最后一行,此值必須大于firstrow

  7.     maxerrors = 100, --在加載失敗之前加載操作中最大的錯(cuò)誤數(shù)

  8.     --errorfile ='c:\wc_error1.txt', --存放錯(cuò)誤的文件

  9.     rows_per_batch = 10000 --每個(gè)批處理導(dǎo)入的行數(shù)

  10.     ) as t


你需要的結(jié)果有了
數(shù)據(jù)庫(kù)中如何處理帶有引號(hào)文本限定符的CVS
文本格式下就是這么個(gè)東東
aa          bb                                                 cc          dd                                                 ee
----------- -------------------------------------------------- ----------- -------------------------------------------------- -----------
1           this, 
is, a                                      1           this is a                                          1
2           this is
" a                                       2           this is a                                          2



感謝各位的閱讀!關(guān)于“數(shù)據(jù)庫(kù)中如何處理帶有引號(hào)文本限定符的CVS”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí),如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI