溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

使用python怎么對(duì)文本進(jìn)行拆分

發(fā)布時(shí)間:2021-04-23 17:23:02 來(lái)源:億速云 閱讀:2017 作者:Leah 欄目:編程語(yǔ)言

使用python怎么對(duì)文本進(jìn)行拆分?針對(duì)這個(gè)問(wèn)題,這篇文章詳細(xì)介紹了相對(duì)應(yīng)的分析和解答,希望可以幫助更多想解決這個(gè)問(wèn)題的小伙伴找到更簡(jiǎn)單易行的方法。

python的數(shù)據(jù)類(lèi)型有哪些?

python的數(shù)據(jù)類(lèi)型:1. 數(shù)字類(lèi)型,包括int(整型)、long(長(zhǎng)整型)和float(浮點(diǎn)型)。2.字符串,分別是str類(lèi)型和unicode類(lèi)型。3.布爾型,Python布爾類(lèi)型也是用于邏輯運(yùn)算,有兩個(gè)值:True(真)和False(假)。4.列表,列表是Python中使用最頻繁的數(shù)據(jù)類(lèi)型,集合中可以放任何數(shù)據(jù)類(lèi)型。5. 元組,元組用”()”標(biāo)識(shí),內(nèi)部元素用逗號(hào)隔開(kāi)。6. 字典,字典是一種鍵值對(duì)的集合。7. 集合,集合是一個(gè)無(wú)序的、不重復(fù)的數(shù)據(jù)組合。

1、拆分和寫(xiě)入過(guò)程

首先創(chuàng)建一個(gè)用于存儲(chǔ)分割后的txt文件的目錄

修改分割數(shù)

運(yùn)行python文件,查看生成的txt文件。

2、實(shí)例

open_diff = open('data.txt', 'r') # 源文本文件
diff_line = open_diff.readlines()
 
line_list = []
for line in diff_line:
    line_list.append(line)
 
count = len(line_list) # 文件行數(shù)
print('源文件數(shù)據(jù)行數(shù):',count)
# 切分diff
diff_match_split = [line_list[i:i+5000] for i in range(0,len(line_list),5000)]# 每個(gè)文件的數(shù)據(jù)行數(shù)
 
# 將切分的寫(xiě)入多個(gè)txt中
for i,j in zip(range(0,int(count/5000+1)),range(0,int(count/5000+1))): # 寫(xiě)入txt,計(jì)算需要寫(xiě)入的文件數(shù)
    with open('./dataText/ImageData%d.txt'% j,'w+') as temp:
        for line in diff_match_split[i]:
            temp.write(line)
print('拆分后文件的個(gè)數(shù):',i+1)

關(guān)于使用python怎么對(duì)文本進(jìn)行拆分問(wèn)題的解答就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,如果你還有很多疑惑沒(méi)有解開(kāi),可以關(guān)注億速云行業(yè)資訊頻道了解更多相關(guān)知識(shí)。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI