您好,登錄后才能下訂單哦!
使用python怎么對(duì)文本進(jìn)行拆分?針對(duì)這個(gè)問(wèn)題,這篇文章詳細(xì)介紹了相對(duì)應(yīng)的分析和解答,希望可以幫助更多想解決這個(gè)問(wèn)題的小伙伴找到更簡(jiǎn)單易行的方法。
python的數(shù)據(jù)類(lèi)型:1. 數(shù)字類(lèi)型,包括int(整型)、long(長(zhǎng)整型)和float(浮點(diǎn)型)。2.字符串,分別是str類(lèi)型和unicode類(lèi)型。3.布爾型,Python布爾類(lèi)型也是用于邏輯運(yùn)算,有兩個(gè)值:True(真)和False(假)。4.列表,列表是Python中使用最頻繁的數(shù)據(jù)類(lèi)型,集合中可以放任何數(shù)據(jù)類(lèi)型。5. 元組,元組用”()”標(biāo)識(shí),內(nèi)部元素用逗號(hào)隔開(kāi)。6. 字典,字典是一種鍵值對(duì)的集合。7. 集合,集合是一個(gè)無(wú)序的、不重復(fù)的數(shù)據(jù)組合。
1、拆分和寫(xiě)入過(guò)程
首先創(chuàng)建一個(gè)用于存儲(chǔ)分割后的txt文件的目錄
修改分割數(shù)
運(yùn)行python文件,查看生成的txt文件。
2、實(shí)例
open_diff = open('data.txt', 'r') # 源文本文件 diff_line = open_diff.readlines() line_list = [] for line in diff_line: line_list.append(line) count = len(line_list) # 文件行數(shù) print('源文件數(shù)據(jù)行數(shù):',count) # 切分diff diff_match_split = [line_list[i:i+5000] for i in range(0,len(line_list),5000)]# 每個(gè)文件的數(shù)據(jù)行數(shù) # 將切分的寫(xiě)入多個(gè)txt中 for i,j in zip(range(0,int(count/5000+1)),range(0,int(count/5000+1))): # 寫(xiě)入txt,計(jì)算需要寫(xiě)入的文件數(shù) with open('./dataText/ImageData%d.txt'% j,'w+') as temp: for line in diff_match_split[i]: temp.write(line) print('拆分后文件的個(gè)數(shù):',i+1)
關(guān)于使用python怎么對(duì)文本進(jìn)行拆分問(wèn)題的解答就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,如果你還有很多疑惑沒(méi)有解開(kāi),可以關(guān)注億速云行業(yè)資訊頻道了解更多相關(guān)知識(shí)。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。