您好,登錄后才能下訂單哦!
利用python怎么對csv文件中的空值進行處理?很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。
如下所示:
# -*- coding: UTF-8 -*- import jieba.posseg import tensorflow as tf import pandas as pd import csv import math """ 1.必須獲取CSV文件夾(ID:文本) 2.返回(ID:分詞后的文本) """ flags = tf.app.flags flags.DEFINE_string("train_file_address","D:/NLPWORD/cut_word_test/hzytest.csv","添加訓練數(shù)據(jù)文件") flags.DEFINE_string("result_file_address","D:/NLPWORD/cut_word_test/hzytest_result.csv","生成結(jié)果數(shù)據(jù)文件") FLAGS = tf.app.flags.FLAGS def cut_word(train_data): """ 把數(shù)據(jù)按照行進行遍歷,然后把結(jié)果按照行寫在csv中 :return:分詞結(jié)果list """ jieba.load_userdict("newdict.txt") with open(FLAGS.result_file_address, "w", encoding='utf8') as csvfile: writer = csv.writer(csvfile) for row in train_data.index: datas = train_data.loc[row].values[1] if isinstance(datas,str) or not math.isnan(datas): words = jieba.posseg.cut(datas) line = '' for word in words: line = line + word.word + " " writer.writerow([train_data.loc[row].values[0], line]) def main(_): data = pd.read_csv(FLAGS.train_file_address) cut_word(data) if __name__ == "__main__": tf.app.run(main)
看完上述內(nèi)容是否對您有幫助呢?如果還想對相關(guān)知識有進一步的了解或閱讀更多相關(guān)文章,請關(guān)注億速云行業(yè)資訊頻道,感謝您對億速云的支持。
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。