溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

python將客戶數(shù)據(jù)一直保存的方法

發(fā)布時(shí)間:2020-08-28 09:24:30 來源:億速云 閱讀:157 作者:小新 欄目:編程語言

小編給大家分享一下python將客戶數(shù)據(jù)一直保存的方法,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!

python將客戶的數(shù)據(jù)一直保存的方法:1、使用【with open()】新建對(duì)象寫入數(shù)據(jù);2、使用pandas包保存,代碼為【import pandas as pd #導(dǎo)入pandas】。

python將客戶數(shù)據(jù)一直保存的方法

python將客戶的數(shù)據(jù)一直保存的方法:

一、open函數(shù)保存

使用with open()新建對(duì)象

寫入數(shù)據(jù)(這里使用的是爬取豆瓣讀書中一本書的豆瓣短評(píng)作為例子)

import requests
from lxml import etree
 
#發(fā)送Request請(qǐng)求
url = 'https://book.douban.com/subject/1054917/comments/'
head = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.94 Safari/537.36'}
 
#解析HTML
r = requests.get(url, headers=head)
s = etree.HTML(r.text)
comments = s.xpath('//div[@class="comment"]/p/text()')
#print(str(comments))#在寫代碼的時(shí)候可以將讀取的內(nèi)容打印一下
 
#保存數(shù)據(jù)open函數(shù)
with open('D:/PythonWorkSpace/TestData/pinglun.txt','w',encoding='utf-8') as f:#使用with open()新建對(duì)象f
    for i in comments:
        print(i)
        f.write(i+'\n')#寫入數(shù)據(jù),文件保存在上面指定的目錄,加\n為了換行更方便閱讀

這里指的注意的是: open函數(shù)的打開模式

參數(shù) 用法

  • r read只讀。若不存在文件會(huì)報(bào)錯(cuò)。

  • w write只寫。若不存在文件會(huì)自動(dòng)新建。

  • a apend附加到文件末尾。

  • rb, wb, ab 操作二進(jìn)制

  • r+ 讀寫模式打開

二、pandas包保存

說道Pandas不得不說一下與之相關(guān)的兩個(gè)數(shù)據(jù)分析工具包(注意:pandas 、numpy和matplotlib都需要事先安裝,詳細(xì)安裝可見之前的博文關(guān)于pip方式安裝包)

  • numpy: (Numerical Python的簡稱),是高性能科學(xué)計(jì)算和數(shù)據(jù)分析的基礎(chǔ)包

  • pandas:基于Numpy創(chuàng)建的Python包,含有使數(shù)據(jù)分析工作變得更加簡單的高級(jí)數(shù)據(jù)結(jié)構(gòu)和操作工具

  • matplotlib:是一個(gè)用于創(chuàng)建出版質(zhì)量圖表的繪圖包(主要是2D方面)

import pandas as pd #導(dǎo)入pandas
import numpy as np #導(dǎo)入numpy
import matplotlib.pypolt as plt #導(dǎo)入matplotlib  

接下來就演示pandas保存數(shù)據(jù)到CSV和Excel

#導(dǎo)入包
import pandas as pd
import numpy as np
 
df = pd.DataFrame(np.random.randn(10,4))#創(chuàng)建隨機(jī)值
 
#print(df.head(2))#查看數(shù)據(jù)框的頭部數(shù)據(jù),默認(rèn)不寫為前5行,小于5行時(shí)全部顯示;也可以自定義查看幾行
print(df.tail())##查看數(shù)據(jù)框的尾部數(shù)據(jù),默認(rèn)不寫為倒數(shù)5行,小于5行時(shí)全部顯示;也可以自定義查看倒數(shù)幾行
 
df.to_csv('D:/PythonWorkSpace/TestData/PandasNumpy.csv')#存儲(chǔ)到CSV中
#df.to_excel('D:/PythonWorkSpace/TestData/PandasNumpy.xlsx')#存儲(chǔ)到Excel中(需要提前導(dǎo)入庫 pip install openpyxl)
實(shí)例中保存豆瓣讀書的短評(píng)代碼如下:
import requests
from lxml import etree
 
#發(fā)送Request請(qǐng)求
url = 'https://book.douban.com/subject/1054917/comments/'
head = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.94 Safari/537.36'}
 
#解析HTML
r = requests.get(url, headers=head)
s = etree.HTML(r.text)
comments = s.xpath('//div[@class="comment"]/p/text()')
#print(str(comments))#在寫代碼的時(shí)候可以將讀取的內(nèi)容打印一下
 
'''
#保存數(shù)據(jù)open函數(shù)
with open('D:/PythonWorkSpace/TestData/pinglun.txt','w',encoding='utf-8') as f:#使用with open()新建對(duì)象f
    for i in comments:
        print(i)
        f.write(i+'\n')#寫入數(shù)據(jù),文件保存在上面指定的目錄,加\n為了換行更方便閱讀
'''
 
#保存數(shù)據(jù)pandas函數(shù)   到CSV 和Excel
import pandas as pd
df = pd.DataFrame(comments)
#print(df.head())#head()默認(rèn)為前5行
df.to_csv('D:/PythonWorkSpace/TestData/PandasNumpyCSV.csv')
#df.to_excel('D:/PythonWorkSpace/TestData/PandasNumpyEx.xlsx')

看完了這篇文章,相信你對(duì)python將客戶數(shù)據(jù)一直保存的方法有了一定的了解,想了解更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI