溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

如何使用python正則表達(dá)式模塊中的re.findall()函數(shù)

發(fā)布時(shí)間:2021-11-03 10:44:50 來(lái)源:億速云 閱讀:433 作者:iii 欄目:編程語(yǔ)言

本篇內(nèi)容主要講解“如何使用python正則表達(dá)式模塊中的re.findall()函數(shù)”,感興趣的朋友不妨來(lái)看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來(lái)帶大家學(xué)習(xí)“如何使用python正則表達(dá)式模塊中的re.findall()函數(shù)”吧!

首先,導(dǎo)入python正則表達(dá)式模塊“re”:

import re

假設(shè)有以下字符串:

test_string1= 'Python is Amazing!'

可將表達(dá)式r“^\w+”與字符串一并傳遞至“re.findall”,這將返回輸入字符串的開頭:

reregex_1 =re.findall(r"^\w+",test_string1) print(regex_1)
如何使用python正則表達(dá)式模塊中的re.findall()函數(shù)

在表達(dá)式r“^\w+”中,字符“^”對(duì)應(yīng)字符串開頭,而“\w+”查找字符串中的字母數(shù)字字符。

如果去掉“^”,會(huì)得到:

reregex_1 =re.findall(r"\w+",test_string1) print(regex_1)

如何使用python正則表達(dá)式模塊中的re.findall()函數(shù)

試提取另一個(gè)字符串示例的開頭:

test_string2= 'Java is Amazing!'

現(xiàn)在,應(yīng)用“re.findall()”查找該字符串的第一個(gè)單詞:

reregex_2 =re.findall(r"^\w+",test_string2) print(regex_2)
如何使用python正則表達(dá)式模塊中的re.findall()函數(shù)

接下來(lái),考慮一個(gè)更實(shí)際的場(chǎng)景。假設(shè)有一個(gè)YouTube視頻標(biāo)題列表和相應(yīng)的YouTube觀看次數(shù)。我們可能對(duì)分析視頻標(biāo)題的第一個(gè)單詞和相應(yīng)視頻觀看次數(shù)之間的關(guān)系感興趣。考慮以下標(biāo)題/觀看次數(shù)元組列表:

youtube_titles= [("How to Tell if We're Beating COVID-19", 2200000), ("ExtremeCloset Clean Out",326000), ("This is $1,000,000 inFood",8800000), ("How To Tell If Someone Truly Loves You ",2800000), ("How to Tell Real Gold from Fake", 2300000),("Extreme living room transformation ", 25000)]

可以通過(guò)以下方式找到每個(gè)標(biāo)題的第一個(gè)單詞:

for titlein youtube_titles:    print(re.findall(r"^\w+",title[0])[0])
如何使用python正則表達(dá)式模塊中的re.findall()函數(shù)

可以將這些值添加到列表中:

first_words= [] for title in youtube_titles:    first_words.append(re.findall(r"^\w+",title[0])[0]) print(first_words)

如何使用python正則表達(dá)式模塊中的re.findall()函數(shù)

還可以將觀看次數(shù)附加到列表中:

first_words= [] views = [] for title in youtube_titles:    first_words.append(re.findall(r"^\w+",title[0])[0])     views.append(title[1])
如何使用python正則表達(dá)式模塊中的re.findall()函數(shù)

然后,可以創(chuàng)建視頻首字值和視頻觀看次數(shù)的數(shù)據(jù)框:

importpandas as pd df = pd.DataFrame({'first_words': first_words, 'views':views}) print(df)
如何使用python正則表達(dá)式模塊中的re.findall()函數(shù)

之后可以對(duì)每個(gè)標(biāo)題首詞進(jìn)行分組,并計(jì)算每個(gè)標(biāo)題首詞的平均觀看次數(shù):

dfdf =df.groupby('first_words')['views'].mean() print(df)
如何使用python正則表達(dá)式模塊中的re.findall()函數(shù)

按降序方式對(duì)這些值進(jìn)行排序:

dfdf =df.groupby('first_words')['views'].mean().sort_values(ascending = False) print(df)
如何使用python正則表達(dá)式模塊中的re.findall()函數(shù)

假設(shè)這些結(jié)果來(lái)自一個(gè)足夠大的數(shù)據(jù)集(比如有數(shù)千個(gè)標(biāo)題和觀看次數(shù)),這種類型的分析可以幫助我們選擇最佳的YouTube視頻標(biāo)題。

到此,相信大家對(duì)“如何使用python正則表達(dá)式模塊中的re.findall()函數(shù)”有了更深的了解,不妨來(lái)實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI