<th id="vtsiq"></th>

<big id="vtsiq"></big>

<mark id="vtsiq"></mark><th id="vtsiq"><delect id="vtsiq"><dfn id="vtsiq"></dfn></delect></th>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊(cè)×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

用戶(hù)登錄×

賬戶(hù)密碼登錄

請(qǐng)使用微信掃描上方二維碼

使用幫助

請(qǐng)求超時(shí)！

請(qǐng)點(diǎn)擊重新獲取二維碼

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

發(fā)布時(shí)間：2020-12-31 16:10:53 來(lái)源：億速云閱讀：175 作者：Leah 欄目：開(kāi)發(fā)技術(shù)

這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)?lái)有關(guān)kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)，文章內(nèi)容豐富且以專(zhuān)業(yè)的角度為大家分析和敘述，閱讀完這篇文章希望大家可以有所收獲。

kmp算法

kmp算法用于字符串的模式匹配，也就是找到模式字符串在目標(biāo)字符串的第一次出現(xiàn)的位置

比如

abababc

那么bab在其位置1處，bc在其位置5處

我們首先想到的最簡(jiǎn)單的辦法就是蠻力的一個(gè)字符一個(gè)字符的匹配，但那樣的時(shí)間復(fù)雜度會(huì)是O(m*n)

kmp算法保證了時(shí)間復(fù)雜度為O(m+n)

基本原理

舉個(gè)例子：

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

發(fā)現(xiàn)x與c不同后，進(jìn)行移動(dòng)

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

a與x不同，再次移動(dòng)

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

此時(shí)比較到了c與y，
于是下一步移動(dòng)成了下面這樣

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

這一次的移動(dòng)與前兩次的移動(dòng)不同，之前每次比較到上面長(zhǎng)字符串的字符位置后，直接把模式字符串的首字符與它對(duì)齊，這次并沒(méi)有，原因是這次移動(dòng)之前，y與c對(duì)齊，但是y前邊的ab是與自己的前綴ab一樣，于是ab并不用再比較，直接從第三個(gè)位置開(kāi)始比較，如圖：

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

所以說(shuō)kmp算法對(duì)于這種情況就直接使用當(dāng)前比較字符之前的最長(zhǎng)相同的前后綴，然后將前綴與上面的長(zhǎng)字符串對(duì)齊，繼續(xù)比

較后面的字符串。
這里kmp算法中的一個(gè)重要點(diǎn)就來(lái)了，如何找到模式字符串中每位字符之前的最長(zhǎng)相同前后綴呢
這里繼續(xù)用一個(gè)例子舉例：

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

下面的數(shù)字記錄以該字符為結(jié)尾的最長(zhǎng)前后綴相同子串的長(zhǎng)度，先初始化為0,并且第一個(gè)字符下的數(shù)字確認(rèn)為0
然后開(kāi)始比較：

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

a與b不同，那么b下的數(shù)字也為0同理a與c不同，c下的數(shù)字也為0，接下來(lái)a與a對(duì)齊，如下

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

此時(shí)a與a相同，那么a下面的數(shù)字為1，也就是第二排字符串中當(dāng)前比對(duì)的字符索引+1
接下來(lái)b與b相同，c與a不相同，那么此時(shí)上面的字符串不動(dòng)，下面的字符串移動(dòng)到當(dāng)前比對(duì)位置即c的前一位的下方的數(shù)字的位置，如圖：

移動(dòng)前

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

c的前一位是b，b下方的數(shù)字是0，所以將下面字符串的第0位與之前的比對(duì)位置對(duì)其，即：

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

當(dāng)前比對(duì)位置如箭頭所示，然后繼續(xù)向后比較，一直比到c與a：

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

此時(shí)c與a不相同，那么比較下面字符的前一個(gè)字符的下方數(shù)字的位置，如圖

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

也就是位置為2的地方與上面比對(duì)位置對(duì)齊：

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

此時(shí)c與c相同，整個(gè)字符串自比對(duì)完成：

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

此時(shí)可能會(huì)沒(méi)有理解為什么匹配不成功的時(shí)候要再比對(duì)其前一位字符下的數(shù)字的位置，那是因?yàn)檫@是要找到前一個(gè)字符位置下的最長(zhǎng)相同前綴中的最長(zhǎng)相同前綴，就舉剛才的例子：

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

此時(shí)a前邊是abcab，所以要找到abcab的最長(zhǎng)相同前綴，就是ab，這時(shí)

kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)

然后再移動(dòng)到ab與ab對(duì)其的位置繼續(xù)比較即可

時(shí)間復(fù)雜度

簡(jiǎn)單來(lái)講，找到模式字符串中每位字符之前的最長(zhǎng)相同前后綴的這個(gè)方法中，如果模式字符串的長(zhǎng)度為m，那么上面的字符串的指向是一直向前移動(dòng)的，下面字符串的整體也是一直向前移動(dòng)的，最終移動(dòng)的結(jié)果將會(huì)是長(zhǎng)度為2m，所以比較次數(shù)也是最大為2m，時(shí)間復(fù)雜度為O(m)

kmp算法中，運(yùn)用了找到模式字符串中每位字符之前的最長(zhǎng)相同前后綴的這個(gè)方法的結(jié)果，然后使用類(lèi)似的方法進(jìn)行比較和移動(dòng)，和上邊的解釋類(lèi)似，如果這個(gè)要匹配的字符串長(zhǎng)度為n，那最長(zhǎng)的移動(dòng)舉例也超不過(guò)2n，所以總的時(shí)間復(fù)雜度為O(m+n)

具體代碼

這里沒(méi)有進(jìn)行傳入?yún)?shù)的驗(yàn)證，使用時(shí)還要注意。

def same_start_end(s):
  """最長(zhǎng)前后綴相同的字符位數(shù)"""
  n = len(s) #整個(gè)字符串長(zhǎng)度
  j = 0 # 前綴匹配指向
  i = 1 # 后綴匹配指向
  result_list=[0]*n
  while i < n:
    if j == 0 and s[j] != s[i]: #　比較不相等并且此時(shí)比較的已經(jīng)是第一個(gè)字符了
      result_list[i] = 0  # 值為０
      i += 1 # 向后移動(dòng)
    elif s[j] != s[i] and j != 0: #比較不相等,將j值設(shè)置為ｊ前一位的result_list中的值，為了在之前匹配到的子串中找到最長(zhǎng)相同前后綴
      j = result_list[j-1]
    elif s[j] == s[i]:  #相等則繼續(xù)比較
      result_list[i] = j+1
      j = j+1
      i = i+1
  return result_list
def kmp(s,p):
  """kmp算法,s是字符串，p是模式字符串，返回值為匹配到的第一個(gè)字符串的第一個(gè)字符的索引，沒(méi)匹配到返回-1"""
  s_length = len(s)
  p_length = len(p)
  i = 0 # 指向s
  j = 0 # 指向p
  next = same_start_end(p)
  while i < s_length:
    if s[i] == p[j]: # 對(duì)應(yīng)字符相同
      i += 1
      j += 1
      if j >= p_length: # 完全匹配
        return i-p_length
    elif s[i] != p[j]: # 不相同
      if j == 0:  # 與模式比較的是模式的第一個(gè)字符
        i += 1
      else:    # 取模式當(dāng)前字符之前最長(zhǎng)相同前后綴的前綴的后一個(gè)字符繼續(xù)比較
        j = next[j]
  if i == s_length:  # 沒(méi)有找到完全匹配的子串
    return -1

上述就是小編為大家分享的kmp算法如何在python項(xiàng)目中實(shí)現(xiàn)了，如果剛好有類(lèi)似的疑惑，不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識(shí)，歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
Python中的區(qū)塊鏈怎么利用POS算法實(shí)現(xiàn)
下一篇新聞：
kNN算法如何在Python中實(shí)現(xiàn)

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專(zhuān)題活動(dòng)

幫助支持

關(guān)于我們

售后咨詢(xún)

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號(hào)

手機(jī)網(wǎng)站二維碼

<th id="ulbxe"></th>

<th id="ulbxe"></th>