<address id="4ulqi"><span id="4ulqi"></span></address>

<td id="4ulqi"></td>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時(shí)！

請點(diǎn)擊重新獲取二維碼

Python實(shí)現(xiàn)投影法分割圖像示例(二)

發(fā)布時(shí)間：2020-10-26 03:11:23 來源：腳本之家閱讀：383 作者：TIME_LEAF 欄目：開發(fā)技術(shù)

在上篇博客中，我們已經(jīng)實(shí)現(xiàn)了水平投影和垂直投影圖的繪制。接下來，我們可以根據(jù)獲得的投影數(shù)據(jù)進(jìn)行圖像的分割，該法用于文本分割較多，所以此處依然以上次的圖為例。

先把上次的兩幅圖搬過來，方便講解。

Python實(shí)現(xiàn)投影法分割圖像示例(二)

上面兩圖分別從垂直和水平方向描述了圖像中文本的分布。我們想象一下，將兩幅圖重疊起來（當(dāng)然這里比例要調(diào)整下），那么我們就能得到四個(gè)重疊的白塊，而這些白塊所處的位置正是原圖中文本的位置。所以接下來的任務(wù)就是，找出這些白塊的坐標(biāo)，此處白塊近似矩形，所以我們要求矩形的四個(gè)坐標(biāo)。

下面看代碼。

#根據(jù)水平投影值選定行分割點(diǎn)
inline = 1
start = 0
j = 0
for i in range(0,height):
  if inline == 1 and z[i] >= 150 : #從空白區(qū)進(jìn)入文字區(qū)
    start = i #記錄起始行分割點(diǎn)
    print i
    inline = 0
  elif (i - start > 3) and z[i] < 150 and inline == 0 : #從文字區(qū)進(jìn)入空白區(qū)
    inline = 1
    hfg[j][0] = start - 2 #保存行分割位置
    hfg[j][1] = i + 2
    j = j + 1

確定行分割點(diǎn)的原理就是判斷每一行的像素點(diǎn)數(shù)是否足夠。我們可以從水平投影圖中看出，白塊是有文字的地方（原圖是黑字白底，只是畫投影圖時(shí)選用白塊黑底），即前面幾行，灰度值為0的點(diǎn)的個(gè)數(shù)N很少，所以當(dāng)遇到文字區(qū)時(shí)，N會很大，根據(jù)這一點(diǎn)，我們確定進(jìn)入文字區(qū)的坐標(biāo)（A1，B1）。然后，當(dāng)從文字區(qū)出來時(shí)，N又變的很小，我們再記下它的坐標(biāo)（A1，B2）。同理，我們可以確定列分割點(diǎn)。

  incol = 1
  start1 = 0
  j1 = 0
  z1 = hfg[p][0]
  z2 = hfg[p][1]
  for i1 in range(0,width):
    if incol == 1 and v[i1] >= 20 : #從空白區(qū)進(jìn)入文字區(qū)
      start1 = i1 #記錄起始列分割點(diǎn)
      incol = 0
    elif (i1 - start1 > 3) and v[i1] < 20 and incol == 0 : #從文字區(qū)進(jìn)入空白區(qū)
      incol = 1
      lfg[j1][0] = start1 - 2  #保存列分割位置
      lfg[j1][1] = i1 + 2
      l1 = start1 - 2
      l2 = i1 + 2
      j1 = j1 + 1

最后根據(jù)矩形的坐標(biāo)將文本在圖中框出來。附上完整代碼。

import cv2
import numpy
img = cv2.imread('D:/0.jpg',cv2.COLOR_BGR2GRAY)
height, width = img.shape[:2]
#print height, width
#resized = cv2.resize(img, (2*width,2*height), interpolation=cv2.INTER_CUBIC)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
(_, thresh) = cv2.threshold(gray, 140, 255, cv2.THRESH_BINARY) 
#使文字增長成塊
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (2, 2))#形態(tài)學(xué)處理，定義矩形結(jié)構(gòu)
closed = cv2.erode(thresh, None, iterations = 7)
#cv2.imshow('erode',closed)
height, width = closed.shape[:2]
#print height, width
z = [0]*height
v = [0]*width
hfg = [[0 for col in range(2)] for row in range(height)]
lfg = [[0 for col in range(2)] for row in range(width)]
box = [0,0,0,0]
#水平投影
a = 0
emptyImage1 = numpy.zeros((height, width, 3), numpy.uint8) 
for y in range(0, height):
  for x in range(0, width):
    cp = closed[y,x]
    #if np.any(closed[y,x]):
    if cp == 0:
      a = a + 1
    else :
      continue
  z[y] = a
  #print z[y]
  a = 0
#根據(jù)水平投影值選定行分割點(diǎn)
inline = 1
start = 0
j = 0
for i in range(0,height):
  if inline == 1 and z[i] >= 150 : #從空白區(qū)進(jìn)入文字區(qū)
    start = i #記錄起始行分割點(diǎn)
    #print i
    inline = 0
  elif (i - start > 3) and z[i] < 150 and inline == 0 : #從文字區(qū)進(jìn)入空白區(qū)
    inline = 1
    hfg[j][0] = start - 2 #保存行分割位置
    hfg[j][1] = i + 2
    j = j + 1
 
#對每一行垂直投影、分割
a = 0
for p in range(0, j):
  for x in range(0, width):
    for y in range(hfg[p][0], hfg[p][1]):
      cp1 = closed[y,x]
      if cp1 == 0:
        a = a + 1
      else :
        continue
    v[x] = a #保存每一列像素值
    a = 0
  #print width
  #垂直分割點(diǎn)
  incol = 1
  start1 = 0
  j1 = 0
  z1 = hfg[p][0]
  z2 = hfg[p][1]
  for i1 in range(0,width):
    if incol == 1 and v[i1] >= 20 : #從空白區(qū)進(jìn)入文字區(qū)
      start1 = i1 #記錄起始列分割點(diǎn)
      incol = 0
    elif (i1 - start1 > 3) and v[i1] < 20 and incol == 0 : #從文字區(qū)進(jìn)入空白區(qū)
      incol = 1
      lfg[j1][0] = start1 - 2  #保存列分割位置
      lfg[j1][1] = i1 + 2
      l1 = start1 - 2
      l2 = i1 + 2
      j1 = j1 + 1
      cv2.rectangle(img, (l1, z1), (l2, z2), (255,0,0), 2)      
cv2.imshow('result', img)
cv2.waitKey(0)

代碼中注釋掉的一些代碼，有的是我做的一些小變動，有的是觀察中間值。大家可自行查看。

最后放上結(jié)果圖。

Python實(shí)現(xiàn)投影法分割圖像示例(二)

由于文本的坐標(biāo)已經(jīng)有了，還可以把這些文本塊截取下來，用一下PIL或者OPENCV就好了，此處就不做了。

以上這篇Python實(shí)現(xiàn)投影法分割圖像示例(二)就是小編分享給大家的全部內(nèi)容了，希望能給大家一個(gè)參考，也希望大家多多支持億速云。

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
vue中如何實(shí)現(xiàn)后臺管理系統(tǒng)的權(quán)限控制的方法示例
下一篇新聞：
javascript checkbox全選和反選的簡單實(shí)現(xiàn)

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機(jī)網(wǎng)站二維碼