溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python如何生成字符視頻

發(fā)布時(shí)間:2022-02-21 19:43:09 來(lái)源:億速云 閱讀:177 作者:iii 欄目:開(kāi)發(fā)技術(shù)

本篇內(nèi)容介紹了“Python如何生成字符視頻”的有關(guān)知識(shí),在實(shí)際案例的操作過(guò)程中,不少人都會(huì)遇到這樣的困境,接下來(lái)就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!

一、前言

在之前也寫(xiě)過(guò)生成字符視頻的文章,但是使用的是命令行窗口輸出,效果不是很好,而且存在卡頓的情況。于是我打算直接生成一個(gè)mp4的字符視頻。大致思路和之前一樣:Python20行代碼實(shí)現(xiàn)視頻字符化。

二、OpenCV的操作圖像

我們先來(lái)看一些基本操作。首先我們需要安裝OpenCV,執(zhí)行下面語(yǔ)句:

pip install opencv-python

之后就可以使用了。

2.1、讀取和顯示

我們直接看代碼:

import cv2
# 讀取圖片
img = cv2.imread("1.jpg")
# 顯示圖片
cv2.imshow("img", img)
cv2.waitKey()
cv2.destroyAllWindows()

其中waitKey是等待輸入的函數(shù),因?yàn)閕mshow之后顯示一瞬間,所以我們需要調(diào)用它。而destroyAllWindows是釋放窗口。

2.2、灰度轉(zhuǎn)換

灰度轉(zhuǎn)換就是將圖片轉(zhuǎn)換成黑白圖片(灰色),這樣可以方便我們處理像素。代碼如下:

import cv2
img = cv2.imread("1.jpg")
# 灰度轉(zhuǎn)換
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

我們還可以直接以灰度形式讀入:

import cv2
# 以灰度形式讀入
img = cv2.imread("1.jpg", 0)

2.4、獲取圖片尺寸并修改尺寸

我們直接看代碼:

import cv2
img = cv2.imread("1.jpg", 0)
# 獲取圖片的高寬
h, w = img.shape
# 縮放圖片
res = cv2.resize(img, (w//2, h//2))

因?yàn)閕mg的shape屬性是一個(gè)元組,所以我們可以直接自動(dòng)拆包。

然后調(diào)用cv2.resize函數(shù),第一個(gè)參數(shù)傳入圖片,第二個(gè)參數(shù)傳入修改后的尺寸。

2.5、繪制文字

繪制文字我們需要調(diào)用cv2.putText函數(shù),代碼如下:

import cv2
img = cv2.imread('1.jpg')
# 繪制文字
cv2.putText(
    # 背繪制的圖片
    img, 
    # 要繪制的文字
    'Hello',
    # 文字左下角的坐標(biāo)
    (100, 500),
    # 字體
    cv2.FONT_HERSHEY_SIMPLEX,
    # 字體大小縮放
    20, 
    # 文字顏色
    (0, 0, 0),
    # 文字粗細(xì)
    10
)

我們只需要注意這些參數(shù)就好了。

2.6、讀取視頻

讀取視頻的操作一般是通用的,代碼如下:

import cv2
# 讀取視頻
cap = cv2.VideoCapture('1.mp4')
# 獲取視頻的幀率
fps = cap.get(cv2.CAP_PROP_FPS)
# 循環(huán)讀取圖片的每一幀
while True:
    # 讀取下一幀
    ret, frame = cap.read()
    if not ret:
        break
    else:
        pass
cap.release()

上面我們獲取的視頻的幀,在寫(xiě)入視頻的時(shí)候我們需要用到。

2.7、寫(xiě)入視頻

寫(xiě)入視頻的操作也是常規(guī)代碼:

import cv2
fourcc = cv2.VideoWriter_fourcc(*'mp4v')
writer = cv2.VideoWriter('11.mp4', fourcc, fps, (w, h))
# 寫(xiě)入視頻
writer.write(frame)
***
write.release()

有了這些知識(shí),我們就可以開(kāi)始下一步工作了。

三、像素映射成字符

對(duì)于只有一個(gè)通道的圖片,我們可以把它當(dāng)成一個(gè)矩形,這個(gè)矩形最小單位就是一個(gè)像素。而字符化的過(guò)程就是用字符替代像素點(diǎn)的過(guò)程。所以我們要遍歷圖像的每個(gè)像素點(diǎn),但是我們應(yīng)該用什么字符取代呢?

我們顏色有一個(gè)參照表,而opencv將這個(gè)參數(shù)表切割成256份,代表不同的程度,我們也可以做一個(gè)參照表,不過(guò)表中的內(nèi)容不是顏色,而是字符。

下面就是我們像素轉(zhuǎn)字符的代碼:

def pixel2char(pixel):
    char_list = "@#$%&erytuioplkszxcv=+---.     "
    index = int(pixel / 256 * len(char_list))
    return char_list[index]

這個(gè)字符表是可以自己定義的。

四、生成字符圖片

現(xiàn)在我們只需要將像素逐個(gè)轉(zhuǎn)換成字符就好了,代碼如下:

def get_char_img(img, scale=4, font_size=5):
    # 調(diào)整圖片大小
    h, w = img.shape
    re_im = cv2.resize(img, (w//scale, h//scale))
    # 創(chuàng)建一張圖片用來(lái)填充字符
    char_img = np.ones((h//scale*font_size, w//scale*font_size), dtype=np.uint8)*255
    font = cv2.FONT_HERSHEY_SIMPLEX
    # 遍歷圖片像素
    for y in range(0, re_im.shape[0]):
        for x in range(0, re_im.shape[1]):
            char_pixel = pixel2char(re_im[y][x])
            cv2.putText(char_img, char_pixel, (x*font_size, y*font_size), font, 0.5, (0, 0, 0))
    return char_img

這里我們使用了一個(gè)np.ones函數(shù),它的作用我們理解為生成一個(gè)黑色圖片。

生成的尺寸我們先除了scale,如何再乘font_size。scale是原圖的縮小程度,因?yàn)橄袼赜泻芏?,所以我們需要先把圖片縮小。而為了讓我們的字體顯示更清楚,我們需要把生成的字符圖片放大。

因此需要注意,雖然我們生成的圖片看起來(lái)單調(diào),但是當(dāng)font_size設(shè)置為5時(shí),得到的圖片已經(jīng)比較大了。因此當(dāng)你生成長(zhǎng)時(shí)間的視頻時(shí),會(huì)花費(fèi)比較多的時(shí)間,生成的視頻也比較大。

我們來(lái)測(cè)試一下上面的函數(shù):

import cv2
import numpy as np


def pixel2char(pixel):
    char_list = "@#$%&erytuioplkszxcv=+---.     "
    index = int(pixel / 256 * len(char_list))
    return char_list[index]


def get_char_img(img, scale=4, font_size=5):
    # 調(diào)整圖片大小
    h, w = img.shape
    re_im = cv2.resize(img, (w//scale, h//scale))
    # 創(chuàng)建一張圖片用來(lái)填充字符
    char_img = np.ones((h//scale*font_size, w//scale*font_size), dtype=np.uint8)*255
    font = cv2.FONT_HERSHEY_SIMPLEX
    # 遍歷圖片像素
    for y in range(0, re_im.shape[0]):
        for x in range(0, re_im.shape[1]):
            char_pixel = pixel2char(re_im[y][x])
            cv2.putText(char_img, char_pixel, (x*font_size, y*font_size), font, 0.5, (0, 0, 0))
    return char_img


if __name__ == '__main__':
    img = cv2.imread('dl.jpg', 0)
    res = get_char_img(img)
    cv2.imwrite('d.jpg', res)

五、生成字符視頻

有了上面的代碼,我們就可以對(duì)整個(gè)視頻進(jìn)行轉(zhuǎn)換了。將視頻轉(zhuǎn)換成字符視頻的代碼如下:

def generate(input_video, output_video):
    # 1、讀取視頻
    cap = cv2.VideoCapture(input_video)

    # 2、獲取視頻幀率
    fps = cap.get(cv2.CAP_PROP_FPS)

    # 讀取第一幀,獲取轉(zhuǎn)換成字符后的圖片的尺寸
    ret, frame = cap.read()
    char_img = get_char_img(cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY), 4)

    # 創(chuàng)建一個(gè)VideoWriter,用于保存視頻
    fourcc = cv2.VideoWriter_fourcc(*'mp4v')
    writer = cv2.VideoWriter(output_video, fourcc, fps, (char_img.shape[1], char_img.shape[0]))
    while ret:
        # 讀取視頻的當(dāng)前幀,如果沒(méi)有則跳出循環(huán)
        ret, frame = cap.read()
        if not ret:
            break
        # 將當(dāng)前幀轉(zhuǎn)換成字符圖
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        char_img = get_char_img(gray, 4)

        # 轉(zhuǎn)換成BGR模式,便于寫(xiě)入視頻
        char_img = cv2.cvtColor(char_img, cv2.COLOR_GRAY2BGR)
        writer.write(char_img)
    writer.release()

完整代碼如下:

import cv2
import numpy as np


def pixel2char(pixel):
    char_list = "@#$%&erytuioplkszxcv=+---.     "
    index = int(pixel / 256 * len(char_list))
    return char_list[index]


def get_char_img(img, scale=4, font_size=5):
    # 調(diào)整圖片大小
    h, w = img.shape
    re_im = cv2.resize(img, (w//scale, h//scale))
    # 創(chuàng)建一張圖片用來(lái)填充字符
    char_img = np.ones((h//scale*font_size, w//scale*font_size), dtype=np.uint8)*255
    font = cv2.FONT_HERSHEY_SIMPLEX
    # 遍歷圖片像素
    for y in range(0, re_im.shape[0]):
        for x in range(0, re_im.shape[1]):
            char_pixel = pixel2char(re_im[y][x])
            cv2.putText(char_img, char_pixel, (x*font_size, y*font_size), font, 0.5, (0, 0, 0))
    return char_img


def generate(input_video, output_video):
    # 1、讀取視頻
    cap = cv2.VideoCapture(input_video)

    # 2、獲取視頻幀率
    fps = cap.get(cv2.CAP_PROP_FPS)

    # 讀取第一幀,獲取轉(zhuǎn)換成字符后的圖片的尺寸
    ret, frame = cap.read()
    char_img = get_char_img(cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY), 4)

    # 創(chuàng)建一個(gè)VideoWriter,用于保存視頻
    fourcc = cv2.VideoWriter_fourcc(*'mp4v')
    writer = cv2.VideoWriter(output_video, fourcc, fps, (char_img.shape[1], char_img.shape[0]))
    while ret:
        # 讀取視頻的當(dāng)前幀,如果沒(méi)有則跳出循環(huán)
        ret, frame = cap.read()
        if not ret:
            break
        # 將當(dāng)前幀轉(zhuǎn)換成字符圖
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        char_img = get_char_img(gray, 4)

        # 轉(zhuǎn)換成BGR模式,便于寫(xiě)入視頻
        char_img = cv2.cvtColor(char_img, cv2.COLOR_GRAY2BGR)
        writer.write(char_img)
    writer.release()


if __name__ == '__main__':
    generate('in.mp4', 'out.mp4')

我們只需要修改generate的參數(shù)就好了。

“Python如何生成字符視頻”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI