溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

PPOCRLabel標(biāo)注的txt格式怎么轉(zhuǎn)換成labelme能修改的json格式

發(fā)布時(shí)間:2023-03-25 14:03:19 來(lái)源:億速云 閱讀:143 作者:iii 欄目:開(kāi)發(fā)技術(shù)

這篇“PPOCRLabel標(biāo)注的txt格式怎么轉(zhuǎn)換成labelme能修改的json格式”文章的知識(shí)點(diǎn)大部分人都不太理解,所以小編給大家總結(jié)了以下內(nèi)容,內(nèi)容詳細(xì),步驟清晰,具有一定的借鑒價(jià)值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來(lái)看看這篇“PPOCRLabel標(biāo)注的txt格式怎么轉(zhuǎn)換成labelme能修改的json格式”文章吧。

    PPOCRLabel標(biāo)注的txt格式轉(zhuǎn)換成labelme能修改的json格式

    PPOCR是個(gè)好東西

    默認(rèn)的訓(xùn)練文件是用自帶的PPOCRLabel標(biāo)注的,有時(shí)候需要用labelme來(lái)修改一些東西,比如后期用到的字段提取,就需要加一個(gè)參數(shù),PPOCRLabel就沒(méi)法做了,只能轉(zhuǎn)成labelme,并利用group_id這個(gè)參數(shù)來(lái)賦值。

    所以寫(xiě)了下面這個(gè)腳本

    Label.txt每一行對(duì)應(yīng)一個(gè)圖片標(biāo)注,該腳本作用是將PPOCRLabel的標(biāo)注文件Label.txt轉(zhuǎn)換為一個(gè)一個(gè)的json文件

    并存儲(chǔ)至json1目錄下:

    # -*- coding:utf-8 -*-
    # 開(kāi)發(fā)人員 : csu·攀-_-||
    # 開(kāi)發(fā)時(shí)間 : 2021/9/7 0007 10:30
    # 文件名稱 : pplable2json.py
    # 開(kāi)發(fā)工具 : PyCharm
    # 功能描述 : PPOCRLabel標(biāo)注的txt格式轉(zhuǎn)換成labelme能修改的json格式
    
    import os
    import cv2
    import json
    import base64
    
    #轉(zhuǎn)base64
    def image_to_base64(image_np):
        image = cv2.imencode('.jpg', image_np)[1]
        image_code = str(base64.b64encode(image))[2:-1]
        return image_code
    
    def pp2json(path,savepath):
        with open(os.path.join(path,'Label.txt'),'r',encoding='utf-8') as f:
            for line in f.readlines():
                line = line.strip('\n')  # 去掉列表中每一個(gè)元素的換行符
                imgname = line.split('\t')[0].split('/')[1]
                img = cv2.imread(os.path.join(path,imgname))
                H,W,C = img.shape
                items = json.loads(line.split('\t')[1])
                item_shapes = []
                for item in items:
                    item_shapes.append({
                        "label":item['transcription'],
                        "points":item['points'],
                        "group_id": 0,
                        "shape_type": "polygon",
                        "flags": {}
                    })
                new_dict = {
                    "version": "4.5.9",
                    "flags": {},
                    "shapes": item_shapes,
                    "imagePath": imgname,
                    "imageData": image_to_base64(img),
                    "imageHeight": H,
                    "imageWidth": W
                }
                with open(os.path.join(savepath,imgname.split('.')[0] + '.json'), "w",encoding='utf-8') as fw:
                    print(imgname,' succeed!')
                    json.dump(new_dict, fw)
    
    
    if __name__ == '__main__':
        path = r'E:\Projects\OCR-release-2.1\tools\infer\imgs\train_data'
        savepath = r'json1'
        pp2json(path,savepath)

    PPOCRLabel標(biāo)注的txt格式怎么轉(zhuǎn)換成labelme能修改的json格式

    PPOCRLabel標(biāo)注的Label.txt文件,所有的圖片標(biāo)注都在一個(gè)txt里頭,一個(gè)圖片一行,文件名和標(biāo)注內(nèi)容之間用制表符’\t’隔開(kāi)。

    PPOCRLabel標(biāo)注的txt格式怎么轉(zhuǎn)換成labelme能修改的json格式

    labelme標(biāo)注的json文件格式

    以上就是關(guān)于“PPOCRLabel標(biāo)注的txt格式怎么轉(zhuǎn)換成labelme能修改的json格式”這篇文章的內(nèi)容,相信大家都有了一定的了解,希望小編分享的內(nèi)容對(duì)大家有幫助,若想了解更多相關(guān)的知識(shí)內(nèi)容,請(qǐng)關(guān)注億速云行業(yè)資訊頻道。

    向AI問(wèn)一下細(xì)節(jié)

    免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

    AI