<form id="w499i"><legend id="w499i"></legend></form>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

MATLAB如何提取復雜文本中的數(shù)據(jù)

發(fā)布時間：2021-12-30 17:23:05 來源：億速云閱讀：274 作者：小新欄目：大數(shù)據(jù)

這篇文章主要介紹MATLAB如何提取復雜文本中的數(shù)據(jù)，文中介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們一定要看完！

其實也不能算是復雜文本，還是有規(guī)律的。這個文本裝的是我實驗室設備采集到的數(shù)據(jù)，如下：

MATLAB如何提取復雜文本中的數(shù)據(jù)

數(shù)據(jù)被我碼掉了一部分，我需要提取出框住的那部分數(shù)據(jù)，這是一個矩陣，他上邊的列號和左邊的行號都是傳感器的序號。

讀取數(shù)據(jù)的簡單思路：

通過觀察可以發(fā)現(xiàn)，我們想要獲取的數(shù)據(jù)都是在CH#開頭的行的后面，而且這個行的后面都是數(shù)值！所以這就很簡單了：

我們用一個while循環(huán)，把到達文件尾作為結(jié)束條件，
每次循環(huán)中判斷一下是否已經(jīng)走過了CH#開頭的行，
如果沒走過CH#開頭的行就繼續(xù)，
如果走過了CH#開頭的行就開始讀數(shù)。

下面直接上代碼，再做一些簡單的說明

clc
clear

%% 文件打開對話框，選擇文件
[file, path] = uigetfile({'*.TXT'}, '選擇走時文件');
% 如果沒有選擇文件就退出
if file == 0
    return
end
% 文件完整路徑
fullPath = [path, file];

%% 打開文件
fid = fopen(fullPath, 'r');

%% 保存結(jié)果的矩陣
ElapsTimeData = [];

%% 標志開始模式為'^CH#'，開始標志的初值為0
startParten = '^CH#';
startFlag = 0;
%% 循環(huán)讀取文件
while(~feof(fid))
    % 一次循環(huán)讀取一行，并把兩邊的空白去掉
    curLine = strip(fgetl(fid));
    % 如果開始標志已經(jīng)被設置為1，而且不是空行，則讀取
    if startFlag == 1 && ~isempty(curLine)
        cur_data = cellfun(@str2double, regexpi(strip(curLine), '\s+', 'split'));
        ElapsTimeData = [ElapsTimeData; cur_data];
    end

    % 當碰到startParten時，其下一行開始就是走時數(shù)據(jù)了
    if regexpi(curLine, startParten)
        startFlag = 1;
    end

end

% 刪除第一列，第一列放的是傳感器序號
ElapsTimeData(:, 1) = [];

關(guān)于regexpi函數(shù)它接受三個參數(shù)：

第一個是原字符串，
第二個是我們要匹配的模式，
第三個參數(shù)是正則表達式輸出規(guī)則。

上面程序中，加粗黑體的那句

regexpi(strip(curLine), '\s+', 'split')

源字符串就是當前行
匹配模式：\s+表示一個或以上的空格（空白）
輸出規(guī)則：我采用的是split，表示：返回除匹配字符串之外的所有字符串！

所以，我這里將輸出除空白以外的所有字符，而這個匹配是在匹配到'^CH#'之后才開始的，所以我們便能獲得'^CH#'所在行的后面所有行中的數(shù)字了。

如果第三個參數(shù)使用match的話，則像下面這樣寫也行，就是匹配模式稍微多了點東西！

regexpi(strip(curLine), '\d+\.\d+', 'match')

另外regexpi返回的是一個細胞數(shù)組，每一個匹配到的結(jié)果都放在了單個細胞中。所以我這里用的cellfun把每一個細胞中的字符轉(zhuǎn)化為數(shù)值：

cur_data = cellfun(@str2double, regexpi(strip(curLine), '\s+', 'split'));

Note:

上面給的代碼中我刪減了處理錯誤的代碼，比如說：不符合上面規(guī)則的文件，或者我們不小心把要提取的部分刪了點數(shù)據(jù)，等等。

這些可以用 try - catch 結(jié)構(gòu)來處理，我就不多說了，感興趣的可以自己試試看，實際在提取數(shù)據(jù)時，最好加上這些處理錯誤情況的代碼。

讀取結(jié)果：

MATLAB如何提取復雜文本中的數(shù)據(jù)

也碼掉一部分數(shù)據(jù)

以上是“MATLAB如何提取復雜文本中的數(shù)據(jù)”這篇文章的所有內(nèi)容，感謝各位的閱讀！希望分享的內(nèi)容對大家有幫助，更多相關(guān)知識，歡迎關(guān)注億速云行業(yè)資訊頻道！

向AI問一下細節(jié)

推薦閱讀：

免責聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
MATLAB如何畫圖
下一篇新聞：
Weblogic60中打包時Helper類的位置是什么

猜你喜歡

AI
助
手

產(chǎn)品服務

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機網(wǎng)站二維碼