溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

發(fā)布時(shí)間:2021-09-27 16:26:38 來(lái)源:億速云 閱讀:173 作者:柒染 欄目:系統(tǒng)運(yùn)維

這篇文章給大家介紹針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對(duì)大家能有所幫助。

正文

UBI簡(jiǎn)介

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

UBI全稱(chēng)是Unsorted Block  Images,上圖為UBI在系統(tǒng)中的層次結(jié)構(gòu),最下面是flash層(包括flash控制器,各個(gè)flash驅(qū)動(dòng)代碼,spi-mem層等);MTD層是對(duì)flash層的抽象,一個(gè)flash可能被劃分成不同的分區(qū),每一個(gè)分區(qū)都會(huì)對(duì)應(yīng)一個(gè)MTD設(shè)備;UBI層是基于MTD層之上的更高層,UBI層抽象出一個(gè)個(gè)邏輯擦寫(xiě)塊,每個(gè)邏輯擦寫(xiě)塊都有一個(gè)物理擦寫(xiě)塊與之前對(duì)應(yīng),有了這個(gè)映射,我們就可以加一些軟件算法,達(dá)到擦寫(xiě)均衡的目的,從而提高flash的使用壽命;再往上是基于UBI層實(shí)現(xiàn)和各種文件系統(tǒng),比如UBIFS。

flash存儲(chǔ)的內(nèi)容

首先介紹幾個(gè)概念:

  • PEB:physical eraseblocks 也就是對(duì)應(yīng)flash上的一個(gè)擦寫(xiě)塊

  • LEB:logical eraseblocks 軟件上的概念

  • Volume:卷

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

如上圖為flash中(或者說(shuō)flash一個(gè)分區(qū)中)數(shù)據(jù)組織結(jié)構(gòu):

  • ubi層對(duì)flash的管理是以擦寫(xiě)塊為單位的,LEB對(duì)應(yīng)軟件上的概念,PEB對(duì)應(yīng)flash上一個(gè)實(shí)實(shí)在在的擦寫(xiě)塊,每一個(gè)LEB對(duì)應(yīng)一個(gè)PEB。

  • 往上看多個(gè)LEB可以組成一個(gè)volume,也就是說(shuō),可以根據(jù)不同的功能,將LEB劃分到不同的卷中;其中valume-layout是一個(gè)ubi內(nèi)部使用的卷,用來(lái)存放該MTD設(shè)備上所劃分的各個(gè)卷的信息,其包含兩個(gè)LEB,它們存儲(chǔ)的內(nèi)容是一樣,互為備份。

  • 往下看每個(gè)PEB的內(nèi)容包含3部分ech(erase counter header),vidh(volume identifier  header),data。下面會(huì)介紹具體含義。

代碼實(shí)現(xiàn)

linux對(duì)UBI層的代碼實(shí)現(xiàn)大致可以總結(jié)為3個(gè)方面:

首先數(shù)據(jù)是存儲(chǔ)在flash中的,因此需要將flash中的相關(guān)信息讀到內(nèi)存中,同時(shí)也可以檢查出flash中的壞塊

數(shù)據(jù)讀到內(nèi)存后,需要按照內(nèi)部的邏輯關(guān)系組織起來(lái)(比如將正在使用的PEB放到紅黑樹(shù)上管理起來(lái),空閑的PEB也放到紅黑樹(shù)上管理起來(lái))

在內(nèi)存中有了這些數(shù)據(jù)的關(guān)系后,就可以對(duì)其進(jìn)行操作(比如讀寫(xiě)操作,volume增加,刪除,擴(kuò)容等操作,擦寫(xiě)均衡操作)

將flash數(shù)據(jù)讀到內(nèi)存

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

UBI初始化時(shí)代碼調(diào)用流程如上圖,最終會(huì)調(diào)用scan_all() 函數(shù), scan_all() 函數(shù)會(huì)遍歷該MTD設(shè)備

中的每一個(gè)PEB,從中讀出ech和vidh,它們的定義如下。

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

ech的定義如上,其中:

  • ec:表示該P(yáng)EB被擦寫(xiě)的次數(shù),借助該字段我們就能夠找出被擦寫(xiě)次數(shù)最少的PEB,從而達(dá)到擦寫(xiě)均衡的目的

  • vid_hdr_offset:表示vidh在該P(yáng)EB中的偏移位置

  • data_offset:表示實(shí)際數(shù)據(jù)在該P(yáng)EB中的偏移位置

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

  • vidh的定義如上,其中:

  • vol_id:表示該P(yáng)EB屬于那一個(gè)volume

lmun:表示LEB在volume中的編號(hào),該字段與PEB在MTD設(shè)備中的編號(hào)形成映射關(guān)系通過(guò)對(duì)MTD設(shè)備的每個(gè)PEB進(jìn)行遍歷,可以得知各個(gè)PEB的情況,或是被使用的,或是空閑狀態(tài),或者已經(jīng)損壞,這些信息會(huì)被臨時(shí)記錄在struct  ubi_attach_info 結(jié)構(gòu)中,遍歷過(guò)程中的具體細(xì)節(jié),可以參考scan_all() 函數(shù)。

組織數(shù)據(jù)結(jié)構(gòu)

遍歷PEB后,會(huì)將flash信息保存在臨時(shí)的結(jié)構(gòu)struct ubi_attach_info 中,接下來(lái)會(huì)將struct ubi_attach_info  中的臨時(shí)信息保存到全局結(jié)構(gòu)struct ubi_device *ubi_devices 中,代碼如下:

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

分為三個(gè)步驟,分別是對(duì)volume的初始化,對(duì)wear-leveling子系統(tǒng)的初始化,對(duì)eba(Eraseblock  Association)子系統(tǒng)的初始化;下面我們分別看下。

volume & EBA子系統(tǒng)初始化

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

前面有介紹到volume-layout是UBI內(nèi)部使用的一個(gè)卷,其包含兩個(gè)LEB(互為備份),對(duì)應(yīng)PEB中的數(shù)據(jù)內(nèi)容如上圖,data(灰色)部分是一個(gè)struct  ubi_vtbl_record 結(jié)構(gòu)數(shù)組,記錄了當(dāng)前UBI設(shè)備所有卷的信息, ubi_read_volume_table() 函數(shù)先遍歷臨時(shí)結(jié)構(gòu)struct  ubi_attach_info 找出volumelayout所在PEB,然后 讀出struct ubi_vtbl_record  結(jié)構(gòu)數(shù)組并保存到內(nèi)存中,也就是struct ubi_device 的struct ubi_volume *volumes[]  字段中,初始化后的數(shù)組結(jié)構(gòu)如下圖,其中struct ubi_volume *volumes[] 是一個(gè)指針數(shù)組,數(shù)組中的每一個(gè)元素都是struct  ubi_volume 結(jié)構(gòu)(詳細(xì)過(guò)程見(jiàn)ubi_read_volume_table() 函數(shù))。

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

在struct ubi_volume 結(jié)構(gòu)體中,有一個(gè)比較重要的字段struct ubi_eba_table *eba_tbl  ,該字段記錄了當(dāng)前volume中所有LEB與PEB的映射關(guān)系,其中struct ubi_eba_entry *entries  是一個(gè)數(shù)組結(jié)構(gòu),每一個(gè)元素對(duì)應(yīng)一個(gè)struct ubi_eba_table 結(jié)構(gòu)體, struct ubi_eba_entry *entries 數(shù)

組的下標(biāo)對(duì)應(yīng)于LEB的編號(hào),數(shù)組元素的內(nèi)容對(duì)應(yīng)EB的編號(hào),這樣就將LEB與PEB關(guān)聯(lián)起來(lái)了(詳細(xì)過(guò)程見(jiàn)ubi_eba_init() 函數(shù))。

wear-leveling子系統(tǒng)初始化

在UBI中將PEB分為4種情況,正在使用、空閑狀態(tài)、需要擦除、已經(jīng)損壞,各個(gè)狀態(tài)的PEB被放到不同的紅黑樹(shù)中管理。在ubi_eba_init()  函數(shù)中,會(huì)先分配一個(gè)struct ubi_wl_entry 指針數(shù)組并存儲(chǔ)在sruct ubi_wl_entry **lookuptbl  字段中,數(shù)組下標(biāo)為PEB的編號(hào),數(shù)組內(nèi)容記錄了PEB的擦寫(xiě)次

數(shù)與編號(hào)信息,每一個(gè)PEB都有一個(gè)這樣的結(jié)構(gòu)與之對(duì)應(yīng)如下圖。

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

另外各個(gè)PEB還根據(jù)狀態(tài)放到不同的紅黑樹(shù)管理起來(lái),上圖畫(huà)出了used, free,  scrub三種狀態(tài)的紅黑樹(shù),其中紅黑樹(shù)是以擦寫(xiě)次數(shù)為順序排列的,最小的擦寫(xiě)次數(shù)排列在最左邊,如果擦寫(xiě)次數(shù)相同,則比較PEB的編號(hào),編號(hào)小的排在樹(shù)的左邊,而對(duì)應(yīng)的值為struct  ubi_wl_entry 指針數(shù)組中的一個(gè)元素。

調(diào)用ubi_eba_init() 函數(shù)后,wear-leveling子系統(tǒng)也就初始化完畢,在內(nèi)存中會(huì)形成上圖中的數(shù)組關(guān)系。

UBI層操作

經(jīng)過(guò)前面的初始化,各個(gè)數(shù)據(jù)的結(jié)構(gòu)關(guān)系已經(jīng)保存在內(nèi)存中了,因此UBI層的操作其實(shí)就是對(duì)內(nèi)存中這些數(shù)據(jù)的操作。

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

從用戶(hù)空間角度看,UBI初始化后會(huì)對(duì)應(yīng)三類(lèi)字符設(shè)備,分別為/dev/ubi_ctrl 、/dev/ubix (x = 0, 1, 2...),  /dev/ubix_y (x = 0, 1, 2..., y = 0, 1, 2),它們對(duì)應(yīng)的操作函數(shù)如下代碼。

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

  • ubi_vol_cdev_operations:是針對(duì)某個(gè)volume(/dev/ubi1_0等)來(lái)操作的,從volume的角度只能看到其中包含的PEB,因此它的操作也是圍繞PEB進(jìn)行的。

  • ubi_cdev_operations:是針對(duì)UBI設(shè)備(/deb/ubi0等)進(jìn)行操作的,從UBI設(shè)備的角度可以看到不同的volume,因此可以對(duì)volume進(jìn)行創(chuàng)建,刪除,擴(kuò)容等操作。

  • ubi_ctrl_cdev_operations:是針對(duì)UBI層(/dev/ubi_ctrl)的操作,從該角度可以看到UBI設(shè)備,因此可以對(duì)UBI設(shè)備進(jìn)行創(chuàng)建,刪除操作。

舉個(gè)例子

需求:假如我們想要對(duì)/dev/ubi1_0 這個(gè)volume進(jìn)行擴(kuò)容,我們應(yīng)用怎樣操作?

用戶(hù)空間將volume_id,size兩個(gè)參數(shù)傳遞到內(nèi)核空間

在內(nèi)核空間我們根據(jù)volume_id在struct ubi_volume *volumes[] 數(shù)組中找到volume的handler

因?yàn)樾枰獢U(kuò)容(要分配更多的LEB),所以要重新分配struct ubi_eba_table *eba_tbl  數(shù)組,并將舊數(shù)組中的數(shù)據(jù)拷貝到新數(shù)組中

對(duì)于新增的LEB,我們需要從free樹(shù)上申請(qǐng),建立LEB到PEB的映射關(guān)系并保存到struct ubi_eba_table *eba_tbl  數(shù)組,另外還需要更新PEB中ech和vidh,表明該P(yáng)EB屬于那個(gè)volume

上面這一系列操作是我自己的想法,并非kernel實(shí)現(xiàn)代碼(具體實(shí)現(xiàn)可以參數(shù)ubi_cdev_ioctl()  函數(shù))。這里想表達(dá)的意思是,在UBI初始化完成后,在內(nèi)存中已經(jīng)存在了各個(gè)volume,各個(gè)LEB/PEB之間的關(guān)系,因此對(duì)于UBI的操作,理論上我們是都可以完成的,所差的只是代碼實(shí)現(xiàn);程序=算法+數(shù)組結(jié)構(gòu),這里的數(shù)組結(jié)構(gòu)已經(jīng)有了,而算法就是UBI層的各種操作,這里的代碼其實(shí)每個(gè)人都可以實(shí)現(xiàn)的,只不過(guò)有好有壞,所幸kernel已經(jīng)幫我們實(shí)現(xiàn)了,我們可以參考學(xué)習(xí)。其實(shí)別人寫(xiě)的文章只能提供個(gè)大概,真正的細(xì)節(jié)只有在源碼中才能獲得。

擦寫(xiě)均衡

flash的擦寫(xiě)塊都是有壽命限制的,如果頻繁的擦寫(xiě)flash的某一個(gè)PEB,很快這個(gè)PEB就會(huì)損壞,而擦寫(xiě)均衡的目的就是將擦除操作平均分配到整個(gè)flash,這樣就能提高flash的使用壽命。那怎樣將擦除操作平均分配到整個(gè)flash呢,要達(dá)到這個(gè)條件還是有些難度的,因此我們退一步,將條件修改為PEB的最大擦寫(xiě)次數(shù)與最小次數(shù)的的差值小于某個(gè)值。

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

比如flash中包含20個(gè)PEB,其中數(shù)字表示該P(yáng)EB被擦寫(xiě)的次數(shù),我們約定擦寫(xiě)次數(shù)的差值最大為15,現(xiàn)在flash中PEB的最小與最大擦寫(xiě)次數(shù)分別為10、39,由于超過(guò)門(mén)限值,因此需要我們想一些方法,增加擦寫(xiě)次數(shù)為10的PEB被擦寫(xiě)的機(jī)會(huì),減少擦寫(xiě)次數(shù)為39的PEB被擦寫(xiě)的機(jī)會(huì),從而使整個(gè)flash的擦寫(xiě)次數(shù)趨于平均。具體的實(shí)現(xiàn)后面會(huì)介紹。

擦寫(xiě)時(shí)機(jī)

linux kernel會(huì)在下面兩個(gè)位置調(diào)用擦寫(xiě)均衡:

  • wear-leveling子系統(tǒng)初始化完成時(shí)會(huì)檢查一次是否需要擦寫(xiě)均衡,此時(shí)是一個(gè)初始狀態(tài),是檢查的一個(gè)時(shí)機(jī)。

  • 當(dāng)要擦除某個(gè)PEB的時(shí)候,此時(shí)擦寫(xiě)次數(shù)會(huì)增加,有可能達(dá)到擦寫(xiě)均衡的要求,此時(shí)也是一個(gè)檢查的時(shí)機(jī)。

擦寫(xiě)條件

除了上面的調(diào)用時(shí)機(jī),擦寫(xiě)均衡還有一些其它的條件限制,如下圖為擦寫(xiě)均衡的流程圖:

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

  • 當(dāng)scrub紅黑樹(shù)上有節(jié)點(diǎn)時(shí),一定需要進(jìn)行擦寫(xiě)均衡。在遍歷flash的每個(gè)PEB時(shí),如果發(fā)現(xiàn)在從flash中讀出的數(shù)據(jù)有位翻轉(zhuǎn)的情況,就會(huì)加上scrub標(biāo)志,并放到scrub紅黑樹(shù)上維護(hù)起來(lái),表示該P(yáng)EB需要被擦寫(xiě);在擦寫(xiě)均衡時(shí),先取出scrub樹(shù)最左邊節(jié)點(diǎn)e1,再?gòu)膄ree樹(shù)中找一個(gè)合適的節(jié)點(diǎn)e2,然后讀取e1對(duì)應(yīng)PEB的數(shù)據(jù),如果讀取的數(shù)據(jù)還有問(wèn)題,就會(huì)結(jié)束本次擦寫(xiě);如果沒(méi)有問(wèn)題就會(huì)把e1數(shù)據(jù)copy到e2位置,并擦除e1數(shù)據(jù)完成本次擦寫(xiě)均衡操作。

  • 當(dāng)scrub樹(shù)上沒(méi)有節(jié)點(diǎn)時(shí),會(huì)從used樹(shù)上取出最左邊節(jié)點(diǎn)e1,并從free樹(shù)上找一個(gè)合適的節(jié)點(diǎn)e2,然后檢查e2與e1的PEB擦寫(xiě)次數(shù)的差值是否大于門(mén)限值,如果大于,則將e1數(shù)據(jù)copy到e2位置并擦除e1數(shù)據(jù)完成本次擦寫(xiě)。為什么這樣做,原因是used樹(shù)中的節(jié)點(diǎn)已經(jīng)被初始化過(guò)(先整個(gè)擦除,然后寫(xiě)入ech和vidh,后面再寫(xiě)入數(shù)據(jù)也不需要擦寫(xiě))所以不會(huì)有擦除操作,在free樹(shù)上的節(jié)點(diǎn),在被使用前需要擦除一次,所以把擦寫(xiě)次數(shù)大的PEB放到used樹(shù)上減少被擦寫(xiě)的機(jī)會(huì),把擦寫(xiě)次數(shù)小的節(jié)點(diǎn)放到free樹(shù)上增加被擦寫(xiě)的機(jī)會(huì),這樣就達(dá)到了擦寫(xiě)均衡的目的。

  • 另外在free樹(shù)上選擇一個(gè)合適的節(jié)點(diǎn),什么是適合和節(jié)點(diǎn)?最簡(jiǎn)單的方法就是從free樹(shù)的最右邊拿一上節(jié)點(diǎn)(擦寫(xiě)次數(shù)最大的節(jié)點(diǎn)),然后與used樹(shù)上取下的最左邊的節(jié)點(diǎn)比較,看看差值是否超過(guò)門(mén)限值。但實(shí)際情況可能會(huì)更復(fù)雜些,如下代碼29行,是kernel中在free樹(shù)上選擇節(jié)點(diǎn)的方法,其限制了最大擦寫(xiě)次數(shù)為free樹(shù)最左側(cè)節(jié)點(diǎn)  + WL_FREE_MAX_DIFF,看上面的注釋說(shuō)在某些情況下會(huì)出現(xiàn)不斷擦寫(xiě)某一個(gè)或幾個(gè)PEB的情況,所以作了這樣一個(gè)限制。(沒(méi)有想道是什么情況??)

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的

關(guān)于針對(duì)Flash的Linux UBI子系統(tǒng)是怎樣的就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI