您好,登錄后才能下訂單哦!
索引與切片在Tensorflow中使用的頻率極其高,可以用來提取部分數(shù)據(jù)。
1.索引
在 TensorFlow 中,支持基本的[𝑖][𝑗]…標(biāo)準(zhǔn)索引方式,也支持通過逗號分隔索引號的索引方式。
假設(shè)創(chuàng)建四張大小為3*3的彩色圖片。
# 創(chuàng)建張量 x = tf.random.normal([4, 32, 32, 3]) # 提取出第一張圖片 x[0] <tf.Tensor: id=253, shape=(32, 32, 3), dtype=float32, numpy= array([[[ 3.16146165e-01, 1.88969020e-02, 1.38413876e-01], [ 4.89341050e-01, 2.75277281e+00, 7.39786148e-01], [-1.25965345e+00, -2.69633114e-01, -1.16465724e+00], ..., # 提取出第一張圖片的第二行 x[0][1] <tf.Tensor: id=261, shape=(32, 3), dtype=float32, numpy= array([[ 7.4337220e-01, -1.0524833e+00, -2.6401659e-03], [ 5.3725803e-01, -9.5556659e-01, 4.9091709e-01], [-4.6934509e-01, 7.9289172e-03, -2.9179385e+00], [ 2.9324377e-01, 2.1451252e+00, -3.8849866e-01], [ 8.2027388e-01, -4.9701610e-01, -7.3374517e-02], ...... # 提取出第一張圖片的第二行第三列的像素 x[0][1][2] <tf.Tensor: id=273, shape=(3,), dtype=float32, numpy=array([-0.4693451 , 0.00792892, -2.9179385 ], dtype=float32)> # 提取出第一張圖片第二行第三列第二個用到(B通道)的顏色強度 x[0][1][2][2] <tf.Tensor: id=289, shape=(), dtype=float32, numpy=-2.9179385>
當(dāng)張量的維度數(shù)較高時,使用[𝑖][𝑗]. . .[𝑘]的方式書寫不方便,可以采用[𝑖,𝑗, … , 𝑘]的方式索引,它們是等價的。
x[1, 9, 2] == x[1][9][2] <tf.Tensor: id=306, shape=(3,), dtype=bool, numpy=array([ True, True, True])>
2.切片
通過𝑠𝑡𝑎𝑟𝑡: 𝑒𝑛𝑑: 𝑠𝑡𝑒𝑝切片方式可以方便地提取一段數(shù)據(jù),其中 start 為開始讀取位置的索引,end 為結(jié)束讀取位置的索引(不包含 end 位),step 為讀取步長。
還是以shape為[4, 32, 32, 3]的圖片張量為例。
# 創(chuàng)建張量 x = tf.random.normal([4, 32, 32, 3]) # 讀取第二張和第三張圖片 x[1:3] <tf.Tensor: id=344, shape=(2, 32, 32, 3), dtype=float32, numpy= array([[[[-3.4415385e-01, 5.8418065e-01, 1.8238322e-01], [ 5.3377771e-01, 5.8201426e-01, 1.2839563e+00], [-1.4592046e+00, -2.3443605e-01, -2.6524603e-01], ..., [-5.0662726e-01, 6.9743747e-01, -5.8803167e-02], [ 1.4200432e+00, -5.0182146e-01, 5.1661726e-02], [ 3.5610806e-02, -2.4781477e-01, 1.8222639e-01]], [[ 1.3892423e+00, 1.1985755e+00, -6.4732605e-01], [ 8.5562867e-01, 1.2758574e+00, 1.7331127e+00], [ 9.7743452e-02, -5.3990984e-01, 8.3400911e-01], ...,
start: end: step切片方式有很多簡寫方式,其中 start、end、step 3 個參數(shù)可以根據(jù)需要選擇性地省略,全部省略時即::,表示從最開始讀取到最末尾,步長為 1,即不跳過任何元素。如 x[0,::]表示讀取第 1 張圖片的所有行,其中::表示在行維度上讀取所有行,它等于x[0]的寫法。
即x[0, ::]等價于x[0 ]。
為了更加簡潔,::可以簡寫成為單個冒號。
x[:, 0:28:2, 0:28:2, :] <tf.Tensor: id=344, shape=(2, 32, 32, 3), dtype=float32, numpy= array([[[[-3.4415385e-01, 5.8418065e-01, 1.8238322e-01], [ 5.3377771e-01, 5.8201426e-01, 1.2839563e+00], [-1.4592046e+00, -2.3443605e-01, -2.6524603e-01], ...,
上述表示取所有圖片,隔行采樣,隔列采樣,采集所有通道信息。相當(dāng)于在圖片的高寬各放縮至原來的一半。
下面是一些常見的切片方式小結(jié):
特別地,step可以為負數(shù)。例如:step = −1時,start: end: −1表示從 start 開始,逆序讀取至 end 結(jié)束(不包含 end),索引號𝑒𝑛𝑑 ≤ 𝑠𝑡𝑎𝑟𝑡。
x = tf.range(9) # 逆序輸出 x[8:0:-1] <tf.Tensor: id=31, shape=(8,), dtype=int32, numpy=array([8, 7, 6, 5, 4, 3, 2, 1])> # 逆序取全部元素 x[::-1] <tf.Tensor: id=35, shape=(9,), dtype=int32, numpy=array([8, 7, 6, 5, 4, 3, 2, 1, 0])> # 逆序間隔采樣 x[::-2] <tf.Tensor: id=39, shape=(5,), dtype=int32, numpy=array([8, 6, 4, 2, 0])>
當(dāng)張量的維度數(shù)量較多時,不需要采樣的維度一般用單冒號:表示采樣所有元素。
x = tf.random.normal([4, 32, 32, 3]) # 提取所有圖片的G通道 x[:,:,:,1] <tf.Tensor: id=59, shape=(4, 32, 32), dtype=float32, numpy= array([[[ 0.5700944 , 0.58056635, 2.2198782 , ..., -0.8475847 , 0.49761978, 0.28784937], [-0.22224228, 0.77950406, -0.01802959, ..., 0.55532527, 0.6826188 , 0.50668514], [-2.4160695 , -0.96219736, 0.62681717, ..., 1.0348777 ,
為了避免出現(xiàn)像𝑥[: , : , : ,1]這樣出現(xiàn)過多冒號的情況,可以使用⋯符號表示取多個維度上所有的數(shù)據(jù),其中維度的數(shù)量需根據(jù)規(guī)則自動推斷:當(dāng)切片方式出現(xiàn)⋯符號時,⋯符號左邊的維度將自動對齊到最左邊,⋯符號右邊的維度將自動對齊到最右邊,此時系統(tǒng)再自動推斷⋯符號代表的維度數(shù)量。
# 創(chuàng)建四張大小為32*32的彩色圖片 x = tf.random.normal([4, 32, 32, 3]) # 讀取第一張和第二張圖片的G/B通道數(shù)據(jù) x[0:2,...,1:] # 讀取最后兩張圖片 x[2,...] # 讀取所有圖片的R/G通道 x[...,:2]
掌握了張量的索引與切片之后,會讓我們的書寫更加快捷。
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持億速云。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。