溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

C語言如何在指針中隱藏數(shù)據(jù)詳解

發(fā)布時間:2020-10-10 16:13:51 來源:腳本之家 閱讀:166 作者:忑忑忑易昂 欄目:編程語言

前言

編寫 C 語言代碼時,指針無處不在。我們可以稍微額外利用指針,在它們內(nèi)部暗中存儲一些額外信息。為實現(xiàn)這一技巧,我們利用了數(shù)據(jù)在內(nèi)存中的自然對齊特性。

內(nèi)存中的數(shù)據(jù)并非保存在任意地址。處理器通常按照其字大小相同的塊讀取內(nèi)存數(shù)據(jù);那么考慮到效率因素,編譯器會按照塊大小的整數(shù)倍對內(nèi)存中的實體進行地址對齊。因此在 32 位的處理器上,一個 4 字節(jié)整型數(shù)據(jù)肯定存放在內(nèi)存地址能被4整除的地方。

下面,假設系統(tǒng)中整型數(shù)據(jù)和指針大小均為 4 字節(jié)。

現(xiàn)在有一個指向整型的指針。如上所述,整型數(shù)據(jù)可以存放在內(nèi)存地址 0x1000 或者 0x1004 或者 0x1008,但是決不會存放在 0x1001 或者0x1002 或者 0x1003 或者其他不能被4整除的任何地址。所有是4整數(shù)倍的二進制數(shù)都是以 00 結(jié)尾。實際上,這意味著對于所有指向整型的指針,它的最后兩位總是 0。

那么有 2 比特沒有承載任何信息。此處的技巧是將我們的數(shù)據(jù)放置到這兩個比特中,在需要時使用,并在通過指針解引用來訪問內(nèi)存前刪除它們。

由于 C 標準對指針位操作的支持不是很好,所以我們將指針保存為一個無符號整型數(shù)據(jù)。

下面是一段簡短的簡單代碼片段。完整的代碼查看 github 代碼倉庫中的hide-data-in-ptr。

void put_data(int *p, unsigned int data)
{
	assert(data < 4);
	*p |= data;
}
unsigned int get_data(unsigned int p)
{
	return (p & 3);
}
void cleanse_pointer(int *p)
{
	*p &= ~3;
}
int main(void)
{
	unsigned int x = 701;
	unsigned int p = (unsigned int) &x;
	printf("Original ptr: %un", p);
	put_data(&p, 3);
	printf("ptr with data: %un", p);
	printf("data stored in ptr: %un", get_data(p));
	cleanse_pointer(&p);
	printf("Cleansed ptr: %un", p);
	printf("Dereferencing cleansed ptr: %un", *(int*)p);
	return 0;
}

代碼輸出如下:

Original ptr:  3216722220
ptr with data: 3216722223
data stored in ptr: 3
Cleansed ptr:  3216722220
Dereferencing cleansed ptr: 701

我們可以在指針中存儲任何可以用兩個比特位表示的數(shù)據(jù)。使用 put_data() 函數(shù),設置指針的最低兩位為要存儲的數(shù)據(jù)。該數(shù)據(jù)可以使用get_data() 函數(shù)獲取。此處除了最后兩位所有的位都被覆蓋為零,于是我們隱藏的數(shù)據(jù)就顯示出來。

cleanse_pointer() 函數(shù)將最低兩位置零,保證指針安全地解引用。注意雖然有些 CPU(像 Intel 允許我們訪問未對齊內(nèi)存地址,但其余 CPU(像 ARM)會出現(xiàn)訪問錯誤。所以,要牢記在解引用前保證指針指向已對齊內(nèi)存地址。

這在實際中有應用嗎?

是的,有應用。查看 Linux 內(nèi)核中紅黑樹的實現(xiàn)(鏈接:https://github.com/torvalds/linux/blob/master/include/linux/rbtree.h)。

樹的結(jié)點定義如下:

struct rb_node {
	unsigned long  __rb_parent_color;
	struct rb_node *rb_right;
	struct rb_node *rb_left;
} __attribute__((aligned(sizeof(long))));

此處 unsigned long __rb_parent_color 存儲了如下信息:

父節(jié)點的地址

結(jié)點的顏色

色彩的表示用 0 代表紅色,1 代表黑色。

和前面的例子一樣,該數(shù)據(jù)隱藏在父指針“無用的”比特位中。

下面看一下父指針和色彩信息是如何獲取的:

/* in rbtree.h */
#define rb_parent(r) ((struct rb_node *)((r)->__rb_parent_color & ~3))
/* in rbtree_augmented.h */
#define __rb_color(pc)  ((pc) & 1)
#define rb_color(rb)  __rb_color((rb)->__rb_parent_color)

內(nèi)存中每一比特都很珍貴,咱們永遠不要浪費?!ū疚淖髡撸?/p>

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對億速云的支持。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI