溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

VBS字符串如何在內(nèi)部實(shí)現(xiàn)

發(fā)布時(shí)間:2021-10-12 09:59:10 來源:億速云 閱讀:113 作者:小新 欄目:開發(fā)技術(shù)

小編給大家分享一下VBS字符串如何在內(nèi)部實(shí)現(xiàn),相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!



VBS 是基于微軟的 ActiveX/COM 技術(shù)實(shí)現(xiàn)的,而 COM 對(duì)象為了做到支持任何語言,定義了一系列通用的數(shù)據(jù)類型,微軟稱之為自動(dòng)化對(duì)象類型(Automation data types),其中之一就是 BSTR。VBS 在內(nèi)部是以 BSTR 來表示字符串的,BSTR 在 WTypes.h 中定義:

復(fù)制代碼 代碼如下:


typedef wchar_t WCHAR;
typedef WCHAR OLECHAR;
typedef OLECHAR *BSTR;

從定義可以看出,BSTR 是指向 wchar_t 類型(也就是 C 語言中的 Unicode)的指針,但是 BSTR 并不是普通的 wchar_t 指針。標(biāo)準(zhǔn) BSTR 指向一個(gè)有長度前綴和 NUL 結(jié)束符的 wchar_t 數(shù)組。BSTR 的前4字節(jié)是一個(gè)表示字符串長度的前綴。BSTR 長度域的值是字符串的字節(jié)數(shù),并且不包括 NUL 結(jié)束符。常用的 BSTR 處理函數(shù)請(qǐng)參考 MSDN 文檔。

理論說的有點(diǎn)抽象,下面用代碼來說明:

復(fù)制代碼 代碼如下:


str = "Hello" & Chr(0) & "world"


這是一句很簡(jiǎn)單的 VBS 代碼,但是 VBScript 解釋器在內(nèi)部做了什么呢?其實(shí)就是初始化了一個(gè) BSTR 變量(不考慮字符串連接過程):

復(fù)制代碼 代碼如下:


/* 僅僅為了演示,實(shí)際代碼肯定不是這樣的 */
BSTR str = SysAllocStringLen(L"Hello\0world", 11);為了更清楚地了解 BSTR 的結(jié)構(gòu),我們換一種寫法:

/* BSTR 包含長度前綴,但是卻實(shí)際指向第一個(gè)字符 */
wchar_t arr[] = {22,0,'H','e','l','l','\0','w','o','r','l','d','\0'};
BSTR str = &arr[2];這個(gè) BSTR 在內(nèi)存中的結(jié)構(gòu)為:

00000000 16 00 00 00 48 00 65 00 6C 00 6C 00 6F 00 00 00
00000010 77 00 6F 00 72 00 6C 00 64 00 00 00


橙色表示四個(gè)字節(jié)的長度前綴。紅色高亮表示 BSTR 指針的當(dāng)前指向,藍(lán)色高亮表示字符串中的 Chr(0) 字符,綠色高亮表示 BSTR 的結(jié)束字符 NUL(該字符是 SysAllocStringLen 函數(shù)加上去的,因?yàn)槭?Unicode,所以要占兩個(gè)字節(jié))。也就是說,如果不考慮前面四個(gè)字節(jié),BSTR 就是 C 語言中的 null-terminated string。

再看一段 VBS 代碼:

MsgBox Len(str)用 MsgBox 來顯示剛才定義的字符串長度,VBScript 解釋器內(nèi)部又做了什么呢?是不是像 C 語言標(biāo)準(zhǔn)庫函數(shù) strlen 一樣,遍歷整個(gè)字符串,以 NUL 作為字符串結(jié)束的標(biāo)識(shí)呢?

復(fù)制代碼 代碼如下:


/* C語言 strlen 函數(shù)的簡(jiǎn)單實(shí)現(xiàn) */
size_t strlen (const char * str)
{
const char *eos = str;
while( *eos++ ) ;
return( (int)(eos - str - 1) );
}


答案顯然是否定的,因?yàn)樽址泻?Chr(0),如果像 strlen 這樣實(shí)現(xiàn),那么就會(huì)被 Chr(0) 截?cái)啵琇en 函數(shù)應(yīng)該返回5才對(duì),然而實(shí)際上返回的是11這個(gè)正確的數(shù)字。

VBS 的 Len 函數(shù)內(nèi)部應(yīng)該是這么實(shí)現(xiàn)的:

復(fù)制代碼 代碼如下:


/* 同上,僅為演示 */
size_t Len(const BSTR str)
{
return SysStringLen(str);
}


或者不調(diào)用 Windows API,由于 BSTR 前4個(gè)字節(jié)前綴表示字符串的字節(jié)數(shù)(不包括結(jié)尾的 BUL 字符),所以只要移動(dòng)一下指針就行了:

復(fù)制代碼 代碼如下:


/* 強(qiáng)制轉(zhuǎn)換成int指針減一后讀取,然后除以2(一個(gè)Unicode字符兩字節(jié)) */
size_t Len(const BSTR str)
{
return *((int *)str - 1) / 2;
}


可以看出,由于 BSTR 的長度可以通過前綴取得,并不需要以 NUL 來作為字符串結(jié)束符,也就是說,VBS 字符串是 binary safe (二進(jìn)制安全)的。

那么為什么下面的代碼只能顯示 Hello 呢?

MsgBox str這看起來好像和上面說的矛盾,其實(shí)不然。VBS 字符串的確是兼容 Chr(0) 字符的,MsgBox 之所以會(huì)被 Chr(0) 截?cái)?,是因?yàn)?MsgBox 在內(nèi)部調(diào)用了 MessageBox 函數(shù),而該函數(shù)是以 NUL 作為字符串結(jié)束符的。

復(fù)制代碼 代碼如下:


/* 簡(jiǎn)單起見只實(shí)現(xiàn)一個(gè)參數(shù)
* MessageBox 的第二個(gè)參數(shù)是以 NUL 作為結(jié)束符的
* Pointer to a null-terminated string that contains the message to be displayed.
* 所以 VBS 字符串中包含的 Chr(0) 會(huì)把字符串截?cái)?
*/
int MsgBox(const BSTR str)
{
return MessageBoxW(NULL, str, L"", 0);
}


也就是說,如果 VBS 內(nèi)置的函數(shù)或者 COM 組件的某些方法在其內(nèi)部實(shí)現(xiàn)中調(diào)的 Windows API 的字符串參數(shù)是以 NUL 作為結(jié)束符的話,就會(huì)被 Chr(0) 字符截?cái)唷?br/>

以上是“VBS字符串如何在內(nèi)部實(shí)現(xiàn)”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

vbs
AI