溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

PHP數(shù)組內(nèi)存利用率低和弱類型的示例分析

發(fā)布時(shí)間:2021-07-01 11:57:28 來源:億速云 閱讀:129 作者:小新 欄目:開發(fā)技術(shù)

這篇文章給大家分享的是有關(guān)PHP數(shù)組內(nèi)存利用率低和弱類型的示例分析的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過來看看吧。

這兩天任務(wù)提前完成,可以喘口氣沉淀一下,深入學(xué)習(xí)學(xué)習(xí)PHP。其實(shí)本來是想了解一下PHP性能優(yōu)化相關(guān)的東西,但被網(wǎng)上的一句“PHP數(shù)組內(nèi)存利用率低,C語言100MB的內(nèi)存數(shù)組,PHP里需要1G”驚到了。PHP真的這么耗內(nèi)存么?于是借此機(jī)會(huì)了解了PHP的數(shù)據(jù)類型實(shí)現(xiàn)方式。

先來做個(gè)測(cè)試:

<?php 
  echo memory_get_usage() , '<br>'; 
  $start = memory_get_usage(); 
  $a = Array(); 
  for ($i=0; $i<1000; $i++) { 
   $a[$i] = $i + $i; 
  } 
  $end = memory_get_usage(); 
  echo memory_get_usage() , '<br>'; 
  echo 'argv:', ($end - $start)/1000 ,'bytes' , '<br>';

所得結(jié)果:

    353352
    437848
    argv:84.416bytes

1000個(gè)元素的整數(shù)數(shù)組耗費(fèi)內(nèi)存(437848 - 353352)字節(jié),約合82KB,也就是說每個(gè)元素所占內(nèi)存84字節(jié)。在C語言中,一個(gè)int占位是4字節(jié),整體相差了20倍。

但是網(wǎng)上又說memery_get_usage()返回的結(jié)果不全是數(shù)組占用,還包括PHP本身的一些結(jié)構(gòu),因此,換種方式,采用PHP內(nèi)置函數(shù)生成數(shù)組試試:

<?php 
  $start = memory_get_usage(); 
  $a = array_fill(0, 10000, 1); 
  $end = memory_get_usage(); //10k elements array; 
  echo 'argv:', ($end - $start )/10000,'byte' , '<br>';

 輸出為:

argv:54.5792byte

比剛才略好,但也54字節(jié),確實(shí)差了10倍左右。

究其原因,還得從PHP的底層實(shí)現(xiàn)說起。PHP是一種弱類型的語言,不分int,double,string之類的,統(tǒng)一一個(gè)'$'就能解決所有問題。PHP底層由C語言實(shí)現(xiàn),每個(gè)變量都對(duì)應(yīng)一個(gè)zval結(jié)構(gòu),其詳細(xì)定義為:

typedef struct _zval_struct zval; 
struct _zval_struct { 
  /* Variable information */ 
  zvalue_value value;   /* The value 1 12字節(jié)(32位機(jī)是12,64位機(jī)需要8+4+4=16) */ 
  zend_uint refcount__gc; /* The number of references to this value (for GC) 4字節(jié) */ 
  zend_uchar type;    /* The active type 1字節(jié)*/ 
  zend_uchar is_ref__gc; /* Whether this value is a reference (&) 1字節(jié)*/ 
};

PHP使用union結(jié)構(gòu)來存儲(chǔ)變量的值,zval中zvalue_value類型的value變量即為一個(gè)union,定義如下:

typedef union _zvalue_value { 
  long lval;         /* long value */ 
  double dval;        /* double value */ 
  struct {          /* string value */ 
    char *val; 
    int len; 
  } str;  
  HashTable *ht;       /* hash table value */ 
  zend_object_value obj;   /*object value */ 
} zvalue_value;

union類型占用內(nèi)存的大小有其最大的成員所占的數(shù)據(jù)空間決定。在zvalue_value中,str結(jié)構(gòu)體的int占4字節(jié),char指針占4字節(jié),故整個(gè)zvalue_value所占內(nèi)存為8字節(jié)。

zval的大小即為8 + 4 + 1 + 1 = 14字節(jié)。

注意到zvalue_value中還有一個(gè)HashTable是做什么的?zval中,數(shù)組、字符串和對(duì)象還需要另外的存儲(chǔ)結(jié)構(gòu),數(shù)組的存儲(chǔ)結(jié)構(gòu)即為HashTable。

HashTable定義給出:

typedef struct _hashtable { 
   uint nTableSize; //表長度,并非元素個(gè)數(shù) 
   uint nTableMask;//表的掩碼,始終等于nTableSize-1 
   uint nNumOfElements;//存儲(chǔ)的元素個(gè)數(shù) 
   ulong nNextFreeElement;//指向下一個(gè)空的元素位置 
   Bucket *pInternalPointer;//foreach循環(huán)時(shí),用來記錄當(dāng)前遍歷到的元素位置 
   Bucket *pListHead; 
   Bucket *pListTail; 
   Bucket **arBuckets;//存儲(chǔ)的元素?cái)?shù)組 
   dtor_func_t pDestructor;//析構(gòu)函數(shù) 
   zend_bool persistent;//是否持久保存。從這可以發(fā)現(xiàn),PHP數(shù)組是可以實(shí)現(xiàn)持久保存在內(nèi)存中的,而無需每次請(qǐng)求都重新加載。 
   unsigned char nApplyCount; 
   zend_bool bApplyProtection; 
} HashTable;

除了幾個(gè)記錄table大小,所含元素?cái)?shù)量的屬性變量外,Bucket被多次使用到,Bucket是如何定義的:

typedef struct bucket { 
   ulong h; //數(shù)組索引 
   uint nKeyLength; //字符串索引的長度 
   void *pData; //實(shí)際數(shù)據(jù)的存儲(chǔ)地址 
   void *pDataPtr; //引入的數(shù)據(jù)存儲(chǔ)地址 
   struct bucket *pListNext; 
   struct bucket *pListLast; 
   struct bucket *pNext; //雙向鏈表的下一個(gè)元素的地址 
   struct bucket *pLast;//雙向鏈表的下一個(gè)元素地址 
   char arKey[1]; /* Must be last element */ 
} Bucket;

有點(diǎn)像一個(gè)鏈表,Bucket就像是一個(gè)鏈表節(jié)點(diǎn),有具體的數(shù)據(jù)和指針,而HashTable就是一個(gè)array,保存著一串Bucket元素。PHP中多維數(shù)組的實(shí)現(xiàn),不過就是Bucket里面存著另一個(gè)HashTable罷了。

算一算HashTable需要占用39個(gè)字節(jié),Bucket需要33個(gè)字節(jié)。一個(gè)空的數(shù)組就需要占用14 + 39 + 33 = 86個(gè)字節(jié)。Bucket 結(jié)構(gòu)需要 33 個(gè)字節(jié),鍵長超過四個(gè)字節(jié)的部分附加在 Bucket 后面,而元素值很可能是一個(gè) zval 結(jié)構(gòu),另外每個(gè)數(shù)組會(huì)分配一個(gè)由 arBuckets 指向的 Bucket 指針數(shù)組, 雖然不能說每增加一個(gè)元素就需要一個(gè)指針,但是實(shí)際情況可能更糟。這么算來一個(gè)數(shù)組元素就會(huì)占用 54 個(gè)字節(jié),與上面的估算幾乎一樣。

從空間的角度來看,小型數(shù)組平均代價(jià)較大,當(dāng)然一個(gè)腳本中不會(huì)充斥數(shù)量很大的小型數(shù)組,可以以較小的空間代價(jià)來獲取編程上的快捷。但如果將數(shù)組當(dāng)作容器來使用就是另一番景象了,實(shí)際應(yīng)用經(jīng)常會(huì)遇到多維數(shù)組,而且元素居多。比如10k個(gè)元素的一維數(shù)組大概消耗540k內(nèi)存,而10k x 10 的二維數(shù)組理論上只需要 6M 左右的空間,但是按照 memory_get_usage 的結(jié)果則兩倍于此,[10k,5,2]的三維數(shù)組居然消耗了23M,小型數(shù)組確實(shí)是劃不來的。

感謝各位的閱讀!關(guān)于“PHP數(shù)組內(nèi)存利用率低和弱類型的示例分析”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí),如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

php
AI