粗略估算PHP數(shù)組占用內(nèi)存的大小的分析
我們提到php高效寫法,盡量不要復(fù)制變量,特別是數(shù)組。一般來說,PHP數(shù)組的內(nèi)存利用率只有 1/10, 也就是說,一個(gè)在C語言里面100M 內(nèi)存的數(shù)組,在PHP里面就要1G。下面我們可以粗略的估算PHP數(shù)組占用內(nèi)存的大小,首先我們測(cè)試1000個(gè)元素的整數(shù)占用的內(nèi)存:
<?php ?
? ?echo memory_get_usage() , '
'; ?
? ?$start = memory_get_usage(); ?
? ?$a = Array(); ?
? ?for ($i=0; $i<1000; $i++) { ?
? ?$a[$i] = $i + $i; ?
? ?} ?
? ?$mid = ?memory_get_usage(); ?
? ?echo memory_get_usage() , '
'; ?
? ?for ($i=1000; $i<2000; $i++) { ?
? ?$a[$i] = $i + $i; ?
? ?} ?
? ?$end = ?memory_get_usage(); ?
? ?echo memory_get_usage() , '
'; ?
? ?echo 'argv:', ($mid - $start)/1024 ,'kb' , '
'; ?
? ?echo 'argv:',($end - $mid)/1024 ,'kb' , '
'; ?
輸出是:
350752
435248
519424
argv:84.416byte
argv:84.176byte
大概了解1000 個(gè)元素的整數(shù)數(shù)組需要占用 82k 內(nèi)存,平均每個(gè)元素占用 84 個(gè)字節(jié)。而純 C 中整體只需要 4k(一個(gè)整型占用4byte * 1000 )。memory_get_usage() 返回的結(jié)果并不是全是被數(shù)組占用了,還要包括一些 PHP 運(yùn)行本身分配的一些結(jié)構(gòu),可能用內(nèi)置函數(shù)生成的數(shù)組更接近真實(shí)的空間:
<?php ?
? ?$start = memory_get_usage(true); ?
? ?$a = array_fill(0, 10000, 1); ?
? ?$mid = memory_get_usage(true); //10k elements array; ?
? ?echo 'argv:', ($mid - $start )/10000,'byte' , '
'; ?
? ?$b = array_fill(0, 10000, 1); ?
? ?$end = memory_get_usage(true); //10k elements array; ?
? ?echo 'argv:', ($end - $mid)/10000 ,'byte' , '
'; ?
得到:
argv:54.5792byte
argv:54.5792byte
從這個(gè)結(jié)果來看似乎一個(gè)數(shù)組元素大約占用了54個(gè)左右的字節(jié)。再看看數(shù)組在Zend里面的C結(jié)構(gòu),PHP中的數(shù)組變量,首先需要一個(gè) zval 結(jié)構(gòu):
struct _zval_struct {
? ?zvalue_value value;
? ?zend_uint refcount__gc;
? ?zend_uchar type;
? ?zend_uchar is_ref__gc;
};
zvalue_value 是一個(gè)union:
typedef union _zvalue_value {
? ?long lval;
? ?double dval;
? ?struct {
? ? ? ?char *val;
? ? ? ?int len;
? ?} str;
? ?HashTable *ht;
? ?zend_object_value obj;
} zvalue_value;
通常 zval 結(jié)構(gòu)需要 8+6=14 個(gè)字節(jié),PHP中每個(gè)變量都有對(duì)應(yīng)的 zval,但是數(shù)組,字符串和對(duì)象還需要另外的存儲(chǔ)結(jié)構(gòu),而數(shù)組則是一個(gè) HashTable :
typedef struct _hashtable {
? ? uint nTableSize;
? ? uint nTableMask;
? ? uint nNumOfElements;
? ? ulong nNextFreeElement;
? ? Bucket *pInternalPointer;
? ? Bucket *pListHead;
? ? Bucket *pListTail;
? ? Bucket **arBuckets;
? ? dtor_func_t pDestructor;
? ? zend_bool persistent;
? ? unsigned char nApplyCount;
? ? zend_bool bApplyProtection;
} HashTable;
HashTable 結(jié)構(gòu)需要 40 個(gè)字節(jié),每個(gè)數(shù)組元素存儲(chǔ)在 Bucket 結(jié)構(gòu)中:
typedef struct bucket {
? ? ulong h;
? ? uint nKeyLength;
? ? void *pData;
? ? void *pDataPtr;
? ? struct bucket *pListNext;
? ? struct bucket *pListLast;
? ? struct bucket *pNext;
? ? struct bucket *pLast;
? ? char arKey[1];
} Bucket;
Bucket 結(jié)構(gòu)需要 36 個(gè)字節(jié),鍵長(zhǎng)超過四個(gè)字節(jié)的部分附加在 Bucket 后面,而元素值很可能是一個(gè) zval 結(jié)構(gòu),另外每個(gè)數(shù)組會(huì)分配一個(gè)由 arBuckets 指向的 Bucket 指針數(shù)組, 雖然不能說每增加一個(gè)元素就需要一個(gè)指針,但是實(shí)際情況可能更糟。這么算來一個(gè)數(shù)組元素就會(huì)占用 54 個(gè)字節(jié),與上面的估算幾乎一樣。
? ? 一個(gè)空數(shù)組至少會(huì)占用 14(zval) + 40(HashTable) + 32(arBuckets) = 86 個(gè)字節(jié),作為一個(gè)變量應(yīng)該在符號(hào)表中有個(gè)位置,也是一個(gè)數(shù)組元素,因此一個(gè)空數(shù)組變量需要 118 個(gè)字節(jié)來描述和存儲(chǔ)。從空間的角度來看,小型數(shù)組平均代價(jià)較大,當(dāng)然一個(gè)腳本中不會(huì)充斥數(shù)量很大的小型數(shù)組,可以以較小的空間代價(jià)來獲取編程上的快捷。但如果將數(shù)組當(dāng)作容器來使用就是另一番景象了,實(shí)際應(yīng)用經(jīng)常會(huì)遇到多維數(shù)組,而且元素居多。比如10k個(gè)元素的一維數(shù)組大概消耗540k內(nèi)存,而10k x 10 的二維數(shù)組理論上只需要 6M 左右的空間,但是按照 memory_get_usage 的結(jié)果則兩倍于此,[10k,5,2]的三維數(shù)組居然消耗了23M,小型數(shù)組果然是劃不來的。