PHP内核研究:HASH表和变量

8次阅读

PHP HASH 表     在 PHP 中,所有的数据 无论变量,常量,类,属性 都用 Hash 表来实现。
    先要说说 HASH 表
    typedef struct bucket {
    ulong h;                                                /* Used for numeric indexing */
    uint nKeyLength; //key 长度
    void *pData; // 指向 Bucke 保存的数据 指针
    void *pDataPtr; // 指针数据
    struct bucket *pListNext; // 下一个元素指针
    struct bucket *pListLast;// 上一个元素指针
    struct bucket *pNext;
    struct bucket *pLast;
    char arKey[1]; /* Must be last element */
    } Bucket;
    typedef struct _hashtable {
    uint nTableSize;//HashTable 的大小
    uint nTableMask;// 等于 nTableSize-1
    uint nNumOfElements;// 对象个数
    ulong nNextFreeElement;// 指向下一个空元素位置 nTableSize+1
    Bucket *pInternalPointer;       /* Used for element traversal */// 保存当前遍历的指针
    Bucket *pListHead;// 头元素指针
    Bucket *pListTail;// 尾元素指针
    Bucket **arBuckets;// 存储 hash 数组数据
    dtor_func_t pDestructor;// 类似于析构函数
    zend_bool persistent;// 用哪种方法分配内存空间 PHP 统一管理内存还是用普通的 malloc
    unsigned char nApplyCount;// 当前 hash bucket 被访问的次数,是否遍历过数据,防止无限递归循环
    zend_bool bApplyProtection;
    #if ZEND_DEBUG
    int inconsistent;
    #endif
    } HashTable;
    我们结合 HASH 表初始化函数来说
    ZEND_API int _zend_hash_init(HashTable *ht, uint nSize, hash_func_t pHashFunction, dtor_func_t pDestructor, zend_bool persistent ZEND_FILE_LINE_DC)
    {
    uint i = 3;
    Bucket **tmp;
    SET_INCONSISTENT(HT_OK);
    if(nSize >= 0x80000000){//HASH 表大小大于 0x8 则初始化为 0x8
    /* prevent overflow */
    ht->nTableSize = 0x80000000;
    } else {
    while((1U《i)< nSize){// 调整为 2 的 n 次方           i++;       }        ht->nTableSize = 1《i;//HASH bucket 大小    为 2 的 i 次方   i=3 ,nTableSize 最小值为 8
    }
    // 为了提高计算效率,系统自动会将 nTableSize 调整到最小一个不小于 nTableSize 的 2 的整数次方。也就是说,如果在初始化 HashTable 时指定一个 nTableSize 不是 2 的整数次方,系统将会自动调整 nTableSize 的值 <!–EndFragment–>
    ht->nTableMask = ht->nTableSize – 1;
    ht->pDestructor = pDestructor;// 一个函数指针,当 HashTable 发生增,删,改时调用
    ht->arBuckets = NULL;
    ht->pListHead = NULL;
    ht->pListTail = NULL;
    ht->nNumOfElements = 0;
    ht->nNextFreeElement = 0;
    ht->pInternalPointer = NULL;
    ht->persistent = persistent;// 如果 persisient 为 TRUE,则使用操作系统本身的内存分配函数为 Bucket 分配内存,否则使用 PHP 的内存分配函数
    ht->nApplyCount = 0;
    ht->bApplyProtection = 1;
    /* Uses ecalloc()so that Bucket* == NULL */
    if(persistent){  // 操作系统本身内存分配方式分配内存,calloc 分配内存后自动初始化为 0
    tmp =(Bucket **)calloc(ht->nTableSize, sizeof(Bucket *));
    if(!tmp){
    return FAILURE;
    }
    ht->arBuckets = tmp;
    } else {// 用 PHP 的内存管理机制分配内存
    tmp =(Bucket **)ecalloc_rel(ht->nTableSize, sizeof(Bucket *));
    if(tmp){
    ht->arBuckets = tmp;
    }
    }
    // 自动申请一块内存给 arBuckets, 该内存大小等于 nTableSize
    return SUCCESS;
    }
    在读源码的时候 , 经常会看到 EG,PG,CG 这样的宏
    CG 是 compile_global 的简写
    EG 是 excutor_global 的简写
    G 就是全局变量的意思
    我们就以 EG 宏为例
    #ifdef ZTS
    # define EG(v)TSRMG(executor_globals_id, zend_executor_globals *, v)
    #else
    # define EG(v)(executor_globals.v)
    extern ZEND_API zend_executor_globals executor_globals;
    #endif
    很简单 只是一个获取全局变量的宏
    那么我们看看 zend_executor_globals 这个结构体
    在 /Zend/zend.h 里面定义
    typedef struct _zend_executor_globals zend_executor_globals;
    是一个 _zend_executor_globals 的别名
    同一个文件里找到它
    PHP 的所有 局部变量,全局变量,函数,类的 Hash 表 都在这里定义了
    struct _zend_executor_globals {
    zval **return_value_ptr_ptr;
    zval uninitialized_zval;
    zval *uninitialized_zval_ptr;
    zval error_zval;
    zval *error_zval_ptr;
    zend_ptr_stack arg_types_stack;
    /* symbol table cache */
    HashTable *symtable_cache[SYMTABLE_CACHE_SIZE];
    HashTable **symtable_cache_limit;
    HashTable **symtable_cache_ptr;
    zend_op **opline_ptr;
    HashTable *active_symbol_table;  // 局部变量
    HashTable symbol_table; /* main symbol table */ // 全局变量
    HashTable included_files; /* files already included */ //include 的文件
    JMP_BUF *bailout;
    int error_reporting;
    int orig_error_reporting;
    int exit_status;
    zend_op_array *active_op_array;
    HashTable *function_table; /* function symbol table */ // 函数表
    HashTable *class_table; /* class table */ // 类表
    HashTable *zend_constants; /* constants table */ // 常量表
    zend_class_entry *scope;
    zend_class_entry *called_scope; /* Scope of the calling class */
    zval *This;
    long precision;
    int ticks_count;
    zend_bool in_execution;
    HashTable *in_autoload;
    zend_function *autoload_func;
    zend_bool full_tables_cleanup;
    /* for extended information support */
    zend_bool no_extensions;
    #ifdef ZEND_WIN32
    zend_bool timed_out;
    OSVERSIONINFOEX windows_version_info;
    #endif
    HashTable regular_list;
    HashTable persistent_list;
    zend_vm_stack argument_stack;
    int user_error_handler_error_reporting;
    zval *user_error_handler;
    zval *user_exception_handler;
    zend_stack user_error_handlers_error_reporting;
    zend_ptr_stack user_error_handlers;
    zend_ptr_stack user_exception_handlers;
    zend_error_handling_t error_handling;
    zend_class_entry *exception_class;
    /* timeout support */
    int timeout_seconds;
    int lambda_count;
    HashTable *ini_directives;
    HashTable *modified_ini_directives;
    zend_objects_store objects_store;
    zval *exception, *prev_exception;
    zend_op *opline_before_exception;
    zend_op exception_op[3];
    struct _zend_execute_data *current_execute_data;
    struct _zend_module_entry *current_module;
    zend_property_info std_property_info;
    zend_bool active;
    void *saved_fpu_cw;
    void *reserved[ZEND_MAX_RESERVED_RESOURCES];
    };
    这里先简单看看,以后用到的时候再细说,
    PHP 里最基本的单元 变量:
    在 PHP 里 定义一个变量 再简单不过了
    如
    <?php
    $a=1;
    ?>
    但是在内核中 它是用一个 zval 结构体实现的
    如上面定义变量 在内核中则执行了下面这些代码
    zval *val;
    MAKE_STD_ZVAL(val);  // 申请一块内存
    ZVAL_STRING(val,"hello",1);// 用 ZVAL_STRING 设置它的值为 "hello"
    ZEND_SET_SYMBOL(EG(active_symbol_table),"a",val));// 将   val 指针加入到符号表里面去
    宏 MAKE_STD_ZVAL 定义如下
    #define MAKE_STD_ZVAL(zv)                                \
    ALLOC_ZVAL(zv);\  // 它归根到底等于(p)=(type *)emalloc(sizeof(type))
    INIT_PZVAL(zv);
    INIT_PZVAL 定义在
    #define INIT_PZVAL(z)           \ 看得出它是初始化参数
   (z)->refcount__gc = 1;  \
   (z)->is_ref__gc = 0;
    那么 zval 到底是什么呢
    在 zend/zend.h 里面
    typedef struct _zval_struct zval; // 原来它是 _zval_struct 的别名
    _zval_struct 定义如下
    typedef union _zvalue_value {
    long lval;  // 保存 long 类型的数据
    double dval; // 保存 double 类型的数据
    struct {
    char *val; // 真正的值在这里
    int len;   // 这里返回长度
    } str;
    HashTable *ht;
    zend_object_value obj; // 这是一个对象
    } zvalue_value;
    struct _zval_struct {
    zvalue_value value;             // 保存的值
    zend_uint refcount__gc;// 被引用的次数 如果为 1 则只被自己使用如果大于 1 则被其他变量以 & 的形式引用。
    zend_uchar type;       // 数据类型 这也是 为什么 PHP 是弱类型的原因
    zend_uchar is_ref__gc;  // 表示是否为引用
    };
    如果还是不够清楚那么我们实战一下用 C 来创建一个 PHP 变量
    这里需要一个扩展,PHP 如果用 C 扩展模块 这里就不说了
    关键代码
    PHP_FUNCTION(test_siren){
    zval *value;
    char *s="create a php variable";
    value=(zval*)malloc(sizeof(zval));
    memset(value,0,sizeof(value));
    value->is_ref__gc=0; // 非引用变量
    value->refcount__gc=1;// 引用次数 只有自己
    value->type=IS_STRING;// 类型为字符串
    value->value.str.val=s;// 值
    value->value.str.len=strlen(s);// 长度
    ZEND_SET_SYMBOL(EG(active_symbol_table),"a",value);
    }
    第三行和第四行的作用 与 MAKE_STD_ZVAL 的作用相同,给 value 分配内存空间
    第 5 - 9 行 的作用与 ZVAL_STRING 的作用相同,
    最后一行 是将 value 创建一个 在 PHP 里叫 $a 的变量并添加到局部 Hash 表里
    这样 在 PHP 里
    <?php
    test_siren(1);
    echo $a;
    ?>
    就会输出 “create a php variable”
    OK,
    大功告成
    注意,我是为了让大家看到 PHP 内部创建变量的流程 才采用 C 的形式创建变量,
    绝对不推荐大家这样做。
    还是一定要用 PHP 内部的内存管理机制分配并处理内存。

正文完