msgbartop
PHP语言, PHP扩展, Zend引擎相关的研究,技术,新闻分享 – 左手代码 右手诗
msgbarbottom

22 Aug 08 深入理解PHP原理之变量(Variables inside PHP)

或许你知道,或许你不知道,PHP是一个弱类型,动态的脚本语言。所谓弱类型,就是说PHP并不严格验证变量类型(严格来讲,PHP是一个中强类型语言,这部分内容会在以后的文章中叙述),在申明一个变量的时候,并不需要显示指明它保存的数据的类型:

<?php
  $var = 1; //int
  $var = "laruence"; //string
  $var = 1.0002; //float
  $var = array(); // array
  $var = new Exception('error'); //object;

动态语言,就是说,PHP的语言结构在运行期是可以改变的,比如我们在运行期require一个函数定义文件,从而导致语言的函数表动态的改变。
所谓脚本语言,就是说,PHP并不是独立运行的,要运行PHP我们需要PHP解析器:

  /usr/bin/php -f example.php

我前面的文章中已经讲过,PHP的执行是通过Zend engine(ZE, Zend引擎), ZE是用C编写的,大家都知道C是一个强类型语言,也就是说,在C中所有的变量在它被声明到最终销毁,都只能保存一种类型的数据。 那么PHP是如何在ZE的基础上实现弱类型的呢?

首先要声明一点,如果你以前没有接触过PHP的源码分析,扩展开发。 如果你并不了解PHP的架构, 没有听说ZE,那么我建议你先看看我前面的文章,尤其推荐:

  • 深入浅出PHP(PHP Internals)
  • 深入理解PHP原理之Opcodes
  • 在PHP中,所有的变量都是用一个结构-zval来保存的, 在Zend/zend.h中我们可以看到zval的定义:

      typedef struct _zval_struct {
        zvalue_value value;
        zend_uint refcount;
        zend_uchar type;
        zend_uchar is_ref;
      } zval;
     

    其中zvalue_value是真正保存数据的关键部分,现在到了揭晓谜底的时候了,PHP是如何在ZE的基础上实现弱类型的呢? 因为zvalue_value是个联合体(union),

    typedef union _zvalue_value {
        long lval;
        double dval;
        struct {
            char *val;
            int len;
        } str;
        HashTable *ht;
        zend_object_value obj;
    } zvalue_value;
    

    那么这个结构是如何储存PHP中的多种类型的呢?
    PHP中常见的变量类型有:

    1. 整型/浮点/长整型/bool值 等等
    2. 字符串
    3. 数组/关联数组
    4. 对象
    5. 资源
      

    PHP根据zval中的type字段来储存一个变量的真正类型,然后根据type来选择如何获取zvalue_value的值,比如对于整型和bool值:

       zval.type = IS_LONG;//整形
       zval.type = IS_BOOL;//布尔值
    

    就去取zval.value.lval,对于bool值来说lval∈(0|1);
    如果是双精度,或者float则会去取zval.value的dval。
    而如果是字符串,那么:

       zval.type = IS_STRING
    

    这个时候,就会取:
    zval.value.str
    而这个也是个结构,存有C分格的字符串和字符串的长度。

    而对于数组和对象,则type分别对应IS_ARRAY, IS_OBJECT, 相对应的则分别取zval.value.ht和obj

    比较特别的是资源,在PHP中,资源是个很特别的变量,任何不属于PHP内建的变量类型的变量,都会被看作成资源来进行保存,比如,数据库句柄,打开的文件句柄等等。 对于资源:

       type = IS_RESOURCE
    

    这个时候,会去取zval.value.lval, 此时的lval是个整型的指示器, 然后PHP会再根据这个指示器在PHP内建的一个资源列表中查询相对应的资源(这部分的内容,我以后会单独开一个篇文章来介绍),目前,你只要知道此时的lval就好像是对应于资源链表的偏移值。

     ZEND_FETCH_RESOURCE(con, type, zval *, default, resource_name, resource_type);
    

    借用这样的机制,PHP就实现了弱类型,因为对于ZE的来说,它所面对的永远都是同一种类型,那就是zval。
    ps:明天team出去building,我想着应该在走之前写点东西给我的blog reader来消磨周末。今天就简单先开个头,下一次,我将进一步介绍PHP的变量,作用域,以及变量的copy on write和change on write机制, 待续….


    分享到:



    Related Posts:

    Tags: , , ,

    19 Responses to “深入理解PHP原理之变量(Variables inside PHP)”

    Pages: [2] 1 » Show All

    1. 深入理解PHP原理之变量(Variables inside PHP) | warpig_allen's blog |

      [...] 本文地址: http://www.laruence.com/2008/08/22/412.html [...]

    2. 雪候鸟 |

      @Forever 不是结构体, 是union ;)

    3. Forever |

      照这样说每个变量占用的内存都比较大,因为它是结构体类型啊。结构体占用的内存不是所有类型加起来的嘛

    4. liano |

      牛人啊,我现在在学php能否给我个联系地址请教你一下啊?
      qq:584418561

    5. HorseLuke@微碌 » Blog Archive » php缓存扩展频繁存储/读取数组引发CPU过高问题排查手记(php-memcache为例) |

      [...] [2]laruence. 深入理解PHP原理之变量(Variables inside PHP):http://www.laruence.com/2008/08/22/412.html [...]

    6. 51nosql |

      向大牛学习,关注

    7. 关于引用的一个小问题。。。散分。。 - PHP常见问题 - [标签:tags] - 开源网 | 123Doing |

      [...] 如果你在php4和php5中分别执行上述代码,则php4 得到 21php5 得到 22 unset只是将$t指向的zval结构体的refcount – 1,然后清除符号表里的’t',去除$t与zval的关联但是$s仍然是关联zval的。我说不明白,有一篇高手写的文章专门讲这个的,在本坛我贴出来不少次了,你认真看看。http://www.laruence.com/2008/08/22/412.html 关键是这篇http://www.laruence.com/2008/09/19/520.html然后再结合php的GC原理会更深入一些。http://www.php.net/manual/en/features.gc.refcounting-basics.php [...]

    8. (转)深入理解PHP原理之变量分离/引用(Variables Separation) » Creative Power |

      [...] 在前面的文章中我已经介绍了PHP的变量的内部表示(深入理解PHP原理之变量(Variables inside PHP)),以及PHP中作用域的实现机制(深入理解PHP原理之变量作用域(Scope inside PHP))。这节我们就接着前面的文章,继续介绍PHP中变量分离和引用的概念: [...]

    9. 关于引用的一个小问题。。。散分。。 - PHP常见问题 - 关于引用 一个小问题 散分 PHP 基础编程 - 123Doing |

      [...] unset只是将$t指向的zval结构体的refcount – 1,然后清除符号表里的’t',去除$t与zval的关联但是$s仍然是关联zval的。我说不明白,有一篇高手写的文章专门讲这个的,在本坛我贴出来不少次了,你认真看看。http://www.laruence.com/2008/08/22/412.html [...]

    Pages: [2] 1 » Show All

    Leave a Reply

    *