msgbartop
PHP语言, PHP扩展, Zend引擎相关的研究,技术,新闻分享 – 左手代码 右手诗
msgbarbottom

18 Jun 08 深入理解PHP原理之Opcodes

最近要给Yahoo的同事们做一个关于PHP和Apache处理请求的内部机制的讲座,刚好写了些关于Opcodes的文字,就发上来了,这个文章基于 Sara Golemon大师的《Understanding OPcode》

Opcode是一种PHP脚本编译后的中间语言,就像Java的ByteCode,或者.NET的MSL,举个例子,比如你写下了如下的PHP代码:

 <?php
   echo "Hello World";
   $a = 1 + 1;
   echo $a;
?>

PHP执行这段代码会经过如下4个步骤(确切的来说,应该是PHP的语言引擎Zend)

1.Scanning(Lexing) ,将PHP代码转换为语言片段(Tokens)
2.Parsing, 将Tokens转换成简单而有意义的表达式
3.Compilation, 将表达式编译成Opocdes
4.Execution, 顺次执行Opcodes,每次一条,从而实现PHP脚本的功能。

题外话:现在有的Cache比如APC,可以使得PHP缓存住Opcodes,这样,每次有请求来临的时候,就不需要重复执行前面3步,从而能大幅的提高PHP的执行速度。

那什么是Lexing? 学过编译原理的同学都应该对编译原理中的词法分析步骤有所了解,Lex就是一个词法分析的依据表。 Zend/zend_language_scanner.c会根据Zend/zend_language_scanner.l(Lex文件),来输入的 PHP代码进行词法分析,从而得到一个一个的“词”,PHP4.2开始提供了一个函数叫token_get_all,这个函数就可以讲一段PHP代码 Scanning成Tokens;
如果用这个函数处理我们开头提到的PHP代码,将会得到如下结果:

Array
(
    [0] => Array
        (
           [0] => 367
           [1] =>  Array
        (
            [0] => 316
            [1] => echo
        )
    [2] => Array
        (
            [0] => 370
            [1] =>
        )
    [3] => Array
        (
            [0] => 315
            [1] => "Hello World"
        )
    [4] => ;
    [5] => Array
        (
            [0] => 370
            [1] =>
        )
    [6] => =
    [7] => Array
        (
            [0] => 370
            [1] =>
        )
    [8] => Array
        (
            [0] => 305
            [1] => 1
        )
    [9] => Array
        (
            [0] => 370
            [1] =>
        )
    [10] => +
    [11] => Array
        (
            [0] => 370
            [1] =>
        )
    [12] => Array
        (
            [0] => 305
            [1] => 1
        )
    [13] => ;
    [14] => Array
        (
            [0] => 370
            [1] =>
        )
    [15] => Array
        (
            [0] => 316
            [1] => echo
        )
    [16] => Array
        (
            [0] => 370
            [1] =>
        )
    [17] => ;
)

分析这个返回结果我们可以发现,源码中的字符串,字符,空格,都会原样返回。每个源代码中的字符,都会出现在相应的顺序处。而,其他的比如标签,操作符,语句,都会被转换成一个包含俩部分的Array: Token ID (也就是在Zend内部的改Token的对应码,比如,T_ECHO,T_STRING),和源码中的原来的内容。
接下来,就是Parsing阶段了,Parsing首先会丢弃Tokens Array中的多于的空格,然后将剩余的Tokens转换成一个一个的简单的表达式

1.echo a constant string
2.add two numbers together
3.store the result of the prior expression to a variable
4.echo a variable

然后就改Compilation阶段了,它会把Tokens编译成一个个op_array, 每个op_arrayd包含如下5个部分:

1.Opcode数字的标识,指明了每个op_array的操作类型,比如add , echo
2.结果       存放Opcode结果
3.操作数1  给Opcode的操作数
4.操作数2
5.扩展值   1个整形用来区别被重载的操作符

比如,我们的PHP代码会被Parsing成:

* ZEND_ECHO     'Hello World'
* ZEND_ADD       ~0 1 1
* ZEND_ASSIGN  !0 ~0
* ZEND_ECHO     !0

呵呵,你可能会问了,我们的$a去那里了?

恩,这个要介绍操作数了,每个操作数都是由以下俩个部分组成:

a)op_type : 为IS_CONST, IS_TMP_VAR, IS_VAR, IS_UNUSED, or IS_CV

b)u,一个联合体,根据op_type的不同,分别用不同的类型保存了这个操作数的值(const)或者左值(var)

而对于var来说,每个var也不一样

IS_TMP_VAR, 顾名思义,这个是一个临时变量,保存一些op_array的结果,以便接下来的op_array使用,这种的操作数的u保存着一个指向变量表的一个句柄(整数),这种操作数一般用~开头,比如~0,表示变量表的0号未知的临时变量

IS_VAR 这种就是我们一般意义上的变量了,他们以$开头表示

IS_CV 表示ZE2.1/PHP5.1以后的编译器使用的一种cache机制,这种变量保存着被它引用的变量的地址,当一个变量第一次被引用的时候,就会被CV起来,以后对这个变量的引用就不需要再次去查找active符号表了,CV变量以!开头表示。

这么看来,我们的$a被优化成!0了。


分享到:



Related Posts:

Tags: ,

69 Responses to “深入理解PHP原理之Opcodes”

Pages: [2] 1 » Show All

  1. Julieget |

    Hello friends!
    I am an official representative of private company which deals with all kinds of written work (essay, coursework, dissertation, presentation, report, etc) in short time.
    We are ready to offer a free accomplishment of written work hoping for further cooperation and honest feedback about our service.
    Send your work topics to our email: discount@edu-paper.com. This offer has limited quantities!!!

  2. Latasha |

    If my problem was a Death Star, this article is a photon tordepo.

  3. 深入理解PHP原理之异常机制及错误处理机制 | WE ARE PERSI |

    [...] Array中最后动态的生成一个ZEND_HANDLE_EXCEPTION opline,关于Opcode请看这深入理解PHP原理之Opcodes 当抛出异常的时候就会执行到该OP Array 中最后一条的ZEND_HANDLE_EXCEPTION [...]

  4. corporate gifts |

    Once you slip the papers inside, dipping the cookies in melted pastel candy
    coating will make for an easy yet adorable shower gift for guests.
    The company will accommodate the holiday spirit enjoyed
    by most people near the end of the year:. Some of the main forms of biometrics
    are related to the shape of the body.

  5. shyandsy |

    学习了

  6. 定制自己的PHP语法-在PHP中实现unless – 广宣天地 |

    [...] 如果你是不了解PHP的执行过程, 请先花点时间看看我之前的文章深入理解PHP原理之Opcodes: [...]

  7. PHP 最佳实践(转) | 极客绝影的博客 |

    [...] Laruence:深入理解 PHP 原理之 Opcodes [...]

  8. 风雪之隅-鸟哥文章汇总 | 互联网菜鸟 |

    [...] Jun 08 深入理解PHP原理之Opcodes if (typeof DUOSHUO !== 'undefined') DUOSHUO.EmbedThread('.ds-thread'); [...]

  9. domain |

    Oh my goodness! Impressive article dude! Thank you, However
    I am experiencing difficulties with your RSS. I don’t know the reason why I cannot join it.
    Is there anyone else having similar RSS problems?
    Anybody who knows the answer will you kindly respond?
    Thanx!!

  10. 梦康 |

    迷迷糊糊好像大概是看懂了,就是好多错别字,哈哈哈。

  11. 扩展PHP[Extending PHP](一)[转] | 屎壳君的博客 |

    [...] 你所编写的脚本,最终都会被转换成C代码来执行。 这个和我在以前文章中(深入理解PHP原理之Opcodes)介绍的opcode并不冲突, [...]

  12. Mcrypt响应慢的一个原因[转] | 屎壳君的博客 |

    [...] 你所编写的脚本,最终都会被转换成C代码来执行。 这个和我在以前文章中(深入理解PHP原理之Opcodes)介绍的opcode并不冲突, [...]

  13. 一个引用造成的血案, $a = &$b | Weizhao |

    [...] 地址是”深入原理之Opcodes” [...]

  14. 定制自己的PHP语法-在PHP中实现unless | Handhoop |

    [...] 如果你是不了解PHP的执行过程, 请先花点时间看看我之前的文章深入理解PHP原理之Opcodes: [...]

  15. (转) 深入理解PHP原理之变量(Variables inside PHP) - 码农@师帅 |

    [...] 深入理解PHP原理之Opcodes [...]

  16. PHP Opcode 缓存之APC | William Sang |

    [...] Opcode是一种PHP脚本编译后的中间语言,就像Java的ByteCode,或者.NET的MSL。如果想详细了解可以参考: 深入理解PHP原理之Opcodes [...]

  17. 关于 PHP 中巨型数据对象的内存开销问题的研究 | 技术控 |

    [...] 关于opcode更多可以点我 [...]

  18. http://shinningwatchss.blinkweb.com |

    Hi there, constantly i used to check web site posts here
    in the early hours in the morning, because i enjoy to find out more and more.

  19. 关于 PHP 中巨型数据对象的内存开销问题的研究 - php - 开发者问答 |

    [...] 关于opcode更多可以点我 [...]

  20. 深入理解PHP原理之Opcodes (转) | 单纯☆风的博客 |

    [...] 本文地址: http://www.laruence.com/2008/06/18/221.html [...]

Pages: [2] 1 » Show All

Leave a Reply

*