PHP 引用是个坏习惯

PHP 2018-12-30

<div class="codetitle"><a style="CURSOR: pointer" data="63569" class="copybut" id="copybut63569" onclick="doCopy('code63569')"> 代码如下:

<div class="codebody" id="code63569">
function binsearch(&$arr,$key,$value)
{
$low = 0;
$high = count($arr);
while ($low <= $high) {
$mid = floor($low + ($high - $low) / 2);
$item = $arr[$mid][$key];
if ($item == $value) {
return $mid;
} else if ($value > $item) {
$low = $mid + 1;
} else {
$high = $mid - 1;
}
}
return false;
}

在这里，$mid 采用了先减后加的方法计算，目的是为了防止整数的溢出。不是故意写复杂了。
我用下面的代码进行测试：
<div class="codetitle"><a style="CURSOR: pointer" data="55283" class="copybut" id="copybut55283" onclick="doCopy('code55283')"> 代码如下:

<div class="codebody" id="code55283">
$data = array();
for ($i = 0; $i < 1000000; $i++)
{
$data[] = array("sq" => $i * 2);
}
var_dump(binsearch($data,"sq",10000));

发现，binsearch 的时候，总是要花个 0.2s左右。理论上来说，100万的数据，最多也就是循环20次。怎么会这样慢呢。
后来监控了一下内存，data 数组占用了 230M 的内存。而 binsearch 的时候，占用了60K 的内存。但是，理论上来说，binsearch
不应该占用如此多的内存。因为，我觉得，我已经用引用了，根本就没有对data 的结构进行修改。
我也是百思不得其解，后来，我把引用参数去掉，居然 binsearch 只要 0.0002s ，看来是引用耗费了大量的cpu 资源。
PHP 内部遵循一个copy on write 的原则。实际上这个引用是多余的。
但是为什么，加了引用速度会变慢呢？今天重点就谈谈这个问题。明白道理后，大家一定知道怎么用引用了。
如果在binsearch 调用前，直接 $a = &$data，这个引用的速度会非常的快。看来肯定不是引用本身产生的问题。
这个问题，实际上涉及了zend 引擎如何管理PHP变量。
先看下面的问题：
<div class="codetitle"><a style="CURSOR: pointer" data="33257" class="copybut" id="copybut33257" onclick="doCopy('code33257')"> 代码如下:

<div class="codebody" id="code33257">
<?PHP
function demo(&$a,&$b) { $a =& $b; }
$a = 1;
$b = 2;
demo($a,$b);
$b = 3;
print $a;
?>

$a 输出是多少呢？不错，是2. 不过，我一开始觉得是3。
那么怎么解释上面这个问题呢？
实际上，函数的参数引用是这样进行的。
<div class="codetitle"><a style="CURSOR: pointer" data="72777" class="copybut" id="copybut72777" onclick="doCopy('code72777')"> 代码如下:<div class="codebody" id="code72777">
$tmp = $a;
$a1 = &$tmp;
$a = $tmp;
unset($a1,$tmp);

这里，引用的实际上是一个临时变量。这个时候，$tmp 是带引用属性的，而$a 变量不是带引用属性的。
根据zend引擎管理内存的方法，在内部，不能用一个zval 来表示，必须强制分离这个zval。
用这样的理解方法，上面的问题就解决了。函数内部，不会改变函数外部的引用特性。这也是PHP
不赞成用 calltime_by_ref 的原因，而选择上面如此低效的拷贝方法。
下面的分析，也能证明，在传递参数时，的确发生了拷贝。
在 binsearch 函数里面。
$data[0] = 1;
这样，就会发生一次$data 所在zval 的拷贝。内存使用量就是 60K。和函数调用加引用一模一样。
可能很多人会疑问，为什么不是多了230M呢，这其实就是PHP的高明之处，数组Key 对应的是一个zval的指针。（内部是一个哈希表）
所以，只要把这些指针复制一遍就就好了，数据不用复制。但是，100万的PHP 哈希表实际上要占用 50M 内存。为什么只有60K呢。
在 binsearch 函数的外面，运行
<div class="codetitle"><a style="CURSOR: pointer" data="54215" class="copybut" id="copybut54215" onclick="doCopy('code54215')"> 代码如下:<div class="codebody" id="code54215">
$t = $data;
$t[0] = 1;
unset($t);

果然，多了60K 的内存。估计和PHP的内存管理机制有关系。
现在一切都明白了吧！今天，想了好几个小时，才把这个问题想通，不敢独享。
函数中的引用不是给你传参数方便的，而是让你实现，一个函数，可以有多个返回值的，所以，最好不要画蛇添足。
实际上，用引用它会降低性能。

PHP 引用引用引用

Hessian通讯协议【附PHP源代码】

Hessian开源的远程通讯，采用二进制 RPC的协议，基于 HTTP 传输。可以实现PHP调用Java,Python,C#等多语...

初识Mongodb总结

初识Mongodb的一些总结,在Mac Os X下真实搭建mongodb环境,以及分享个Mongodb管理工具,学习期间一些总结...

初识Mongodb之[CURD]-PHP版

边看边操作,这样才能记得牢,实践是检验真理的唯一标准.光看不练假把式,光练不看傻把式,边看边练真把式....

php学习日志 - echo&print

在php中，结果输出一共有两种方式：echo和print，下面将对两种方式做一个比较。 echo与print的区别：（...

The mbstring extension is missing. Please check your PHP configuration错误及解决方法

在安装好wampServer后，一直没有使用phpMyAdmin,今天用了一下，phpMyAdmin显示错误：The mbstring exte...

php学习日志 - php变量

变量是用于存储数据的容器，与代数相似，可以给变量赋予某个确定的值（例如：$x=3）或者是赋予其它的变...

PHP 引用是个坏习惯

相关文章