国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發 > PHP > 正文

遭遇php的in_array低性能問題

2024-05-04 23:12:52
字體:
來源:轉載
供稿:網友

PHP的性能一直在提高。然而,若是用的不恰當,或是一個不留神,還是可能會踩到PHP內部實現方面的坑的。我在前幾天的一個性能問題上就碰到了。

事情是這樣子的,一位同事反饋我們的一個接口每次返回需要5秒之久,我們一起review了代碼,“驚喜”的發現居然在循環(大約900次)中調用了一個讀緩存的操作,而這個緩存的key并沒有改變,因此我們把這段代碼移到了循環外面,再測,接口返回時間降到了2秒,嗚呼!雖然提升了1倍,但明顯不是我們能接受的結果!
出現性能問題的代碼量并不大,我們排除了IO問題以后,寫了一段測試代碼,果然問題很快重現。

復制代碼 代碼如下:


<?php
$y="1800";
$x = array();
for($j=0;$j<2000;$j++){
$x[]= "{$j}";
}

for($i=0;$i<3000;$i++){
if(in_array($y,$x)){
continue;
}
}
?>



shell$ time /usr/local/php/bin/php test.php

real 0m1.132s
user 0m1.118s
sys 0m0.015s

對的,我們用的就是字符串型的數字,從緩存拿出來就是這樣子的啦!所以這里是特意轉成字符串的(如果直接是數字,并不會出現這個問題 ,各位可以自行驗證)。可以看出時間耗掉了1秒,才3000次循環,后面的sys用時也注定我們用strace不會拿到什么有效信息。

shell$ strace -ttt -o xxx /usr/local/php/bin/php test.php
shell$ less xxx

遭遇php的in_array低性能問題



我們只看到這兩次系統調用之間的延時非常大,卻并不知道干了什么?一籌莫展了,幸好,Linux下的調試利器除了strace還有ltrace(當然還有dtrace,ptrace,不在本文討論范圍了,略去)。

引用:strace用來 跟蹤一個進程的系統調用或信號產生的情況,而 ltrace用來 跟蹤進程調用庫函數的情況(via IBM developerworks)。

為了排除干擾因素,我們將$x直接賦值為array(“0″,”1″,”2″,……)的形式,避免過多的malloc調用影響結果。執行

shell$ ltrace -c /usr/local/php/bin/php test.php

如圖2

遭遇php的in_array低性能問題




我們看到庫函數__strtol_internal的調用非常之頻繁,達到了94%,太夸張了,然后我又查了一下這個庫函數__strtol_internal是干嘛的,原來是strtol的別名,簡單的說就是把字符串轉換成長整形,可以猜測PHP引擎已經檢測到這是一個字符串型的數字,所以期望將他們轉換成長整型來比較,這個轉換過程中消耗了太多時間,我們再次執行:

復制代碼 代碼如下:


shell$ ltrace -e "__strtol_internal" /usr/local/php/bin/php test.php



可以輕松抓到大量下圖這樣的調用,到此,問題找到了,in_array這種松比較,會將兩個字符型數字串先轉換為長整型再進行比較,卻不知性能就耗在這上面了。

遭遇php的in_array低性能問題



知道了癥結所在,我們解決的辦法就很多了,最簡單的就是為in_array加第三個參數為true,即變為嚴格比較,同時還要比較類型,這樣避免了PHP自作聰明的轉換類型,跑起來果然快多了,代碼如下:

復制代碼 代碼如下:


<?php
$y="1800";
$x = array();
for($j=0;$j<2000;$j++){
        $x[]= "{$j}";
}

for($i=0;$i<3000;$i++){
        if(in_array($y,$x,true)){
                continue;
        }
}
?>

復制代碼 代碼如下:


shell$ time /usr/local/php/bin/php test.php

real 0m0.267s
user 0m0.247s
sys 0m0.020s



快了好多倍啊!!!可以看到sys耗時幾乎沒有太大變化。我們再次ltrace一把,還是要把$x直接賦值,排除malloc調用的干擾,因為我們實際應用中是從緩存里一次拉出來的,所以也不存在示例代碼中這樣的循環來申請內存的情況。
再次執行

復制代碼 代碼如下:


shell$ ltrace -c /usr/local/php/bin/php test.php



如下圖:

遭遇php的in_array低性能問題

__ctype_tolower_loc占用了最多的時間!查了一下庫函數__ctype_tolower_loc是干嘛的:簡單的理解是將字符串轉換成小寫,那么這說明in_array比較字符串不區分大小寫嗎?其實這個函數調用已經和我們這個in_array感覺聯系不大了,關于in_array的實現,還是去看看PHP的源碼,大概理解的更為透徹了,好了,沒法往下說了,歡迎與我交流,寫的不對的地方請多多斧正。

———————2013.08.29分割線——————————

晚上又翻了以下PHP 5.4.10的源碼,對in_array的興趣真大啊,哈哈,位于./ext/standard/array.c的第1248行,可以看到他調用了php_search_array函數,下面的array_serach也是調的這個,只是最后一個參數不同!經過一番跟蹤,在in_array松比較的情況下,他最終調用的函數 zendi_smart_strcmp(果然是個“聰明”函數)進行比較,位于./Zend/zend_operators.c,我們用ltrace抓到的大量轉換成整型的操作就是那個is_numeric_string_ex的行為。

遭遇php的in_array低性能問題



函數is_numeric_string_ex是在./Zend/zend_operators.h中定義的,在前面進行了一堆的判斷和轉換之后,在232行調用了strtol,就是我們在文章中提到的系統函數了,將字符串轉換成長整型,有圖有真相

遭遇php的in_array低性能問題

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 香河县| 茂名市| 冕宁县| 梨树县| 谷城县| 绍兴市| 达日县| 颍上县| 阿勒泰市| 莒南县| 县级市| 汝州市| 衡南县| 开江县| 鄂托克旗| 三穗县| 吐鲁番市| 化隆| 冕宁县| 呈贡县| 监利县| 双鸭山市| 晋城| 巴塘县| 友谊县| 民丰县| 黑龙江省| 成安县| 武义县| 白玉县| 固始县| 五莲县| 邯郸县| 绵阳市| 临沂市| 措美县| 顺义区| 绥芬河市| 肥东县| 巴彦淖尔市| 山东|