最近在搞APACHE日志分析,裝好了awstats之后,這兩天進(jìn)行了觀察,
報(bào)表日期 月 1 月 2010
首次參觀日期 2010年01月12日 11:04
最近參觀日期 2010年01月13日 23:59
參觀者 參觀人次 網(wǎng)頁(yè)數(shù) 文件數(shù) 字節(jié)
瀏覽器流量 * 77 226 (2.93 參觀人次/參觀者) 508979 (2252.11 網(wǎng)頁(yè)數(shù)/參觀) 509492 (2254.38 文件數(shù)/參觀) 13.67 G字節(jié) (63430.28 K字節(jié)/參觀)
非瀏覽器流量 * 117312 122716 736.24 M字節(jié)
這邊的結(jié)果很讓人費(fèi)解,通過(guò)google統(tǒng)計(jì)網(wǎng)站的獨(dú)立IP訪問(wèn)量有2W做,這里顯示的數(shù)字相差甚遠(yuǎn)。 后面的網(wǎng)頁(yè)數(shù)和文件數(shù)又都與實(shí)際相吻合。 經(jīng)過(guò)查找原因發(fā)現(xiàn) apache日志里記錄的IP地址不正確,大部分都是cdn的節(jié)點(diǎn)地址。 產(chǎn)生的原因很顯然是因?yàn)镃DN造成的,之前在網(wǎng)站后臺(tái)程序里讀取用戶IP地址也出現(xiàn)了類似問(wèn)題。 可以使用print_r($_SERVER) (PHP語(yǔ)言),查找到真實(shí)的用戶IP地址,本站為 $_SERVER[‘HTTP_CDN-SRC-IP']. 這個(gè)是CDN攜帶的真實(shí)的客戶IP地址(這里不計(jì)較用戶是否使用代理)。 但在APACHE的日志記錄里如何使用這個(gè)值呢? 本人在GOOGLE和百度里查找了許久都沒(méi)有找到相應(yīng)的資料或者說(shuō)解決方案,只好自己思考尋求了。
仔細(xì)看了下APACHE里日志記錄的相關(guān)配置,針對(duì)LogFormat:
LogFormat "%h %l %u %t /"%r/" %>s %b /"%{Referer}i/" /"%{User-Agent}i/"" combined
我思索里面的%{Referer}和%{User-Agent} 是如何取得的, 這兩個(gè)是在程序里也是經(jīng)常會(huì)用到的東西,客戶端發(fā)送請(qǐng)求的時(shí)候 這兩個(gè)信息都是作為頭詳細(xì)發(fā)送到服務(wù)器的。后來(lái)查看了下訪問(wèn)時(shí)的所有頭信息,如下:
代碼如下:
Array
(
[Cdn-Src-Ip] => 222.44.46.58
[Accept] => image/gif, image/jpeg, image/pjpeg, image/pjpeg, application/x-shockwave-flash, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, */*
[Accept-Language] => zh-cn
[User-Agent] => Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727)
[Host] => www.875.cn
[Cookie] => __utma=217127135.1188793388.1263188369.1263364666.1263368206.5; __utmz=217127135.1263368206.5.2.utmcsr=211.167.92.250|utmccn=(referral)|utmcmd=referral|utmcct=/cgi-bin/awstats/awstats.pl; viewedShopsID=621; viewedShopsPP=%u6B27%u5C1A%u574A
[Accept-Encoding] => gzip
[Via] => 1.1 hnay40:80 (Cdn Cache Server V2.0)
[Connection] => keep-alive
)
當(dāng)然rerfer的時(shí)候也會(huì)有rerfer信息出現(xiàn)在頭部信息里,上面也有Cookie、Host、User-Agent等信息,這些信息都是可以在apache配置文件里可以使用的變量,當(dāng)然這里Cdn-Src-Ip正是我想要的客戶的真實(shí)IP地址。 于是推測(cè)${Cdn-Src-Ip}在日志記錄格式里應(yīng)該也是可以使用的。 后面的i應(yīng)該是指忽略大小寫(xiě)的意思。于是得出一個(gè)解決方案:
新聞熱點(diǎn)
疑難解答
圖片精選