很多關心社會調查的人都聽過有關蓋勒普的例子:最初的美國大選支持率調查是由一家規模很大的公司通過報紙夾帶問卷進行的,雖然每次樣本量都非常大,但準確率總是比不上當時規模還很小的蓋勒普。最終人們發現原來那家大的調查公司進行調查所選報紙的讀者群大多屬于共和黨的支持者,這直接影響了結果的準確程度。而蓋勒普公司采用入戶調查的方法只用對手幾分之一的樣本量便提供了非常準確的大選預測。這次成功不僅使蓋勒普成為例界總統大選調查最權威的機構,也使這家公司逐漸成長為全球最知名的調查公司。
上面說的是一個有關傳統的社會調查的話題,隨著時代的進步,互聯網調查逐漸成為一種新的趨勢,但隨之而來的卻是對網上調查可信度的質疑。不知從什么時候開始,一個專門進行各網站流量排名的第三方機構alexa開始在中國流行,很多中國網站開始將自己在上面的位置作為宣傳自身的資本。然而最近半年以來,有關這一數據被“強奸”的報道也不絕于耳。事實上在我們職責部分被提及的在這一系統中“作弊”的企業的同時,我們更需要深思的是為什么會有這么多企業熱衷于提升自身在其中的排名,為什么很多原本應當排名成績非常理想的企業卻只能通過“作弊”的手段來提升排名?
事實上alexa是一個專門統計互聯網使用者瀏覽網站行為的插件,但某家網站能夠被統計到的前提是登陸這一網站的計算機必須安裝這一插件,這就構成了該統計體系的第一個硬傷:只有了解這一插件并安裝這一插件的計算機才屬于樣本采集范圍,而這種插件是需要下載安裝的,這決定了他的普及程度一定非常有限。尤其是在國內由于該插件沒有中文版,了解這一系統的中國人更是鳳毛麟角,這就使得很多國內網站都遭遇了“不公正”待遇,他們被統計的流量不可能與國際網站相媲美。
然而構成這一體系的更大硬傷是該插件可以隨意下載。我們可以類比電視收視率調查,主要是一些專業公司通過一定的篩選標準選定足夠的家庭,然后為這些家庭安裝“機頂盒”,此后所有的調查都依靠這些樣本開展。而alexa則不同,他是一個允許大家隨意下載的軟件,只要你安裝,你便可以參與調查,而對于樣本的特征、樣本的行為,alexa根本無法監控。也正是由于這種原因才使得很多國內的企業要求自己的員工或合作伙伴安裝這一插件被稱為作弊行為,因為其他人都沒裝,這就不公平了。應當說如果從社會調查的角度講,這是樣本篩選的嚴重錯誤。
正是由于alexa排名的諸多硬傷才使得這一排名在國內徹底喪失效力。一方面它被很多人描述為全球最權威的網站排名系統,于是各商業網站的牌位也就成為了很多人關心的問題;另一方面alexa糟糕的樣本選擇方式又使得這些網站不得不靠自己安裝插件來“參與”統計,這樣一來自己點擊自己也就是再成長不過的現象了。因為雖然自己的網站排名很靠前說明不了什么問題,但如果進不了排行幫那麻煩就大了,這樣看來alexa在國內倒更像是一個自我保護的系統,企業通過自己點擊是為了不在這個沒有意義的數據中落后于人。
盡管我們可以說國內的很多企業在處理alexa的排名中存在不規范的行為,畢竟所有這些企業都并沒有通過alexa的排名去欺騙誰,因為這個數據的可信度并不被大家認可,但我們更應當注意的卻是關于統計體系本身的問題,應當說這樣的問題決不僅僅局限于alexa本身,而可能會涉及很多的網上調查,包括各種機構對網民的調查,比如各種名目的百強網站評選等,都面臨同樣的尷尬。
新聞熱點
疑難解答