国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 網站 > 優化推廣 > 正文

Google 處理采集數據的一些分析

2024-04-26 14:07:08
字體:
來源:轉載
供稿:網友

點擊跟蹤

Google logs 把全部用戶在其服務產品上的引導點擊(廣告,行動,功能點擊等等)都記錄起來。

形式 -隨著用戶輸入數據的形式直接進入(用戶名,密碼等),Google 記錄了時間和日期以及提交的位置。

google form Google 邪惡的一面:Google 用戶數據采集大揭秘

注冊 Google 帳號時的表單

輸入類型是隱藏的,使用戶不會看到或進入特定領域的數據

向用戶發送后提交 (隱藏) 的位置

輸入類型是隱藏的,所以用戶不會看到或進入到特定數據里頭。

用戶使用引用數據,并通過表格獲得怎樣才把”注冊”放在什么位置用戶會點擊

Cookies

Google 把它所有網站屬性的 Cookie 都用上了,此外,他還留下了廣告 Cookie 來跟蹤用戶在網站上的行為。通過這種方法,Google 就可以在有 doubleclick 和AdSense 廣告的網站下跟蹤該網站上任何一個用戶的網站行為。

google cookies Google 邪惡的一面:Google 用戶數據采集大揭秘

存儲的cookies列表

存儲在日志文件的服務器請求

每一個向 Google 服務器發出的請求都存儲在日志文件里頭,而存儲的內容取決于發出請求的類型。

google log Google 邪惡的一面:Google 用戶數據采集大揭秘

日志文件

URL - http://www.google.com/search?hl=en&q=seomoz&ie=UTF-8

從用戶付出的請求而獲得的 IP 地址,可以根據這個IP 地址定位該用戶的具體地理位置。

日期,時間和時區偏移的用戶

用戶的語言

用戶的操作系統

用戶的瀏覽器

其他信息就沒有那么重要但是必須具體的描述向服務器發出的請求,服務器的響應和轉譯引擎。

Javascript

Google 有小部分的 JavaScript 已經嵌入到互聯網上眾多的網站上面。當用戶的瀏覽器執行背景中的腳本時候,Google 就能夠知道很多關于這個用戶瀏覽習慣等重要信息(地理位置,操作系統,瀏覽器類型和版本等)

網站信標

Google 向很多結算屏幕嵌入小尺寸的透明 gif 圖片,就好像 JavaScript 一樣,一個用戶下載隱形的圖片并且向 Google 發送他們的電腦信息。

網站信標樣例(什么?你看不到?這才是重點)

了解一下 Google 是怎樣處理這些數據

存儲

Google 使用一個內部數據庫叫 BigTable 擴展到近乎 100W 個服務器

Google Data In 2006

 

Data

Size (TB)

Crawl Index

800

Google Analytics

200

Google Base

2

Google Earth

70

Orkut

9

Personalized Search

4

這壓縮的數據的大小接近 TB(1024GB)。而 Google 透露的數據大小超過 1PB(1048576GB)。這甚至不需要考慮 AdSense,Gmail,Google Map,街景,Google圖片,或者其他私有數據庫。并且這些數據都是超過2年前的。

大量的數據分析

這就有點像 Charlie and the Chocolate Factory (電影《查理與巧克力工廠》)。我們都知道有很多數據都進入到 Google 那里,我們也知道有大量處理好的數據會導出來。我們就只是不知道兩者之間是發生了什么,是怎么轉換的。

我們也知道 Google 本身有很多運算法則組織他的數據,Page Rank 就是最出名的了。據說,Google 也有很多復雜的 spam 的過濾系統,內容復制過濾系統,類型偵查運算法則,自然語言解析程序,圖像識別軟件,和其他大量的復雜的軟件。

永久備份

Google 上的數據最終的棲息地可能會在永久存儲。Google 的隱私政策提示某些用戶數據永遠都不會完全被刪除,因為已經被永久的備份。

理解Google收集特定用戶的數據情況

以下都是一些當用戶與很多網站交互的時候 Google 收集到的用戶的資料的清單列表。這意味著其實有更多的數據被 Google 收集而卻又沒有公開的。不過其實無知就是幸福,當你看完之后,你或許會感覺很不爽:

Google用戶數據收集情況匯總:Google用戶數據收集情況匯總

你能相信 Google 會幫你保密一切信息么? 你敢相信 Google 會遵守所有保密要求么?

原文地址:http://semwatch.org/2009/11/evil-of-google-data

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 西华县| 仪陇县| 鄂尔多斯市| 萝北县| 大邑县| 绥江县| 西平县| 柯坪县| 湘乡市| 东乌| 交城县| 阳泉市| 清流县| 屏南县| 隆昌县| 兴文县| 枝江市| 乳山市| 安达市| 屯门区| 石台县| 成安县| 神农架林区| 石嘴山市| 格尔木市| 凤凰县| 紫金县| 武川县| 奈曼旗| 邹城市| 手机| 柳河县| 海兴县| 黎城县| 宜兰市| 玉树县| 合肥市| 肥城市| 肥城市| 广水市| 江油市|