現在修讀網頁搜尋的科目,教授經常以 Google 作例子,而我們所學習的部份理論甚至由 Google 提出來的。今天教授提及 Google 的核心搜尋技術在現在的網頁搜索中的重要性已經降低;當然,搜尋器本身在 Google 的比重也慢慢減少了。留意 Google 的消息,以下提出一些。
技術:
從教授裡得知,原來 Google 初期的搜尋核心都是公開的,可能連 Google 的創辦人也不知道自己的理論有多值錢。往後的日子,雖然 Google 已經沒有再公開關於搜尋技術的文件,但是其他研究報告卻很有參考價值。其中 GFS (Google File System)是 Google 專門為分散式儲存媒體而設立的檔案系統,Google 的海量資料其實是分散地存放的,而市面上相信沒有太多為這樣龐大存量作優化的檔案系統,Google 要自立門戶也是理所當然的,但有趣的是把這些資料的半技術文章公開。
而另一個比較近期的就是一個關於硬碟機 S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology) 讀數的研究報告,當中一反傳統地指出這個機制對於家庭用戶來說的可靠性太低。S.M.A.R.T.提供一些硬碟機的讀數 (例如: 硬碟機溫度、出錯次數和運作時間總計等)) 給使用者參考,讓讀者得知硬碟機的運作情況,從而為快要損壞 (由讀數推斷) 的硬碟機作出更換。一向這個都是普通電腦用家唯一可以得知硬碟運作情況的途徑,而且某些讀數更加被視為硬碟壽命的指標。可是,Google 做了一個有史以來最大型的實驗 (測試的硬碟數目達十萬台,為期一年),並指出根據這麼大量的數據,即使讀數超標和硬硬實際損壞有關係,但是,數台沒有任何 S.M.A.R.T 警告的硬碟機在統計學上並不足以代表該硬碟在未來短期內不會損壞。
服務:
Google 面對兩大巨頭 Microsoft 和 Yahoo! 的反撲,絲毫沒有退縮的跡象。去年底首次推出針對企業的網上辦公室服務,在流動性上直接把「Microsoft Office」打倒。除了如日方中的額外服務 (GMail, Blogger.com 和 YouTube 等) 外,還有一些蓄勢待發的服務如: Google Code Search、Google Reader 、Google Transit 和 Google University Search 等。除此以外,還有一些奇怪的服務: 例如除了 Google Earth 外,其實還有 Google Moon 和 Google Mars;而作為搜尋器,Google 也把當中的「熱門搜尋」公開,不過卻更詳細: Google Trends。
近期除了學習使用 Google Reader 外,今天還埋首建立自己的 Google 主頁,看來這一場三國誌應該非常緊張刺激呢!
2 則留言:
最近用Picasa都好好用!
反而我又冇用 Picasa 喎, 試下先!
發佈留言