2016全台活力城市網路票選

黃哲斌:誰來打敗Google?

就像所有武俠小說的劇情,每隔一陣子,當「臥虎藏龍」裡的李慕白走在荒郊野徑,或坐在茶鋪酒肆,就會有人跳將出來,提劍吆喝叫陣,非要拚個你死我活。網路界前陣子的熱門頭條,就是Google又被下戰帖了。

2008/11/28 出處:財訊雙週刊 第 310 期 作者:黃哲斌

挑戰者是Cuil,媒體已有不少報導,我只講重點:這家公司的創設者是Google前員工(媒體最喜歡的情節:叛教的武林高手,自立門派踢館),向創投募得三千三百萬美金,七月二十八日正式上線,挑戰市值一千八百億美元的Google。
第一回合的結果很清楚,Cuil慘不忍睹,被形容為「NBA球星組成的無敵球隊,卻在二○○二年世界盃籃球賽拿到第六名」。
最糟的批評,當然是「搜尋結果亂七八糟、張冠李戴」,例如,當我鍵入我工作的Chinatimes(該站目前不太支援中文),第一頁除了中時電子報、中時網路民調、中時娛樂網的收視率排行榜,剩下都是一些千奇百怪的連結,例如馬尼拉時報、廖敏雄的英文維基詞條、還有一個名為「China-Times」的算命占卜、法律諮詢網站。
但是,Cuil上線前,為何能募集十億台幣的創業基金?為何被視為NBA夢幻籃球隊、足以動搖Google霸業的下一個明星?
從小,我們學習「檢索」這回事,查字典、翻百科全書、在圖書館的卡片櫃裡找書,部首、筆劃、注音排序,還有王雲五的四角號碼……「檢索」幾乎等於掌握資料的能力。在網路上,知識以破碎片段的面貌存在,「搜尋」則取代檢索,成為探勘世界的最強大工具,Google早一步嗅到這個趨勢,因此擊敗雅虎等網路前輩。(Google在美國的搜尋市占率為六一‧五%,雅虎二○‧九%,微軟九‧二%)
近兩年來,好事的網路界不斷問:「誰能擊敗Google?」「下一代搜尋引擎長相如何?」從Cuil宣傳的賣點,確實回應了這些問題,以及未來答案的想像:
一、網頁索引數:我曾形容,「雅虎像是從一部四庫全書中找出某一章,Google像是直接找出某一頁」,網路像是爆炸中的星雲,無限向外擴張,誰掌握最多網頁,就等於掌握全世界。三年前,Google公布的網頁索引數是八十二億筆,Cuil則宣稱他們爬梳的網頁高達一千二百億筆,且耗費成本更低。
科技網站TechCrunch估計,Google的資料量約四百億筆、微軟約一二○億筆;但是Google最近在官方部落格宣稱,他們搜羅的不重複網址數量已突破一兆筆!就像電視台的收視率戰爭,這場網頁數字的競賽,未來仍是搜尋戰爭的主戰場之一。
二、塊狀編排網頁:當Google及其他搜尋引擎,以幾近無聊的線性排列,吐出千萬筆搜尋結果,Cuil選擇以三欄式的塊狀編排,列出你的檢索連結,包括文字與圖片,Cuil宣稱,他們的「網頁比較像雜誌」。
三、搜尋模式及關聯排列:Cuil另一個實驗是,它不像Google是一個龐大的平行資料庫,以連結質量來評判網頁級別,從而決定搜尋結果的排序;它試圖建立許多各司所長的搜尋機器人,各自出發去扒網頁,有的專門抓醫藥相關內容、有的抓奧運、有的抓電影……
然後,他們宣稱可以吐出關聯性搜尋結果,例如搜尋「哈利波特」,也會出現與「鄧不利多」有關的網頁。或者,想像一下,當你搜尋「咖啡」,第一頁的三欄式網頁裡,左列是關於咖啡的源起、知識,中間列是最受歡迎的咖啡店、咖啡器材販售地點、最多人點閱的咖啡專家部落格,右列是與咖啡有關的電影劇照、圖片、何謂「公平交易咖啡豆」。
當然,這是理想狀態;但當搜尋「中國時報」卻出現「馬尼拉時報」,這個搜尋引擎顯然有很大的進步空間。
Cuil初看提出一套創新的搜尋模式,可惜截至目前,「答非所問」仍是最大的致命傷,有時讓人產生「問道於盲」的挫折感。因此,Slate刊出一篇文章,教你「用三個字測試搜尋引擎」,該文也實地測試了包括微軟Live、Ask等五個主要搜尋網站。
第一個字是「喬治W.布希(小布希)」,有趣的是,Google跟雅虎的搜尋結果差不多,但「雅虎的反布希連結比較少」,Cuil竟然告訴你:找不到任何與喬治W.布希有關的內容;第二個字是「威而剛」,作者認為,這個字最能測試「搜尋引擎是否有能力擋住垃圾廣告、賣藥網站」,測試結果,Cuil的防線最弱,雅虎的資訊性則最強;第三個關鍵字是「你自己的名字」,許多人都曾在Google搜尋自己的名字,作者指出,這是測試搜尋引擎廣度及深度的最好方法。
截至目前,Cuil橫地殺出,傷重敗北,重回絕情谷休養生息。但至少它帶來一些新想像,就像以前常討論的「圖形搜尋」、「影音搜尋」,或維基創辦人威爾斯想推出「電腦演算法為主、人力編輯為輔的搜尋引擎」,由人工協助釐清多重歧義的字詞。
談到人工輔助,微軟曾變出一個搞怪的「Ms. Dewey」,當你鍵入關鍵字,螢幕上像是OL的真人「杜威小姐」會演一段影片,回答你的問題,同時顯示相關連結,當你不理她,她還會敲動螢幕,引起你的注意。
杜威小姐只是AI技術的小嘗試,MIT實驗室科學家合作開發的「Cha Cha」,當真聘請一群工讀生,在線上回應你的關鍵字,告訴你那些連結最重要、關聯性最高,就像一個即時、專人服務、較少地雷的「奇摩知識+」(至少當你詢問期末作業解答,不必擔心會遇到你的老師)。不過,該站目前已轉型成「手機搜尋」服務,藉著簡訊往來尋找解答。
當網路溢出人類記憶與知識系統的疆界,搜尋網站已取代入口網站,成為許多人最依賴的「百事可問」;我們都在網路時代裡「測字」,搜尋引擎是隻靈敏的小文鳥,只要一個按鍵,叼回我們對人世的好奇、疑惑、焦慮、索求;五年後,Google還是那隻最聰明的小文鳥嗎?

Add to Flipboard Magazine.
踢爆無良老闆搬錢內幕
財訊雙週刊第517期
出賣強勢股名單
財訊趨勢特刊第63期
熱門文章
搖擺蔡英文讓她半年一事無成

搖擺蔡英文讓她半年一事無成
缺乏主軸的忙茫盲 執政的4大錯誤

半年多來,抗議從沒停過,這是台灣公民社會發展的必然,這不是蔡英文的失敗。她真正失敗的地方在於,無法召喚支持者的熱情,也沒有做什麼大事讓人跟在她後面吶喊。

more
美福大飯店


TOP