現在的搜尋引擎雖然精準度已經比以往提高不少,但是還是常常搜非所尋,想要找亞馬遜叢林的資料,輸入Amazon卻都是亞馬遜書店相關訊息,必須翻到好幾頁以後才陸續出現亞馬遜叢林的資料。

     因為亞馬遜書店的PogeRank值高,而且亞馬遜書店的流量大,所以搜尋引擎就以最可能你需要的的出現在最前面,但是偶爾(或是常常)你要的資料並非最熱門的,你就得耐心的多翻幾頁,或者多使用不同的搜尋引擎來找尋。但是這種現象已經慢慢在改觀中,因為許多語意相關的技術已經逐漸純熱。 

     如上圖1-45畫面的izito,當你輸入關鍵字以後,右邊會出現Topicdomain選項,當你輸入amazon後,就可以選擇RainforestBooks等選項來確認你所謂的amazon是啥意思。 

     而如圖1-46顯示的ujiko雖然不允許處理中文資料,但是允許使用者對搜尋結果做客製化(如搜尋到的結果給他一顆心,或丟到垃圾桶),下次搜尋就會以你客製的結果出現,並且ujiko也提供跟izito類似的topic分類,並且可以往下再分子類別,雖然介面稍微複雜些,但搜尋結果還算不錯。 

     而如圖1-47所顯示的kartoo就更厲害啦,當滑鼠移動到某個link時,便會顯示這個link在整個關係中的結構,同樣的他的左邊選單也提供topic的選項,不過kartoo也不支援中文搜尋。

     Google的一般搜尋後又推出各類搜尋之際(圖書搜尋、地圖搜尋、學術搜尋、網誌搜尋、產品搜尋、新聞搜尋等等),各家一堆特定目的垂直搜尋也紛紛想要搶下一片江山,這些搜尋引擎到底存活的機率有多少?功能如何?

     目前綜合類搜尋除了Google外,大抵普遍被使用的就是YahooMicrosoft BingA9AltaVistaAllTheWebLycosAsk.comBaidu等等,在這些綜合類搜尋引擎與語意搜尋引擎(如Kartooizitoujikohakia等等)之間,垂直搜尋引擎的出現也彌補了目前搜尋不精準的缺點。

     以下就來介紹一些功能不差的垂直搜尋及特殊查詢網站。

  1. 1.     (垂直搜尋)酷訊網Kuxun提供中國大陸的工作、房屋、票務、酒店、旅遊、購物等生活內容的搜索服矛。這個酷訊網由北京大學計算機工程背景的陳華所創辦(陳華目前已經加入阿里巴巴商務網),可以搜尋到的訊息可以說幾乎涵蓋了中國大陸的食衣住行娛樂,由於表現不凡,也獲得了奇虎網Qihoo不少資金的投資。
  2. 2.     (垂直搜尋)Jobui/Jobmet為求職者提供大量的工作訊息,及中高端人才獵頭服務。Jobui的服務與台灣的104人力銀行不同,他們沒有自己的資料,只是提供界面去各人力資源網站抓取資料加以整合。
  3. 3.     (垂直搜尋)Krillion產品搜尋:這個查詢與Froogle類似,但資料量不夠多,面對Google大概存活率不高,除非資料能夠往精緻化發展。
  4. 4.     (垂直搜尋)Spock找人服務:這個找人服務與USA People Search類似。
  5. 5.     (垂直搜尋)Yoikd音樂搜尋:與百度的MP3搜尋類似,精準度不錯,而且資料量也不差。
  6. 6.     (特殊查詢)Openrice餐廳搜尋:可以搜尋香港各類餐廳,但不算是垂直搜尋,因為資料蠻齊全的,因此也把它列進來。
  7. 7.     (整合界面搜尋)oskope視覺搜尋:提供搜尋eBayAmazonflickrFotoliaYahooYouTube等內容的視覺化搜尋,其功能與Spacetime類似,Spacetime還可以下載安裝方式來加快視覺化搜尋。
  8. 8.     (垂直搜尋)FindBook翻書客:提供各網路書店的書籍比價搜尋,類似的服務有isoshu,但是isoshu找的不是書籍的價格,竟然找的是書的內文,只是不知它是如何處理版權問題。
  9. 9.     垂直搜尋Yousee BBS搜尋:提供BBS站內的文章搜尋,是政治大學資科系團隊製作出來的。

 

     在網路上資料日增的情況下,各種需求已經無法以單一普遍性搜尋引擎來滿足,因此專門領域搜尋、垂直搜尋、語意搜尋等需求會越來越高,並且更符合人性化的界面也是大家所期盼的,以上這麼多的搜尋網站到底誰能勝出?還是只是曇花一現?就看使用者賞不賞臉了!

     介紹了這麼多的搜尋引擎,可以知道雖然主流的搜尋引擎只有幾個,但是這些非主流的搜尋引擎功能未必比主流搜尋引擎差。並且從這些各類的搜尋引擎可以瞭解到大家都在思考同樣一件事情,就是如何更精準的找尋使用者需要的資料。

     搜尋引擎要如何才能更精準的找尋使用者需要的資料呢?對於搜尋引擎業者而言,就是語意分析與資料垂直整合,也就是語意搜尋與垂直搜尋。對於網站而言,就是你的網頁內容必須提供足夠的描述內容及相關串聯資料,才能讓搜尋引擎進行分析。

     目前網頁的互相連結並無法表示支持的程度以及相關性,Google的網頁評比PageRank計算一概以均分的方式分配,而網頂互相連結也無法表示網頁間的關聯,如科技類的網頁A連接到科技類的網頁B,對於網頁的重要度評比,當然應該比生活類的網頁C連接到科技類的網頁B要來的重要。由於搜尋引擎目前都尚未真正融入語意技術,沒有語意技術實在很難以分析這麼多看似不相關的資料。

     什麼是Semantic Ranking?就是用語意技術去評比網頁,當你下一個關鍵字,網頁就可以用Semantic Ranking的大小來依序顯示,不像現在只是純粹比對字串。當網頁間存在Semantic Connectivity(語意連接性)或Semantic Similarity(語意相似性),就是存在Semantic Association(語意關聯性)。

     例如,當網頁A的內容討論車子的性能,網頁B的內容討論重型機車的性能,網頁C的內容討論BMW汽車的性能,網頁D的內容討論寶馬汽車的性能,則網頁A-CA-D互相具有Semantic Connectivity,網頁CD互相具有Semantic Similarity,而網頁B則可透過另外網頁與網頁A產生另外一個Semantic Connectivity

     不過可惜的是,以舊有的網頁語法,如果沒有使用RDFResource Description Framework),比較困難建立這些關係,如何在既有的HTML語法下,或簡化使用RDF的方式來改善搜尋引擎演算法,是搜尋引擎業者的一個極欲解決的難題。 

, , , , , , ,

Posted by sugarbaby55 at 痞客邦 PIXNET 留言(0) 引用(1) 人氣()