搜尋引擎可以分為兩大類:各人電腦端搜尋(Desktop Search)與網路搜尋(Web Search),個人電腦端搜尋尋找的是自己個人電腦上的檔案,網路搜尋尋找企業網路或網際網路上的檔案。我們這本書裡所談的搜尋引擎,主要是指網際網路上的網路搜尋引擎,而網際網路上的網路搜尋引擎根據所搜尋資料的地域性區分,可以進行本地搜尋(Local Search)或全球搜尋(Global Search)。
本地搜尋(Local Search)主要是要搜尋出在地化的資料,例如在搜尋引擎輸入「蛋糕」來尋找可以前往購買的店家,這時如果出現一堆不是本地的店家資訊或是沒有網路通路的網站,對於使用者就沒有利用價值。
本地搜尋(Local Search)千萬不要跟個人電腦端搜尋(Desktop Search)搞混淆,因為許多人會誤以為Local是本機的意思。
全球搜尋(Global Search)就不分地域因素,例如在搜尋引擎輸入「三角函數」來尋找相關的資訊,此時就沒有區分地域的需要。
網際網路上的網路搜尋引擎又可以分成許多不同類型,如綜合類(General Purpose)的搜尋引擎(如Google、Yahoo、Bing等)、整合搜尋類(Meta-Search)的搜尋引擎(如Dogpile、Clusty等)、垂直搜尋類(Vertical Search)的搜尋引擎(如Google Scholar、Google Patent、Google News等)、語意搜尋類(Semantic Search)的搜尋引擎(如izito、kartoo等)。
以下我們將網際網路上各種不同類型的網路搜尋引擎整理如下:
綜合類(General Purpose)的搜尋引擎 |
Google、Yahoo、Bing、Baidu、Ask、AOL、AltaVista、InfoSeek、Lycos、Excite、Alltheweb、A9等 |
整合搜尋類(Meta-Search)的搜尋引擎 |
Clusty、DogPile、SurfWax、Copernic等 |
垂直搜尋類(Vertical Search)的搜尋引擎 |
Google Scholar、Google News、Google Books、Google Patent、Froogle、Kooxoo、Jobui、Jobmet、Krillion、Spock、USA People Search、Yoinkd、isoshu、Yousee BBS Search、Findbook等 |
語意搜尋類(Semantic Search)的搜尋引擎 |
Kartoo、izito、ujiko、hakia、cuil等 |
綜合搜尋、整合搜尋
所謂綜合類搜尋引擎就是指可讓使用者搜尋各種類別的資料,只要是資料與關鍵字有符合的情況,綜合類搜尋引擎就會將資料顯示出來。
雖然綜合類搜尋引擎一直在修改搜尋的技術,希望能夠讓使用者找出真正需要的資料,但是同樣一個關鍵字對於不同使用者可能有不同涵義,例如關鍵字「牛肉麵」可能需要找牛肉麵的配方,也可能是要找哪裡有好吃的牛肉麵,除非使用「牛肉麵 配方」或「牛肉麵 麵店」才能知道使用者到底指的是什麼意思。但是對於大多使用者而言,如何精準的使用關鍵字並不是一件簡單的事情,因此才會需要綜合類搜尋引擎之外的搜尋引擎來補其不足。
因為每個綜合類搜尋引擎所能夠搜尋到的資料不盡相同,許多人可能為了尋找完整的資料,而必須使用多個綜合類搜尋引擎,因此整合搜尋類搜尋引擎的目的就是讓使用者不需要這麼麻煩,整合搜尋類搜尋引擎提供一個界面讓使用者去搜尋多個知名的搜尋引擎的資料(如圖1-1及圖1-2),並且大多都提供使用者在關鍵字範圍內再去縮小範圍或確認使用者的真正意涵,整合搜尋類搜尋引擎雖然較方便使用,但由於人類自然語言處理(Natural Language Processing)技術上尚有許多待突破之處,並且大多使用者都已經習慣使用某些綜合類的搜尋引擎(如Google或Yahoo),因此整合搜尋類搜尋引擎並未真正吸引太多使用者。
垂直搜尋
垂直搜尋類搜尋引擎就是在特定類別的資料內去進行搜尋,例如以Google Patent去搜尋關於專利的資料,或以「http://kuxun.cn」去搜尋中國大陸機票、車票等訊息(如圖1-3及圖1-4)。這種特定類別的資料目前絕對無法快速使用綜合類搜尋引擎或整合搜尋類搜尋引擎來搜尋到想要的資料,因此在電腦還無法真正理解人類的想法之前,垂直搜尋引擎在搜尋引擎市場上佔有一席之地。
語意搜尋
而語意搜尋引擎就是目前搜尋技術的最終目的,希望使用者輸入關鍵字後,電腦可以瞭解使用者的目的,把符合使用者需求的資料呈現出來(如圖1-5及圖1-6),目前語意搜尋引擎在英文處理上已經稍具成果,但還尚未完全成熟,在中文的語意處理上更是還有一大段路。
留言列表