2002 年


2002-06-30

台灣製的搜尋引擎要挑戰世界第一

台灣知名的搜尋引擎廠商網擎資訊Openfind,於六月三十日宣佈推出全球最大的網路搜尋引擎,要挑戰世界第一的Google搜尋引擎。

「搜尋引擎是資訊時代最重要的關鍵性技術,台灣如要成功的全面e化必須要徹底掌握此一重要技術根基,Openfind的GAIS30計劃經過了多年的努力,終於開發出足以挑戰世界第一之尖端技術。」網擎創辦人,中正大學資工系副教授吳昇表示,「我們不只在資料量方面突破了鉅量資料處理的難關,一舉將網頁索引數量推升到三十五億頁-Google的1.7倍,更發明了比Google著名的PageRank排序方法更周詳,更優化的『多元排序法(PolyRank)』,以達到更好的搜尋效果!」

網際網路最迷人也最寶貴的特色就是他那超大的知識寶藏,而且這寶藏的規模每年都至少成長兩倍以上,對於搜尋引擎而言,如何有效的駕馭這龐大的資料怪獸與無止盡的倍數成長是一項極為艱鉅的技術挑戰。以三十五億的資料量而言,如果我們把每一個網頁印在一張A4的紙張上,則這些紙接起來的長度足足有100萬公里,可以繞地球25圈。而Openfind搜尋引擎可以讓使用者在一秒鐘之內從這巨大的資料空間裡找到所要的資料!

「在搜尋引擎的競技場裡,資料量是一個很關鍵的因素。資料涵蓋量不夠大就會增加找不到所要資料的情形,而另一方面,搜尋結果的品質也會跟資料量有正向的關係,因為增加挑選的樣本數會更有機會挑到更好的結果。」吳昇博士進一步解釋。

另一方面吳昇博士也指出,目前搜尋引擎利用網頁連結統計來做排序的主要依據有一些缺點。比方說,一個相同查詢詞由不同的人來查,得到的排序結果全都一樣,而且使用者無法選擇不同的排序方式。更甚者,由於連結排名統計的結果對於擁有大量符合筆數的查詢而言,其前十名很可能在數個月內幾乎沒有改變,如此可能造成查詢結果單元化與僵化之現象。並可能造成大者恆大,新站難以出頭,資訊壟斷等之不良影響。

相較於Google著名之PageRank排序法,Openfind研發出名為「多元排序(PolyRank)」之排序法,它不只用更大量的連結資訊來做更周全的統計分析,還參考更多項因素來對網頁做評分,諸如關鍵詞在網頁裡的位置、頻率、與內容的吻合度、網頁的大小、時間、網頁的型態、格式…等多項因素。讓使用者可以得到更好的查詢結果。另外,Openfind的多元排序還可以讓使用者用不同標準來排序查詢結果,讓使用者有更多的選擇與掌握。

除了追求搜尋引擎更大、更準的目標外,Openfind搜尋引擎還提供更新之查詢服務,Openfind每天都會更新索引,讓使用者可以搜尋到最新的資料。

「在這些看得見的創新成果背後,其實有一項看不見的關鍵性技術突破- Openfind開發出了超高效率的搜尋引擎核心技術,有了此一技術,我們得以用更少的設備快速地處理更大量的資料。

相較於Google需要用到一萬多台Pentium伺服器,Openfind只用七十台Pentium伺服器就做出更大的搜尋引擎,而如果要處理Google目前的查詢量,所需的設備不到一千台。這就如同在現實世界裡我們做出了馬力更強大的引擎,而耗油量卻只要十分之一!」吳昇表示。

「我們很高興在搜尋引擎技術領域有重大的突破,我們將正式進軍全球,挑戰Google、挑戰世界第一,我們希望為台灣在網際網路的世界裡開創一片新天地!」