Google Square - Google又一力作,把網路變成一個巨型資料庫!


今天在
Google Labs看到一個新的服務叫做-Google Squared。一用之下覺得真是驚為天人,讓我們看下去。

Google Squared主要的核心概念是「把網際網路視為一個廣大的資料庫,嘗試把非結構(unstructured)資料以結構化(Structured)的方式呈現」。聽起來沒什麼嗎?其實這是相當困難且偉大的一件事。不過剛開始我們先不講detail的核心概念,先來看看Google Squared怎麼用吧。

Google Squared首頁


我們在搜尋框中打入「camera」


你可以看到Google Squared把資料以「表格(table)」的方式呈現。你可以看到Google Squared列出了許多不同廠牌的camera,並且列出了camera可能擁有的屬性,像是描述(Description)、價錢(Price)等等。如果你覺得有哪一個屬性是你不關心的,在每個屬性旁邊都有一個「X」可以移除:


如果你還想要觀察別的屬性,最右邊有一個「Add」的功能,可以新增自己另外的屬性,他會列出一些Google推薦的屬性,像這裡有Design、Manufacture...等等,並且會自動更新屬性的內容值。


如果這還不夠厲害,那你可以輸入自己想要觀察的屬性,像這裡我新增了「Brand」和「Height」,
Google Squared自動根據你輸入的屬性去抓取相關的資料回來,而且結果還蠻準的!


當然,根據不同的搜尋項目會有不同的屬性,像我這邊搜尋「dog」,就會跑出不同的種類的狗:


當然,準確率不可能百分之百,但是別擔心,
Google Squared允許使用者一起幫忙修改搜尋結果,讓準確率更高。如果該欄位有「Other values」,不要客氣就點下去吧:


點下去之後可以看到有其他的選項可以選擇:


你也可以把搜尋的結果儲存起來:

不過目前
Google Squared對於中文的支援不是太好,期待將來可以把中文的功能也建立起來。

好了,大致上的功能就是這樣,其實這背後藏著很深的意義,讓我們來談談看。首先,我們必須要知道,網路上的資訊和網頁實在太多了,要如何從這茫茫網海中找出兩個物件之間的關係(Relationship between two objects)是多麼困難的一件事情,講得白話一點,「你怎麼知道這個數字是camera的price,還是weight」?
當你接收到一個網頁的資訊,你怎麼知道這個網頁的哪個區塊是有關camera的?這個牽涉到「
瞭解網頁(Webpage Understanding)」的議題(By the way,我不確定Google Squared這個服務的背後是不是使用這樣的概念,不過勢必是有相關連的)。這和我之前看到的一系列paper很有相關,有興趣的人不妨可以看一下
Webpage Understanding - beyond page level search
Webpage understanding an integrated approach
這兩篇paper都是微軟亞洲研究院(MSRA)所publish的,也都有投稿在相當好的conference。這兩篇paper的主要和核心概念就是「將一個網頁切割成不同的區塊,並且給定每個區塊一個有意義的名稱」。舉個簡單的例子好了,下面這張圖是Amazon網站上的資訊,假設這是一個網頁,那我們可以把網頁分隔出我們想要的資訊,並且給定一個有意義的名稱:


結果可能會長這樣(細節這裡不多談,有興趣的可以參考上面那兩篇paper,或是留言互相討論:D):


這樣的方式如果可以自動化、程式化,不就可以自動去抓取網路上的資訊了嗎?當然這和語意網路(Semantic Web)也脫離不了關係。要如何從網際網路尚非結構化的資料建構成一個巨型的ontology,找出物件和物件之間的關係,真正建出一個「智慧」的搜尋引擎。在Google Squared中,也許結果不是百分之百的精準,甚至只有70%、50%,不過已經可以看出未來網路的雛型了。從Google Labs所推出來的眾多「beta」服務,都看得出來Google正在拼拼圖,每一塊拼圖都會成為未來網路世界的雛型。

讓我們拭目以待。

【相關閱讀】
Want a More Organized Search Results? Google Square It
Google Squared is Live: Who Knew Structured Data Could Be So Unhelpful?
Google Squared: Your Search Results in Spreadsheet Form
Google Squared, the 'Wolfram Alpha killer's is LIVE! Our initial thoughts.

Share this post!

Bookmark and Share

9 意見:

Perez.C 提到...

很棒的分享!
其實Google還有一些殺手級的應用尚未正式推出,
我相信Google對人類生活的影響,會持續地加深!

T. J. 提到...

Google 真是個劃時代的組織啊!

kevingo 提到...

Google的影響的確無遠弗屆阿,希望他們能夠繼續的幫助人類的生活更加美好 : )

感謝留言分享 :D

鐵爸 提到...

謝謝您的分享,我才知道原來有這個服務和概念~~
很專業呢 ^^

kevingo 提到...

不敢當 ,純粹記錄自己的想法和使用的感想,多謝留言 :D

匿名 提到...

感覺跟Wolfram_Alfa蠻像的,就是搜尋結果以結構性輸出

在地ㄚ晟 提到...

Google果然隨時讓人驚訝呀

kevingo 提到...

匿名您好,其實他們兩者的差別還是頗大的。因為Wolfram Alpha的資料主要來自他們龐大的內部資料庫。但是Google Squared的資料是抓整個網際網路上的資訊,所以這是根本上的差別 :D

感謝您的留言 :)

kevingo 提到...

在地ㄚ晟您好:對阿 Google 真是強者如雲呢!

感謝您的留言 :)