紐約時報:Facebook社交搜索「求學記」

  導語:美國《紐約時報》印刷版撰文稱,為了讓搜索引擎更好地理解人與人之間的真實交流方式,並全面解讀不同詞彙的真實含義,Facebook聘請了語言學家和心理學家幫助其共同打造社交搜索工具,將各種人際交流技巧逐一“傳授”給這個社交搜索工具。

  Facebook做的是人類行為的生意。

  他的成功基礎是瞭解人們的“連線”方式:他們如何展示自我,他們留存了哪些記憶,他們信任哪些人。現在,他們還將探究人們如何查詢信息。

  Facebook本月推出了一款搜索工具,幫助用戶尋找各種問題的答案。但在此之前,他們卻組建了一個“大雜燴”式的團隊,對用戶在網上搜索哪些信息以及如何搜索展開了研究。

  這個團隊包括兩名語言學家、一名心理學博士和多名統計學家,外加為數眾多的程式員。他們的使命充滿野心又異常清晰:向Facebook的電腦傳授與人溝通的技巧。

  25歲的凱瑟琳‧海姆斯(Kathryn Hymes)2011年末離開了斯坦福的碩士項目,加盟了該團隊。她說,團隊目標是創造“自然而直觀的語言”。去年3月,艾米‧坎貝爾(Amy Campbell)也加入進來,她擁有加州大學伯克利分校語言學博士學位。

  團隊組建之初,Facebook的搜索引擎基本沒有什麼效果。按照海姆斯的說法,它只能理解“機器語言”,無法明白人與人之間真正的交流方式。他們必須教會機器如何理解問題的基本元素,這有點像教小學生學習句子成分。因此,所有代碼都必須調整。

  39歲的勞倫‧程(Loren Cheng)領導該項目的自然語言處理小組。他表示,搜索引擎必鬚根據用戶需求做出調整,很多用戶都對Facebook寄予厚望。“以前,你必須要按照電腦的規則使用電腦。”他說,“但現在,應該按照用戶的意願來設計。”

  這項研究的核心部分是在Facebook總部的一間實驗室中完成。團隊成員們躲在單向玻璃後面觀察著用戶使用不同版本的搜索引擎,然後將自己觀察到的現象記錄到筆記本上。工程師偶爾會著急地扯下自己的頭髮。

  他們查閱了字典、報紙和議會章程,試圖在浩如煙海的提問方式中找到共同的要領。隨後,他們開發出一種算法來理解提問者的意圖。與所有產品的開發過程一樣,他們不斷測試,不斷修改,不斷研究不同種類的用戶作何反應。

  這個項目集中體現了Facebook一貫的產品開發模式:它研究人類行為,它檢驗自己的創意,它的目標是吸引越來越多的人訪問它的網站,然後讓他們在上面停留更長時間。

  斯坦福大學人機交互專家克利福德‧納斯(Clifford I. Nass)表示,Facebook的產品並不是照搬人們在線下的互動方式,而是反映了一種 “理想化的人類交流方式”。

  “他們使用的心理學並不是純粹的人際交流心理學,”納斯說,“而是讓人們在網站上多停留一些時間的心理學,同時還能讓人們點擊網站上的廣告。”

  他解釋了Facebook為什麼有“喜歡”按鈕,而沒有“不喜歡”按鈕,那是因為負面情緒會把用戶嚇跑。“喜歡”按鈕的核心理念是基於一個名叫“同質性”(homophily)的心理學概念,即人們都喜歡相似類型的人或物。每當有用戶的Facebook好友被用在Sponsored Story廣告中時,都會配以該好友的資料圖片,原因在於人臉比文字更容易被人記住。

  Facebook不斷地針對全球各地背景各異的用戶測試和調整著各項功能,密切關注著他們的反應。Facebook搜索工具的第一個版本,可以通過挖掘該公司所處理的各種數據來回答問題,包括用戶照片、興趣和“喜歡”的東西。它最終還將挖掘狀態更新和其他活動,從用戶吃什麼到用戶在哪裡,從而將各種數據都囊或其中。Facebook高管曾經表示,搜索工具的整個推出流程異常緩慢,這樣一來,他們就可以更好地測試哪些模式有用,哪些沒用。

  Facebook以前的搜索功能非常簡單,只能回答很具體的問題。例如,當用戶想要查找斯坦福的同學時,就必須在搜索框中輸入“讀過斯坦福的人”。用詞必須非常規範,倘若改成“上過斯坦福的人”或是“唸過斯坦福的人”,搜索引擎就無法理解。

  與之類似,可以輸入“我的朋友”來查找好友,或是輸入“我去過的地方”來回顧自己曾經留下的足跡。

  勞倫‧程說,轉折點源自用戶測試環節。用戶當時成對地坐在一個小房間中,面前擺著一台筆記本電腦。Facebook的用戶體驗團隊成員讓用戶通過舊版的搜索引擎來搜索高中同學。

  受試者先是像使用傳統搜索引擎一樣輸入了關鍵詞,發現沒有效果後,他們又輸入了短句,之後是長句,但同樣不起作用。一名用戶的任務是尋找喜歡棒球的好友,但他的好友中最喜歡棒球的人卻沒有出現在結果中,因為這些好友喜歡的是“美國職業棒球大聯盟”,而不是“棒球”。

  躲在單向玻璃後的工程師都很疲憊。“如果代碼不起作用,不接地氣,他們就會發瘋。”他說,“工程師們從那天的測試中找到了問題的關鍵。我們需要重寫代碼。”

  現在,這款搜索引擎可以理解“學生”的25個近義詞,包括“新生”和“學子”等。還能理解另外25個差異略大,但指向相同的詞,例如“學者”。甚至可以將這些詞與時間參數(如在讀學生)或更加細緻的描述(如心理學專業)等信息整合到一起。如此一來,Facebook的搜索引擎至少可以識別出27.5萬種查找“學生”的方式。

  這款搜索工具已經面臨了一些非議。輕博客網站Tumblr最近的一篇文章顯示,該功能會披露一些令人不安的個人信息,甚至包括一些敏感內容。

  這款搜索工具將對搜索龍頭 Google 構成何種影響,會給Facebook帶來多大的“錢景”都還不得而知。該公司去年5月上市時成為歷史上規模最大的IPO(首次公開招股)之一,但此後卻上演了過山車行情。Facebook將於本週三發佈第四季度業績。

  還有很多事情等著研究人員去解決。例如,這款搜索引擎仍然很難理解很多句子。如果輸入“約翰喜歡並推薦的照片”時,它就會不知所措。另外,有些話通過面對面的口頭表達可以充分傳詞達意,可一旦落到紙面上,卻會產生歧義。碰到這種情況,Facebook的搜索引擎同樣無法理解句子內涵。

  “電腦不擅長理解背景因素,”坎貝爾說,“它們缺乏現實世界中的知識。”

  即使缺乏背景信息,Facebook仍然在努力瞭解現實世界中人與人之間的信任程度。它的搜索引擎會根據一種名為“社交距離”的笨拙結構來回答每一個搜索請求。它會通過算法判斷哪位Facebook好友與用戶的關係最為緊密,以及用戶最希望在搜索結果頂端看到誰的答案。為了實現這個目標,他們同樣採用了“同質性”的理念:倘若答案來自用戶“喜歡”的人,該用戶就更有可能關注這個答案,然後點擊鏈接。

  “心理學是實現目標的一種簡單易行的方法。”納斯教授說。(鼎宏)

Leave a Reply