GAITC專題論壇丨Amy Bruckman:“真相”的搭建是一個社會過程
2020年07月27日19:53

  原標題:GAITC專題論壇丨Amy Bruckman:“真相”的搭建是一個社會過程

  7月26日,由中國人工智能學會主辦、新浪新聞聯合浙江大學承辦的2020全球人工智能技術大會(2020GAITC)“AI時代下的新媒體與社交娛樂”專題論壇拉開帷幕,新浪集團首席信息官、新浪AI媒體研究院院長王巍,浙江大學特聘教授、雪梨科技大學教授、百度研究院訪問教授楊易共同擔任論壇主席。

  喬治亞理工大學互動計算學院副院長、教授、ACM Fellow Amy Bruckman在本次專題論壇上,與來自業界、學術界的嘉賓們分享了《我們應該相信維基百科嗎?——社會認知論如何讓我們成為更好的互聯網研究員和數據科學家》。

喬治亞理工大學互動計算學院副院長、教授、ACM Fellow Amy Bruckman
喬治亞理工大學互動計算學院副院長、教授、ACM Fellow Amy Bruckman

  Amy Bruckman認為,“知識”由社會共識搭建。“真相”的搭建是一個社會過程。社會計算研究者可以對“真相”和“知識”的本質進行更多的研究。如果我們對這些社會行為越多瞭解,就越可能搭建一個更好的互聯網。

  以下為Amy Bruckman演講實錄,內容經編輯略有刪減:

  大家好,我是Amy Bruckman,來自喬治亞理工大學。今天,我很高興在今年的全球人工智能技術大會上與大家見面。我今天演講的主題是《我們應該相信維基百科嗎?——社會認知論如何讓我們成為更好的互聯網研究員和數據科學家》。

  人類活動是否改變了氣候?你是怎麼知道這個答案的?

  幾年前,我在辦公室大樓附近試著跟路過的人交流,向他們詢問這個問題。我得到的答案各種各樣。有人說,讀過相關的研究報導;還有人說,是在新聞上看到的;其他人告訴我說,小學六年級的時候老師就教過這些。

  有趣的是,有一個人,我跟她聊了之後,向我講述了她對氣候變化的直接感觸。她說,有一次她去阿拉斯加渡假。巴士將他們帶到車站,讓遊客去看冰川。導遊告訴他們,如今從車站出發去看冰川還需要走兩小時。而以前下車就可以看到冰川。

  我們所有人,都沒有時間成為一個氣候科學家,進而決定我們怎麼看待全球氣候變化。我們只是依賴我們所信任的信息來源。我們也沒有時間成為流行病學家。但是當我們在決定是否要為孩子接種疫苗時,我們依舊會依賴我們所信任的信息來源。

  那麼,知道某件事意味著什麼呢?

  作為互聯網研究員,我們跟知識打交道。但,什麼是知識?

  今天,我想跟大家從哲學角度聊聊這個問題,希望我的內容能給大家帶來幫助,幫助你們更好地處理大數據,更好地瞭解計算機科學家的工作。

  我們對知識有一個正式的定義,即知識是“確證的真信念”。什麼是“確證的真信念”?比如,在美國有一檔電視遊戲節目,參與者可以贏取大獎。節目里,他們準備了三塊簾幕,其中一塊簾幕後藏著一部新車。其他兩塊簾幕後可能藏著一年的洗衣液或一隻燒雞之類的。如果你說,我猜新車在三號簾幕背後。如果你只是憑直覺猜測的話,那這就不算是“確證的真信念”。但是,如果有人告訴你,選擇三號簾幕,車就在三號簾幕背後,然後你也相信這個後台工作人員的話,那麼這時候這就可以算作“確證的真信念”。

  對於擁有知識這件事,首先知識應該是真實的,其次你也有理由相信這個知識。接下來問題又出現了:什麼是真相?

  我們對世界的認識基於我們對世界的感知。世界的一切表象都是近似的。當我還在本科讀物理專業的時候,作為大一新生,他們教給我們正在研究的現象的近似模型。因為我們是新手物理學家。等我們長大一些後,他們會教我們一些真實的現象。很快我就發現,所有表象都是近似的。即便是一個成熟的物理學家,你也會發現其實沒有真實的答案或真實的模型可以研究。我們對現實中的現象做心理表徵,我們對現實中的現象做物理表徵,我們用我們的感官去感知事物,然後做出表徵,這些都是近似的。事實上,我們的世界只有一種完美的模型,就是世界本身。我非常喜歡博爾赫斯(Borges)的短篇小說。他畫過一幅非常詳盡的地圖,儼然一個真實的地區。某一地區的唯一完美地圖就是該地區本身。

  那是一張椅子嗎?你看到那有一張椅子嗎?看到椅子的照片了嗎?我看到一張椅子的照片。這對於真實意味著什麼?那有一張椅子,真實嗎?我們對客觀現實是否存在,有不同的理解方式。

  純粹主觀主義認為,我們受製於主觀感知。也就是說,我覺得我看到了一張椅子,但我無法向你證明我看到一張椅子。我們永遠不會知道答案。也許,我們都陷入了黑客帝國電影情節的循環往複中。也許,有人知道什麼是真實的,什麼不是真實的。我們都囿於自己的主觀感知。因而也不存在客觀現實。反之,客觀主義認為,世界是存在的,跟我們的感知是主觀的這一事實無關。真相是存在的,感知真相也是沒有問題的。

  若這兩種方法都有些極端的話,那麼好在我們還有折衷方案。哲學家希拉里•普特南(Hilary Putnam)提出了介於兩個極端之間的內在實在論(internal realism)。內在實在論認為,我受限於我的主觀感知;你受限於你的主觀感知。但是我們為什麼不能一致同意,確實有一張椅子的照片就在那裡呢?因為椅子的確存在。所以,雖然我們都受限於我們各自的主觀感知,但由於世界的存在,我們主觀感知之間便有了不太可能產生的相關性。現實真實存在。

  那麼,什麼是真相?

  有三種理解方式。基礎論認為,所有信念都可以從一組確證的基礎信念中衍生得出。也就是說,如果我相信某件事,那麼我肯定有理由來解釋我為什麼相信這件事,再往下分析即我肯定有理由來解釋我為什麼相信那些用來解釋我為什麼相信這件事的事情,如此不斷剖析下去,一直到建立這一系列信任的基礎事實。而這些基礎事實源於我們的感官感知。這個方式雖然嚴謹,但在現實中這麼刨根究底地證明下去顯然非常不切實際。

  於是,融貫論認為,我們不必讓所有事實都立足於基本事實,只需讓你的世界觀內部融貫即可。融貫論的問題在於某些錯誤的世界觀似乎也可以融貫起來。比如,登月偽造論也可以具有相關性。所以,融貫論對我們沒有實際幫助。

  隨後又來到另一個極端。懷疑論認為,確證的基礎信念並不存在,一切都是不可確證的。

  好在,我們在這裏也有一個合理且適度的折衷辦法可以讓我們擺脫困境。基礎論和懷疑論都不盡如人意。兩者的中間即溫和基礎論。溫和基礎輪認為,基礎信念是自發形成的。關於外部世界的信念,包括關於經驗和感官品質的信念等等,都是合理而基礎的。如果自發形成的信念是對經驗的正確反應,那麼自發形成的信念就是合理的。非基礎信念可以從一組基礎信念中推斷得出。所以,這是在更極端的主觀主義與客觀主義之間對認識理由的一種很好的折衷。

  現在讓我們來回顧一下。我們知道,我們每一個人囿於自己的主觀感知,現實是存在的。以及,若信念是對經驗的正確反應,則信念是確證的且不會被其他信念挑戰。但是,不同的人如何對一個事實達成同意呢?知識的社會建構論認為,我們決定什麼是真實的方式,本質上取決於社會。拉圖(Latour)和伍爾加(Woolgar)共同撰寫的著作談到了科學事實的建構。

  這裏我們用密立根(Millikan)和福萊柴爾(Fletcher)的電子電荷實驗為例。當你第一次提到油滴實驗時,可能有人會說密立根和福萊柴爾稱電子帶單一電荷。當越來越多人知道這件事後,你可能就會說電子電荷是單一的。隨著更多人知道這件事,你可能覺得都沒有必要再提起這個證明。我們知道電子電荷就是e。

  某件事變為事實的過程,其實就是越來越多人接受這件事的過程。相信的人越多,真實性越高。這就是知識的社會建構論。但是,如果大家都錯了呢?(諺語云“三人成虎”。)

  毫無疑問,我們都會犯錯。但是在任何給定的時間,我們都同意的事實是我們去瞭解真相所能做的最大努力。我們也會不斷糾正已知的事實,根據經驗合理調整信念。所以,知識是社會構建的。越是經過仔細審核的事實,越經得起考驗,可信度就越高。知識和科學的社會構建的一個機製就是同行評議。同行評議是這樣的:你提交一份科學論文給同行評議,有三位同行會閱讀你的論文。這三個閱讀論文的人,分別是他們審閱內容領域的專家。如果他們審閱的那部分內容不在他們的專業領域內,他們就會不斷學習。

  如果科學論文草稿引用了他們從未親自閱讀過的參考文獻,那麼他們會確保在撰寫評論之前自己已經閱讀且熟悉這些引用的內容。理論上是這樣,但實際情況可能並非如此。

  也許不是每個人在審閱論文的時候都會這麼做。我們也不必理想化同行評議的過程。想像一下實際的情況:人們拿到一份需要評議的論文,然後根據自己的知識和能力,盡力審閱手頭的論文。這個過程有利也有弊。而且,多個領域的學科交叉趨勢也給同行評議帶來諸多困難,因為找到在內容涉及的各個方面都真正具有背景的評審員也越來越困難。

  以上都是背景介紹。現在,我想回到我一開始提出的問題:你應該相信維基百科嗎?我知道維基百科在中國的使用率不高,但我希望各位有機會可以去瞭解一下。

  維基百科很棒。它的神奇之處在於,它是一個人人都可編輯的百科全書,具有高質量的內容。我想跟大家說的是,維基百科上的內容是怎麼審核的。

  我給大家舉個例子。某個在一夜之間成名之人的維基百科頁面的編輯曆史,是個極好的例子。比如,新教皇的任命或者某人被任命為美國最高法院法官等等。我在這裏要舉的一個例子是美國最高法院大法官約翰•羅伯茨(John Roberts)。

  羅伯茨的維基頁面創建於2005年5月。當時,他的維基頁面上內容寥寥無幾,只介紹了他是一名法官,在哪裡上過學,被誰任命過等信息。在接下來的幾個月裡,他的維基頁面一共才被編輯過9次。但是,在他被提名為最高法院大法官那天,頁面一共被編輯過31次。到7月底,一共有359人對該維基頁面進行了1200次編輯。其中174人是登錄用戶,其餘為匿名用戶。當前版本的內容超過7000個單詞。內容的豐富程度令人歎為觀止,包括完整的傳記,他的所有司法觀點索引以及他在各種問題上的立場。內容非常全面,也非常令人印象深刻。

  讓我們將期刊論文的同行評議與熱門的維基頁面編輯做一個比較。對於經過高質量同行評議審閱過的期刊論文,會有三名審稿人閱讀該論文,一旦這三名審稿人說論文可以發表,那麼文章就會發出去,然後再也不能編輯修改。但是對於一個熱門的維基頁面,可能有上千人在審閱上面的內容。惡意破壞行為通常也會在幾秒內得到修正,並且頁面內容也會不斷更新,但這是熱門的維基頁面的情況。

  我們說說冷門的維基頁面。比如,這是馬薩諸塞州議會大廈的維基頁面。這個頁面上說壁畫“Columbia Knighting Her World War Disabled”里的模特是諾瑪•布羅德尼•科恩(Norma Brodney Cohen)。如果你查看頁面下方引用的文獻,你會發現有證據支持以下說法:壁畫中的模特之一是壁畫作者的母親莎拉•布羅德尼(Sarah Brodney)。但卻沒有證據支持畫中哥倫比亞的模特是畫家的姐姐諾瑪這一說法。既然沒有證據支持這個說法,那為什麼這個內容還出現在維基頁面上呢?因為那是我放上去的。諾瑪是我的奶奶。如果我有證據,我一定會把引用文獻放上去,證明諾瑪確實是畫中的模特。但遺憾的是,沒有這樣的證據。那為什麼一個沒有證據支持的說法依舊出現在維基頁面上呢?答案是沒人在乎馬薩諸塞州議會大廈內的壁畫。一個相對鮮為人知的頁面,可靠性也相對低一些。題外話,我可以向你們保證,畫中哥倫比亞的模特真的是諾瑪。如果我找到可以引用的文獻,我一定會加到那個維基頁面上。但這裏我真正想闡述的是,一個維基頁面的可靠性取決於該頁面的熱門程度。

  在我看來,對於一個熱門的頁面,維基頁面可以說是有史以來最準確的信息形式。但越是冷門的頁面,可靠性越低。這麼說有點複雜。但要理解這一點,你首先得理解知識的社會建構。

  所以,維基百科的功能可見性完美地匹配了知識的社會建構。我們知道,在維基頁面上有修訂曆史。你可以查看每一個維基頁面的所有曆史版本,包括最初版本。每個維基頁面都有一個討論頁。你可以轉到首頁跟其他編輯人員討論如何編輯該頁面。事實上,規定什麼可以出現在維基頁面上、什麼不可以出現在維基頁面上的政策也可以被用戶編輯。這些也在維基頁面上,你要做的就是在討論頁上跟大家討論。如果某個政策更改獲得大家的一致同意,那麼你就可以更改政策頁的內容。但如果你不跟大家商量徑直更改內容的話,內容很快就會被恢復到原樣。維基百科上還有一些維基項目,維基項目是一群在某一領域有共同興趣並協調編輯活動的人。例如,有一個醫學維基項目,旨在改善維基百科上的所有醫學文章;還有鯊魚維基項目,旨在管理所有鯊魚條目。所有這些機製都是為了改進維基百科上社會建構的知識質量。

  作為數據科學家,我們在真相方面,面臨獨特的挑戰。我們處理的不是不確定性,而是概率。我認為,我們數據科學家有這份道德責任來闡明我們所發現事物的局限性,尤其是數據和模型的局限性。比如,我們在做機器學習,從數據集學習的時候,結果的好壞取決於初始數據的質量。如果初始數據不可靠,那麼結果也一樣不可靠。如果初始數據帶有曆史偏見,那麼結果也會帶有曆史偏見。輸入的是垃圾,輸出的也是垃圾。我們對大數據的分析質量完全取決於我們輸入的數據。至於模型的質量,有時我們可以對現象建模,我們嚐試推斷事務,有時理想,有時則不太理想。所以我們負有道德責任,來闡明數據和模型的局限性。我們也儘可能創建與現實具有一定程度對應性的表述。如果我們闡明支持我們表述之證據的局限性,或許可以幫助我們更好的分享知識。

  最後,總結一下我今天演講的內容。世界真實存在,但我們只能通過易出差錯的感官來感知現實世界。知識由社會共識搭建。真相的搭建是一個社會過程。社會計算研究者可以對“真相“和”知識“的本質進行更多的研究。如果我們對這些社會行為越多瞭解,就越可能搭建一個更好的互聯網。

  我們可以從諸如維基百科這些成功的項目中獲益匪淺。維基百科理論上行不通,但只在實踐中行得通。希望我今天的內容能給大家帶來一些啟發。無論你是否經常使用維基百科,你都可以將其視為一個展示互聯網潛力的神奇模型。

  今天的演講內容來自我正在撰寫一書的第二章。這本書的書名叫《你應該相信維基百科嗎——知識和在線社區的設計》。這本書將在明年由劍橋大學出版社出版。最後,希望大家對今天的內容感興趣,或許今天的分享也能讓各位對新書感興趣。

  最後再次感謝各位。希望這次演講對大家有幫助。也感謝我的同事和學生們。感謝收聽!

關注我們Facebook專頁
    相關新聞
      更多瀏覽