人工智能的最後一公里
2021年01月30日00:33

原標題:人工智能的最後一公里

鄭磊/文

“機器會思考嗎?”人工智能之父艾倫·圖靈的這個問題已經部分得到解決,機器學習已經能夠在部分領域表現得像人類一樣會思考和行動,比如下棋。

目前,機器學習已經成為推動工業和社會發展的重要力量,可以實現從電子商務和廣告投放到教育和醫療等領域的自動化決策。基於計算機的圖像分析領域中的人臉識別是一個很好的例子。如果我們手裡有大量醫療影像照片,就可以用這些照片訓練機器,讓它學會看新照片,推測是否存在某種疾病。機器學習還可以用於公司安保系統,判斷訪客是否是公司員工。但是機器學習也受到很多詬病,主要是這種學習方式必須基於大量數據,甚至可以說這種人工智能必須是建立在大數據基礎之上。而現實中,很多時候我們要解決的問題,只有少量樣本可供使用。這就是智能機器和人類的一個本質差別,人類學習不僅基於已有信息和知識,更會舉一反三,把一個模型適當修改之後用在另一個場合。這就是遷移學習,是傳統機器學習下一步需要掌握的能力。

在過去的十幾年里,不管是在算法、理論研究還是實際場景應用方面,遷移學習都得到了越來越廣泛的關注和研究。《遷移學習》這本書由該領域資深專家撰寫,系統全面,包括了遷移學習理論、自動遷移學習、小樣本學習、終身機器學習等,以及在計算機視覺、自然語言處理、推薦系統、生物信息學、行為識別等方面的成果。

嬰兒首先學習如何分辨自己的父母,然後利用這種分辨能力去學習如何分辨其他人。兒童可以僅從一些例子中學習,就能快速歸納出規律。這種從小數據中學習的能力,使得我們能夠利用和調整以前的經驗,來幫助解決新問題。在這種學習的適應能力上,人類目前遙遙領先於智能機器。我們經常遇到的是相互孤立、碎片化的少量數據,有時候由於很多限製,無法收集到大量數據,比如隱私保護。此時,機器學習就遭遇了難以克服的瓶頸問題。而遷移學習正是針對這一挑戰的一種解決方案,這種學習機製可以使人工智能系統更加可靠和穩定,也使它可以採用更複雜的模型來應對將會出現的變化。

通過遷移學習可以讓知識得到重複利用,從而使獲得的經驗可以被重複地應用到現實世界中。如果人工智能能夠有效運用遷移學習,我們就可以獲得會終身學習的智能機器。這和人類進化的軌跡有類似之處,人工智能科學家一直在向這個方向努力。研究人員一開始就將遷移知識的能力當作人工智能的主要基石。類比學習、基於案例的推理、知識重用和重建、 終身機器學習等,都屬於這個範疇。在教育和學習心理學領域,學習遷移一直是研究有效學習的一個重要課題,人們堅信,最好的教學能使學生學會“如何學習”,並使所學知識適應未來的情況。

我們舉一個簡單易懂的遷移學習的例子。世界上有兩種道路系統,分別是靠左和靠右行車。比如,美國和中國內地的駕駛員位置在汽車的左側,並且汽車要靠右行駛。而在英國、中國香港地區,駕駛位置是在汽車右側,並且汽車靠左行駛。我住在深圳,習慣靠右行駛,但是到了香港,就不敢開車了,駕駛習慣很難轉換過來。但是以後可以乘坐自動駕駛的汽車,而遷移學習就能夠用在這裏,可以通過找出兩種駕駛中的共同特徵,讓自動駕駛系統自如切換。我們可以看到,無論駕駛員坐在哪一邊,離道路中心線始終是最近的。這一事實能夠使駕駛員將駕駛習慣順利地從一個方向“遷移”到另一個方向。遷移學習的關鍵要素是尋找不同領域和任務之間的這類“不變性”。當然,實際的遷移學習要比這個任務複雜得多。

在遷移學習中,算法仍是最核心的技術,包括基於樣本、特徵、模型和關係的算法。每一種遷移算法分別對應不同的知識遷移載體。文本挖掘是遷移學習算法的一個很好的應用場景,可以從文本中發現有用的結構性知識並將其應用於其他領域中。例如情感分類,在線論壇、博客、社交網絡等有大量用戶生成的內容,能夠從中總結消費者對產品和服務的看法非常重要,對於不同類型的產品、不同類型的在線網站、不同的行業,用戶可能使用不同的詞語表達他們具有相同情感的觀點。在這種情境下,就可以用遷移學習訓練出具有人類情感分類能力的機器。而當人工智能走完這最後一公里,可能就會讓很多人意識到它所帶來的嚴重威脅了。

(作者:鄭磊 編輯:董明潔)

關注我們Facebook專頁
    相關新聞
      更多瀏覽