人工智慧現在已經有62歲了。 人們普遍認為1956年美國的達特茅斯研討會Summer Research Project on Artificial Intelligence, 是現代人工智慧的起點。 這也是人工智慧, Artificial Intelligence這個詞首次登場。 這個會議是由四個人發起的, 分別是明斯基Minsky, 約翰.麥卡錫McCarthy, 羅切斯特Rochester和香農Shannon。 作為劃時代歷史意義的一次會議, 當然不會只是提出了AI的名稱, 更重要的是帶來了三個標誌性的研究成果, 分別是明斯基提出的 SNARC, 麥卡錫John McCarthy提出的α-β搜索法, Allen Newell提出的 “邏輯理論家”。
會議原址
達特茅斯樓
明斯基Minsky在這次會議上提出SNARC(Stochastic Neural Analog Reinforcement Calculator), 這是世界上第一台神經元網路電腦, 用3000個真空管來模擬40個神經元組成的網路。
Minsky
John McCarthy提出α-β搜索法, 主要用於下棋的高效搜索問題。 如果我們把圍棋簡化為2*2的格子, 那麼第一步黑棋有4種可能的落子位置, 第二步白棋有3種可能, 第三步黑棋有2種可能, 最後白棋只有一種可能。 真實的圍棋是19*19的格子, 所以每一步落子都有19*19種可能(實際後面落子選擇少於19*19), 一盤棋的總落子大概有19*19步(實際棋局多在200步左右, 小於19*19), 也就是總的搜索空間為 (19*19)(19*19)。 我們把問題一般化, 總的搜索空間為Bd, 其中B(Branch)為每一次的搜索分支, 而D(Depth)則為搜素樹的深度。
John McCarthy
Allen Newell和西蒙一起提出“邏輯理論家”Logic Theroist。 這是一個推理程式, 可以證明羅素《數學原理》的第二章的大部分定理。 這個程式給所有與會人帶來了深刻的印象。 但之前Newell曾給邏輯學最重要的刊物《符號邏輯雜誌》投稿, 被慘遭退稿, 理由是“把一本過時的邏輯書中的定理用機器重新證明一遍沒有價值”。
Newell和西蒙認為, 現實世界中所存在的物件和過程,
Newell
1956年, Minsky, McCarthy和 Newell三個人都是28歲, 都是年輕小夥子, 也沒有什麼名氣。 所以當時 McCarthy把香農Shannon請去了參加這個會議, 扯虎皮做大旗, 因為在1953年 Minsky和McCarthy都曾在貝爾實驗室給香農打工。 當時香農已經40歲了, 作為資訊理論的發明人, 他在科學史上的地位基本上跟圖靈差不多。
香農
這次會議被認為是里程碑式的, 是人工智慧的歷史起點, 主要有兩個原因。
第一, 人工智慧隨後發展的20年, 基本上被這些人, 或者這些人在MIT、斯坦福、CMU等的同事、學生們主宰了。 Minsky, McCarthy和 Newell三個人後來都獲得了圖靈獎。
第二, 這次會議提出的演算法和思想, 深刻的影響了隨後人工智慧幾十年的發展。
人工智慧歷史的60年, 普遍認為有兩個主要的流派, 一個是符號邏輯主義, 就是Newell提出的思想, 專家系統和知識工程就屬於這個流派, 在AI歷史上長期佔據主流地位。 另一個是聯接主義, 神經元網路是其出色代表,歷史上神經元網路三起三落,但自從2006年以來的這十年可以說是風頭正盛,深度學習儼然成了人工智慧的代名詞。現在看,這兩個流派的思想,在1956年的會議上就已經提出來了。α-β搜索法和其後續的變種,也深刻影響著搜索問題的求解。
現在我們站在2018年往回看, 當年的人工智慧思想和現代人工智慧思想,有一個本質的不同,就是缺少概率和統計學的引入。在AI發展之初,本質上還是由人類輸入各種邏輯推理的思想並程式化,也就是機器的智慧肯定小於人類程式師的智慧。 但隨著電腦、互聯網和大資料的出現,我們現在有了超大資料集可用,算力也得到長足的發展,所以使用的方法也基本轉變為基於概率和統計的方法。 貝葉斯概率圖、蒙特卡洛搜尋樹,都是基於概率和統計的演算法。 機器學習演算法,本質上也是利用大量的資料來找到合適的規律並用公式表達。
用於圖像識別的神經元網路更是如此, 只需要輸入大量帶有標記的圖片,訓練完畢的神經元網路即可以學習到識別是貓還是狗,識別的準確度甚至可以達到98%,超過人類識別率的95%。 這個過程並不需要人類編寫程式規則說貓的特徵是圓臉、圓眼睛、長有鬍子、毛茸茸的等等,所有的特徵是程式通過大量的訓練樣本自己學習得到的。所以我們說現在機器的智慧在某些特定領域可以超過人類的智慧。
在深度學習火爆的今天,也有很多學者指出其問題:
1)現在的訓練方法需要大樣本,跟人類的智力還有本質區別,人類基於少量的樣本就可以得到答案。
2)過程無法解釋,儘管訓練好的模型可以識別貓和狗,但是你不知道為什麼。而基於規則的符號主義模型,儘管準確度不如神經元網路模型,卻是完全可以解釋的。
3)沒有常識,也就是沒有知識工程。比如說貓可以飛嗎? 貓是動物,貓沒有翅膀,會飛的動物都有翅膀,所以貓不可以飛。 符號主義系統只需要把這幾條規則(專家知識)串到一起就可以得到正確的答案。但是你卻無法訓練一個神經元網路得到這個結果。
4)不具備預測和規劃能力。
這些聲音顯示著,儘管神經網路在工程界大行其道,學術界卻在呼喚符號主義。就跟光的波動派和粒子派之爭一樣,歷史總是螺旋式上升的,歷史不會簡單重複, 學術思想總是在不斷的豐富和完善,而工程界有了超大規模資料、超強算力的支持, 我們大可期待人工智慧科學的燦爛發展。
請持續關注“人工智慧園地”
另一個是聯接主義, 神經元網路是其出色代表,歷史上神經元網路三起三落,但自從2006年以來的這十年可以說是風頭正盛,深度學習儼然成了人工智慧的代名詞。現在看,這兩個流派的思想,在1956年的會議上就已經提出來了。α-β搜索法和其後續的變種,也深刻影響著搜索問題的求解。現在我們站在2018年往回看, 當年的人工智慧思想和現代人工智慧思想,有一個本質的不同,就是缺少概率和統計學的引入。在AI發展之初,本質上還是由人類輸入各種邏輯推理的思想並程式化,也就是機器的智慧肯定小於人類程式師的智慧。 但隨著電腦、互聯網和大資料的出現,我們現在有了超大資料集可用,算力也得到長足的發展,所以使用的方法也基本轉變為基於概率和統計的方法。 貝葉斯概率圖、蒙特卡洛搜尋樹,都是基於概率和統計的演算法。 機器學習演算法,本質上也是利用大量的資料來找到合適的規律並用公式表達。
用於圖像識別的神經元網路更是如此, 只需要輸入大量帶有標記的圖片,訓練完畢的神經元網路即可以學習到識別是貓還是狗,識別的準確度甚至可以達到98%,超過人類識別率的95%。 這個過程並不需要人類編寫程式規則說貓的特徵是圓臉、圓眼睛、長有鬍子、毛茸茸的等等,所有的特徵是程式通過大量的訓練樣本自己學習得到的。所以我們說現在機器的智慧在某些特定領域可以超過人類的智慧。
在深度學習火爆的今天,也有很多學者指出其問題:
1)現在的訓練方法需要大樣本,跟人類的智力還有本質區別,人類基於少量的樣本就可以得到答案。
2)過程無法解釋,儘管訓練好的模型可以識別貓和狗,但是你不知道為什麼。而基於規則的符號主義模型,儘管準確度不如神經元網路模型,卻是完全可以解釋的。
3)沒有常識,也就是沒有知識工程。比如說貓可以飛嗎? 貓是動物,貓沒有翅膀,會飛的動物都有翅膀,所以貓不可以飛。 符號主義系統只需要把這幾條規則(專家知識)串到一起就可以得到正確的答案。但是你卻無法訓練一個神經元網路得到這個結果。
4)不具備預測和規劃能力。
這些聲音顯示著,儘管神經網路在工程界大行其道,學術界卻在呼喚符號主義。就跟光的波動派和粒子派之爭一樣,歷史總是螺旋式上升的,歷史不會簡單重複, 學術思想總是在不斷的豐富和完善,而工程界有了超大規模資料、超強算力的支持, 我們大可期待人工智慧科學的燦爛發展。
請持續關注“人工智慧園地”