您的位置:首頁»正文

人工智慧漫談

人工智慧現在已經有62歲了。 人們普遍認為1956年美國的達特茅斯研討會Summer Research Project on Artificial Intelligence, 是現代人工智慧的起點。 這也是人工智慧, Artificial Intelligence這個詞首次登場。 這個會議是由四個人發起的, 分別是明斯基Minsky, 約翰.麥卡錫McCarthy, 羅切斯特Rochester和香農Shannon。 作為劃時代歷史意義的一次會議, 當然不會只是提出了AI的名稱, 更重要的是帶來了三個標誌性的研究成果, 分別是明斯基提出的 SNARC, 麥卡錫John McCarthy提出的α-β搜索法, Allen Newell提出的 “邏輯理論家”。

會議原址

達特茅斯樓

明斯基Minsky在這次會議上提出SNARC(Stochastic Neural Analog Reinforcement Calculator), 這是世界上第一台神經元網路電腦, 用3000個真空管來模擬40個神經元組成的網路。

後來他去普林斯頓大學讀數學博士學位, 博士論文題目是《神經網路與大腦模型問題》, 當時評委認為神經網路不是數學, 還好馮.諾依曼力挺他, 說”現在不算, 但很快就得算”。 馮老眼光很准, 神經元網路後來遭受了幾次危機, 都是靠著數學上的突破才一一化解。 而且數學上可以證明, 神經元網路可以無限逼近任何連續函數, 這是堅實的理論基礎。 遺憾的是後來隨著研究的深入, Minsky對神經元網路的態度越來越消極, 1969年他提出神經元網路不能解決XOR異或問題。 確實只有一層的神經元網路是無法解決XOR問題的, Minsky承認多層神經元網路或許能做更多, 但是他(認為)找不到訓練隱藏層的方法。 這導致神經元網路陷入第一次低谷。
直到1986年Hinton等人發明了BP演算法, 人們掌握了訓練多層神經元網路的方法, 多層神經元網路才重新回到人工智慧舞臺中央。 明斯基2016年才去世, 他這一輩子是真正見證和影響了人工智慧的潮起潮落。

Minsky

John McCarthy提出α-β搜索法, 主要用於下棋的高效搜索問題。 如果我們把圍棋簡化為2*2的格子, 那麼第一步黑棋有4種可能的落子位置, 第二步白棋有3種可能, 第三步黑棋有2種可能, 最後白棋只有一種可能。 真實的圍棋是19*19的格子, 所以每一步落子都有19*19種可能(實際後面落子選擇少於19*19), 一盤棋的總落子大概有19*19步(實際棋局多在200步左右, 小於19*19), 也就是總的搜索空間為 (19*19)(19*19)。 我們把問題一般化, 總的搜索空間為Bd, 其中B(Branch)為每一次的搜索分支, 而D(Depth)則為搜素樹的深度。

也就是我們可以把總的搜索空間看成是一個樹形結構, B和D分別是樹的寬度和深度。 搜素演算法的核心就是通過一些規則來減少搜尋樹上的一些分支, 也就是剪枝。 所以α-β搜索法也叫做α-β剪枝演算法。 1997年IBM的深藍打敗世界象棋冠軍卡斯帕羅夫, 使用的主要就是α-β搜索法, 當然當時使用了分散式運算, 跑在30台IBM電腦上。

John McCarthy

Allen Newell和西蒙一起提出“邏輯理論家”Logic Theroist。 這是一個推理程式, 可以證明羅素《數學原理》的第二章的大部分定理。 這個程式給所有與會人帶來了深刻的印象。 但之前Newell曾給邏輯學最重要的刊物《符號邏輯雜誌》投稿, 被慘遭退稿, 理由是“把一本過時的邏輯書中的定理用機器重新證明一遍沒有價值”。

Newell和西蒙認為, 現實世界中所存在的物件和過程,

都是可以用符號來描述和解釋。 Newell現在被認為是符號主義學派的創始人。 符號主義認為, 所有的知識都可以用符號(也就是規則)來表示, 人類的認知過程, 就是各種符號進行運算的過程(各種規則的組合推理), 推理就是採用啟發式知識及啟發式搜索對問題求解的過程。 符號主義在人工智慧發展的大部分歲月裡, 一直佔據著主導地位, 決策樹和專家系統是這個流派的力作。

Newell

1956年, Minsky, McCarthy和 Newell三個人都是28歲, 都是年輕小夥子, 也沒有什麼名氣。 所以當時 McCarthy把香農Shannon請去了參加這個會議, 扯虎皮做大旗, 因為在1953年 Minsky和McCarthy都曾在貝爾實驗室給香農打工。 當時香農已經40歲了, 作為資訊理論的發明人, 他在科學史上的地位基本上跟圖靈差不多。

香農在貝爾實驗室的同事們把香農和愛因斯坦相提並論, 並認為“這樣的比較是不公平的, 對香農不公平!”。 香農發明的資訊熵函數, 在決策樹演算法中扮演著關鍵角色。

香農

這次會議被認為是里程碑式的, 是人工智慧的歷史起點, 主要有兩個原因。

第一, 人工智慧隨後發展的20年, 基本上被這些人, 或者這些人在MIT、斯坦福、CMU等的同事、學生們主宰了。 Minsky, McCarthy和 Newell三個人後來都獲得了圖靈獎。

第二, 這次會議提出的演算法和思想, 深刻的影響了隨後人工智慧幾十年的發展。

人工智慧歷史的60年, 普遍認為有兩個主要的流派, 一個是符號邏輯主義, 就是Newell提出的思想, 專家系統和知識工程就屬於這個流派, 在AI歷史上長期佔據主流地位。 另一個是聯接主義, 神經元網路是其出色代表,歷史上神經元網路三起三落,但自從2006年以來的這十年可以說是風頭正盛,深度學習儼然成了人工智慧的代名詞。現在看,這兩個流派的思想,在1956年的會議上就已經提出來了。α-β搜索法和其後續的變種,也深刻影響著搜索問題的求解。

現在我們站在2018年往回看, 當年的人工智慧思想和現代人工智慧思想,有一個本質的不同,就是缺少概率和統計學的引入。在AI發展之初,本質上還是由人類輸入各種邏輯推理的思想並程式化,也就是機器的智慧肯定小於人類程式師的智慧。 但隨著電腦、互聯網和大資料的出現,我們現在有了超大資料集可用,算力也得到長足的發展,所以使用的方法也基本轉變為基於概率和統計的方法。 貝葉斯概率圖、蒙特卡洛搜尋樹,都是基於概率和統計的演算法。 機器學習演算法,本質上也是利用大量的資料來找到合適的規律並用公式表達。

用於圖像識別的神經元網路更是如此, 只需要輸入大量帶有標記的圖片,訓練完畢的神經元網路即可以學習到識別是貓還是狗,識別的準確度甚至可以達到98%,超過人類識別率的95%。 這個過程並不需要人類編寫程式規則說貓的特徵是圓臉、圓眼睛、長有鬍子、毛茸茸的等等,所有的特徵是程式通過大量的訓練樣本自己學習得到的。所以我們說現在機器的智慧在某些特定領域可以超過人類的智慧。

在深度學習火爆的今天,也有很多學者指出其問題:

1)現在的訓練方法需要大樣本,跟人類的智力還有本質區別,人類基於少量的樣本就可以得到答案。

2)過程無法解釋,儘管訓練好的模型可以識別貓和狗,但是你不知道為什麼。而基於規則的符號主義模型,儘管準確度不如神經元網路模型,卻是完全可以解釋的。

3)沒有常識,也就是沒有知識工程。比如說貓可以飛嗎? 貓是動物,貓沒有翅膀,會飛的動物都有翅膀,所以貓不可以飛。 符號主義系統只需要把這幾條規則(專家知識)串到一起就可以得到正確的答案。但是你卻無法訓練一個神經元網路得到這個結果。

4)不具備預測和規劃能力。

這些聲音顯示著,儘管神經網路在工程界大行其道,學術界卻在呼喚符號主義。就跟光的波動派和粒子派之爭一樣,歷史總是螺旋式上升的,歷史不會簡單重複, 學術思想總是在不斷的豐富和完善,而工程界有了超大規模資料、超強算力的支持, 我們大可期待人工智慧科學的燦爛發展。

請持續關注“人工智慧園地”

另一個是聯接主義, 神經元網路是其出色代表,歷史上神經元網路三起三落,但自從2006年以來的這十年可以說是風頭正盛,深度學習儼然成了人工智慧的代名詞。現在看,這兩個流派的思想,在1956年的會議上就已經提出來了。α-β搜索法和其後續的變種,也深刻影響著搜索問題的求解。

現在我們站在2018年往回看, 當年的人工智慧思想和現代人工智慧思想,有一個本質的不同,就是缺少概率和統計學的引入。在AI發展之初,本質上還是由人類輸入各種邏輯推理的思想並程式化,也就是機器的智慧肯定小於人類程式師的智慧。 但隨著電腦、互聯網和大資料的出現,我們現在有了超大資料集可用,算力也得到長足的發展,所以使用的方法也基本轉變為基於概率和統計的方法。 貝葉斯概率圖、蒙特卡洛搜尋樹,都是基於概率和統計的演算法。 機器學習演算法,本質上也是利用大量的資料來找到合適的規律並用公式表達。

用於圖像識別的神經元網路更是如此, 只需要輸入大量帶有標記的圖片,訓練完畢的神經元網路即可以學習到識別是貓還是狗,識別的準確度甚至可以達到98%,超過人類識別率的95%。 這個過程並不需要人類編寫程式規則說貓的特徵是圓臉、圓眼睛、長有鬍子、毛茸茸的等等,所有的特徵是程式通過大量的訓練樣本自己學習得到的。所以我們說現在機器的智慧在某些特定領域可以超過人類的智慧。

在深度學習火爆的今天,也有很多學者指出其問題:

1)現在的訓練方法需要大樣本,跟人類的智力還有本質區別,人類基於少量的樣本就可以得到答案。

2)過程無法解釋,儘管訓練好的模型可以識別貓和狗,但是你不知道為什麼。而基於規則的符號主義模型,儘管準確度不如神經元網路模型,卻是完全可以解釋的。

3)沒有常識,也就是沒有知識工程。比如說貓可以飛嗎? 貓是動物,貓沒有翅膀,會飛的動物都有翅膀,所以貓不可以飛。 符號主義系統只需要把這幾條規則(專家知識)串到一起就可以得到正確的答案。但是你卻無法訓練一個神經元網路得到這個結果。

4)不具備預測和規劃能力。

這些聲音顯示著,儘管神經網路在工程界大行其道,學術界卻在呼喚符號主義。就跟光的波動派和粒子派之爭一樣,歷史總是螺旋式上升的,歷史不會簡單重複, 學術思想總是在不斷的豐富和完善,而工程界有了超大規模資料、超強算力的支持, 我們大可期待人工智慧科學的燦爛發展。

請持續關注“人工智慧園地”

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示