作者_(dá)龔才春
編輯_譚婧
感知機(jī)模型可以被視為一種最簡單的前饋式人工神經(jīng)網(wǎng)絡(luò)(是一種二元線性分類器)。
她是誰的作品?
感知機(jī)模型,Perceptron Model,又譯作感知器模型,是模擬人腦神經(jīng)元工作原理的一種人工神經(jīng)網(wǎng)絡(luò)。
感知機(jī)是人工神經(jīng)網(wǎng)絡(luò)中的一種典型結(jié)構(gòu),她的主要特點(diǎn)是結(jié)構(gòu)簡單,對所能解決的問題存在收斂算法,并能從數(shù)學(xué)上嚴(yán)格證明,從而對神經(jīng)網(wǎng)絡(luò)的研究起到重要的推動作用。
1957年,羅森·布拉特(Frank Rosenblatt)在就職于康奈爾航空實(shí)驗(yàn)室(Cornell Aeronautical Laboratory)時(shí)發(fā)明。
羅森·布拉特給出了相應(yīng)的感知機(jī)學(xué)習(xí)算法,常用的有感知機(jī)學(xué)習(xí)、最小二乘法和梯度下降法。
譬如,感知機(jī)利用梯度下降法對損失函數(shù)進(jìn)行極小化,求出可將訓(xùn)練數(shù)據(jù)進(jìn)行線性劃分的分離超平面,從而求得感知機(jī)模型。
感知機(jī)模型是人們用機(jī)器模擬人類智能的最早嘗試。
感知機(jī)是支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò)的基礎(chǔ),希望學(xué)習(xí)支持向量機(jī)或人工神經(jīng)網(wǎng)絡(luò),以及現(xiàn)在如日中天的深度學(xué)習(xí)模型的從業(yè)者,都需要熟練掌握感知機(jī)模型。
羅森·布拉特提出的感知機(jī)模型雖然由于人工智能先驅(qū)Marvin Minsky不看好而一度被打入“冷宮”,但近期由于深度學(xué)習(xí)的興起,感知機(jī)模型的許多缺陷在多層神經(jīng)網(wǎng)絡(luò)中得以彌補(bǔ)。
這讓我們重新發(fā)現(xiàn)了感知機(jī)模型的魅力,感知機(jī)模型也成為許多深度學(xué)習(xí)模型的基礎(chǔ)。
1943年,心理學(xué)家沃倫·麥卡洛克(Warren McCulloch)和數(shù)理邏輯學(xué)家沃爾特·皮茨(Walter Pitts)在合作的A logical calculus of the ideas immanent in nervous activity論文中提出了人工神經(jīng)網(wǎng)絡(luò)的概念,并給出了人工神經(jīng)元的數(shù)學(xué)模型,從而開創(chuàng)了人工神經(jīng)網(wǎng)絡(luò)研究的時(shí)代。
唐納德·赫布(Donald Olding Hebb)在1949年出版的《行為的組織》中,提出了其神經(jīng)心理學(xué)理論。
唐納德·赫布認(rèn)為神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程最終是發(fā)生在神經(jīng)元之間的突觸部位,突觸的聯(lián)結(jié)強(qiáng)度隨著突觸前后神經(jīng)元的活動而變化,變化的量與兩個(gè)神經(jīng)元的活性之和,成正比。之后人們相繼提出了各種各樣的學(xué)習(xí)算法。
羅森·布拉特受到這種思想的啟發(fā),認(rèn)為這個(gè)簡單想法足以創(chuàng)造一個(gè)可以學(xué)會識別物體的機(jī)器。
時(shí)間線是_
1956年,羅森·布拉特創(chuàng)建了算法和硬件。
1957年,羅森·布拉特發(fā)布了算法模型。
1958年,羅森·布拉特在New York Times上發(fā)表文章Electronic “Brain” Teaches Itself,正式把算法取名為“Perceptron”。
同年,羅森·布拉特在期刊Psychological Review中發(fā)表文章The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain,這是感知機(jī)的首個(gè)科研成果。
1962年,他又出版了Principles of Neurodynamics: Perceptrons and the theory of brain mechanisms一書,向大眾深入解釋感知機(jī)的理論知識及背景假設(shè)。
羅森·布拉特預(yù)測_不久以后,感知機(jī)將能夠識別出人并叫出他們的名字,能夠立即把演講內(nèi)容翻譯成另一種語言并記錄下來。他的想法成為人工智能新生領(lǐng)域的基石。不幸的是,羅森·布拉特的學(xué)習(xí)算法在當(dāng)時(shí)對于多層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)不起作用。
1969年,人工智能先驅(qū)、麻省理工學(xué)院的權(quán)威人士Marvin Minsky和知名專家Seymour Papert一起,寫了一本書Perceptrons_an introduction to computational geometry。
書中仔細(xì)分析了以感知機(jī)為代表的單層神經(jīng)網(wǎng)絡(luò)系統(tǒng)的功能及局限,證明感知機(jī)不能解決簡單的異或等線性不可分問題,扼殺了當(dāng)時(shí)人們對神經(jīng)網(wǎng)絡(luò)的研究興趣。
Minsky表示,多層神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)并不會使感知機(jī)強(qiáng)大到有實(shí)用價(jià)值。人工智能學(xué)者們也因此放棄了學(xué)習(xí)式軟件的想法。他們轉(zhuǎn)而使用邏輯來產(chǎn)生智能_比如下棋的能力。而神經(jīng)網(wǎng)絡(luò)則被推到了計(jì)算機(jī)科學(xué)的邊緣。
但羅森·布拉特和Minsky及Papert等人在當(dāng)時(shí)都已經(jīng)了解到多層神經(jīng)網(wǎng)絡(luò)能夠解決線性不可分的問題。
由于羅森·布拉特等人沒能夠及時(shí)推廣感知機(jī)學(xué)習(xí)算法到多層神經(jīng)網(wǎng)絡(luò)上,又由于Perceptrons_an introduction to computational geometry一書在研究領(lǐng)域中的巨大影響,及人們對書中論點(diǎn)的誤解,造成了人工神經(jīng)領(lǐng)域發(fā)展的長年停滯,直到人們認(rèn)識到多層感知機(jī)沒有單層感知機(jī)固有的缺陷及反向傳播算法在80年代的提出,才有所恢復(fù)。
1987年出版的書中校正了這些錯(cuò)誤,并更名為Perceptrons_Expanded Edition。
《模型思維_簡化世界的人工智能模型》一書2021年7月上榜當(dāng)當(dāng)人工智能新書熱賣榜第一名。
(完)