作者:陳華夫
ChatGPT聊天機器人是OpenAI公司約在三個月前的2022/11/30日推出,而大為轟動,這是繼2017年谷歌(Google)的DeepMind公司開發出AlphaGo Zero電腦圍棋後,更讓AI真正走入日常生活了。雖然ChatGPT的聊天回覆有時並不準確,但在教育上已產生巨大影響。(詳見拙文AI徹底改變大學理工教育的面貌─學習的本質(18)
長久以來,科學家如牛頓、愛因斯坦等從外界的現實,發現自然界的規律,用高等數學的語言寫成量子力學相對論,再應用到各種高科技:火箭、衛星、電動汽車、核電廠、電腦、雲端計算、GPU、TPU等,如下圖:
(圖1:機器學習與物理科學的比較,圖片來源:陳華夫製作)
人工智慧(AI)顛覆了這個人類學習範式(典範),它基本上是以深度學習取代科學家,從數據(data)學習出人工神經網絡(如CNNRNNE-GANTransformers)。(見人工智能:什麼是人工智能 (AI)?人工智能如何工作?
然後再應用到:圖像識別語音識別、機器翻譯、自動駕駛Alphago-Zero電腦圍棋、ChatGPT聊天機器人等領域。而在2012年後,深度學習的飛躍進展得歸功於適當的數據庫(XGBoost 及Keras)和硬件(GPU及TPU)。(見《用 Python 的深度學習》FRANÇOIS CHOLLET(2018))
於是,我們必須探討深度學習這個學習範式,是否比科學家只用思考就能激發出新理論的學習範式更能創新呢?這是個複雜的問題,要看我們如何定義「創新」?詳細分析如下:
1)AI的圖像識別人臉辨識的優勢創新在於其巨大的數據庫:
人類的視覺是天生奇妙的(見《內在視覺:對藝術和大腦的探索森馬.澤基(2000)),AI「擬人化」圖像識別人臉辨識是無法匹敵人類的視覺。但人類無法在擁擠的飛機場即刻認出接機的親人;而航管人員可以圖像識別軟體識別不同的飛行物。中國的商湯科技(創始人、CEO徐立)是電腦視覺人臉辨識領域最大的系統開發商,還投入大筆資金創建了一個超級計算平台。在2018年,商湯科技是全球市值最高的人工智能創業公司,其市值45億美元。此波火熱的ChatGPT也點燃了商湯科技等AI公司的行情。(見ChatGPT點燃AI行情,百度、商湯及鷹瞳等AI企業大漲
2)機器翻譯的優勢創新在其翻譯速度,而非「信、達、雅」:
AI「擬人化」學習人類的聽覺與自然語言能力。此番轟動的ChatGPT就是因為它擁有接近人類水平的自然語言處理能力及對話邏輯。熟悉谷歌(Google)「中英翻譯」軟體的人都會發現它的「英翻中」的品質已大幅提昇,但離「信、達、雅」的境界還有一段距離,這仍有待深度學習演算法的創新。也就是說,AI「擬人化」的語言理解與生成(書寫)還是落後於人類思考不少,更別說創新了。只有大幅提升深度學習演算法,才能真正解決ChatGPT某些答非所問的尷尬。
3)自動駕駛比人類的優勢創新在不受人類情緒視覺的影響:
AI「擬人化」學習人類駕車的自動駕駛比人類的優勢在不受人類情緒視覺的影響。當初,世界電動車一哥特斯拉自動駕駛技術領先,堅持使用微鏡頭,而不用光學雷達,但據英國《金融時報》2023/2/17日報導,美國政府監管機構表示,特斯拉將召回近36.3萬輛電動汽車,因爲其完全自動駕駛軟體的一個版本存在缺陷,可能導致撞車。(見特斯拉因自動駕駛軟體缺陷召回超36萬輛汽車
百度的JIDU電動車配置可隱藏式方向盤,意味著它可實現無人干預的全自動駕駛,其自駕系統關鍵技術在於採用兩顆英偉達Orin X芯片,配備31個外部感應器,包括2個光學雷達、5個毫米波雷達、12個超音波雷達和12個微小攝影機。(見AI正夯大咖拼自駕 百度:我們領先特斯拉整整一個世代!
AI的自動駕駛是電動車的必備的技術,但技術難度大,需投資巨額資金。雖然陽明交通大學團隊使用18:1 縮小的模型賽車,在AWS DeepRacer League奪冠,但其深度學習自動駕駛技術要真正落實電動車產業,仍有一大段路要走。(見陽明交通大學團隊贏得AWS DeepRacer League前三名
4)Alphago-Zero電腦圍棋的優勢創新在於比人類評估棋局快且準:
AI「擬人化」學習人類下圍棋,而於2017年谷歌(Google)的DeepMind公司開發出史上棋力最強的AlphaGo Zero,其優勢創新在於其比人類評估棋局快速且準確。其關鍵的演算法是把蒙地卡羅樹搜尋集成到「自我對抗」中,以進行強化學習,再訓練卷積神經網路CNN)以增強演算法。(見《深度學習與圍棋馬克斯·龐佩拉凱文·弗格森(2019),第354頁)
此後DeepMind停止了圍棋的研究,據英國《金融時報》2022/7/29日的報導, DeepMind公司發展的深度學習蛋白質軟體─AlphaFold,而構建了迄今最完整、最準確的數據庫,其中包含逾2億種已知蛋白質。已經超越科學知識的極限,可以預測出幾乎所有已知蛋白質的形狀(如下圖),可以展開癌症、病毒類感染,抗生素、靶向藥、新效率的酶等藥物研發。(見DeepMind宣布可預測幾乎所有蛋白質結構
(圖2:蛋白質的立體結構,圖片來源:AlphaFold2 爆火背後 人類為什麼要死磕蛋白質
5)AI深度學習能夠遷移學習(Transfer Learning ,TL )嗎?
所謂機器學習(ML)中的遷移學習(Transfer Learning ,TL )與人類學習學習遷移(Transfer of Learning,ToL)類似,但不是同一回事。
首先,解釋人類學習學習遷移:當科學家發明了物理理論(如圖1),可以應用到不同的領域,例如,串連的「電阻─電容─電感電路學同構「機械震盪」,也就是都可以二次常微分方程式表示,於是電路學的知識可以學習遷移(ToL)到「機械震盪」。(詳細,見我的視頻科學方法學物理與人工智慧(2/ 40)─什麼是物理的同構
(圖3:串連的「電阻─電容─電感電路學同構「機械震盪」,圖片來源:陳華夫製作)
但相對的,圖1中的深度學習的產物─人工神經網絡(如CNNRNNE-GANTransformers)─卻非各個領域互相同構的,例如,訓練圖像識別所得出的卷積神經網路CNN)不能遷移學習(TL)的用於Alphago-Zero電腦圍棋。即使訓練識別中文所得出的E-GAN也很難用於識別英文,即使共用E-GAN的某些(前、中、後)隱藏層意義也不大。當DeepMind停止了圍棋的研究,跨領域發展的深度學習蛋白質軟體─AlphaFold,必定得從事全新的深度學習
DeepMind首席執行官傑米斯·哈薩比斯解釋說:「我認為遷移學習(TL)是通用智慧的關鍵。 而且我認為進行遷移學習(TL)的關鍵是獲得概念知識,這些概念知識是從你感知的細節中抽象出來的。」(見什麼是遷移學習?探索流行的深度學習方法
傑米斯·哈薩比斯的解釋,間接的說明了人類的學習為何可以在各領域之間學習遷移(ToL),因為人類的思考記憶索引關係),找到腦神經記憶網絡中須要思考的「目標概念」,然後大腦就會執行「內隱思考」的兩項運作:(1)概括(generalization)─即大腦回憶檢索(聯想)腦神經記憶網絡,找到所有與「目標概念」相關的概念,於共同的屬性中,抽象出「通用(general)概念」。於是,概括有助於大腦尋找出通用規則模式識別;(2)尋找洞識(Insight)─即大腦回憶檢索腦神經記憶網絡,尋找(聯想)「目標概念」所代表的問題之「問題解決概念」,若找到了,表示大腦有了洞識,若「目標概念」不是一個問題,則大腦跳過此運作。(詳細,請看拙文什麼是「思考」?如何「洞識」?何謂「思想家」?─學習的本質(2)
結論:
AI深度學習圖像識別人臉辨識機器翻譯、及自動駕駛都有比人類優勢創新之處。深度學習無法學得抽象概念知識,因此無法遷移學習(TL),但人類的學習卻可以學習遷移(ToL),因此人類擁有通用智慧