人工智能迫切需要借鑒生物系統(tǒng)中的微觀、介觀、宏觀等多尺度神經(jīng)可塑性融合計算機制,以啟發(fā)實現(xiàn)更加高效的類腦連續(xù)學(xué)習(xí)算法,消除人工神經(jīng)網(wǎng)絡(luò)因采用反向傳播(Backpropagation,BP)等人工學(xué)習(xí)方法而導(dǎo)致的廣泛災(zāi)難性遺忘現(xiàn)象。生物系統(tǒng)中常見的多巴胺、5-羥色胺、血清素、去甲腎上腺素等神經(jīng)調(diào)質(zhì)物,往往經(jīng)由特定的腺體釋放(圖1A),遠(yuǎn)程彌散、投射到一定范圍內(nèi)的目標(biāo)神經(jīng)元群體,并根據(jù)調(diào)質(zhì)濃度水平的不同,對局部的神經(jīng)元、突觸等多種微觀可塑性產(chǎn)生復(fù)雜的調(diào)制影響(圖1B)。
受到該生物神經(jīng)調(diào)制機制的啟發(fā),中國科學(xué)院自動化研究所研究員徐波團隊與中國科學(xué)院院士、腦科學(xué)與智能技術(shù)卓越創(chuàng)新中心高級研究員蒲慕明,以及臨港實驗室研究員李澄宇等,通過建模多巴胺、乙酰膽堿等全局神經(jīng)調(diào)制可塑性(Neuromodulation Plasticity)、局部時序依賴可塑性(Spike Timing-Dependent Plasticity,STDP)等多尺度神經(jīng)可塑性機制,整合得到一種基于神經(jīng)調(diào)制依賴可塑性的新型類腦學(xué)習(xí)方法(Neuromodulation-Assisted Credit Assignment,NACA)。該方法參考了大腦中復(fù)雜的神經(jīng)調(diào)制通路結(jié)構(gòu),并以期望矩陣編碼的形式對神經(jīng)調(diào)制通路構(gòu)建數(shù)學(xué)模型(圖2A),在接受刺激信號后產(chǎn)生不同濃度的多巴胺監(jiān)督信號并進一步影響局部突觸和神經(jīng)元可塑性類型(圖2B)。NACA支持采用純前饋的流式學(xué)習(xí)方法訓(xùn)練脈沖(Spiking Neural Network,SNN)和人工(Artificial Neural Network,ANN)神經(jīng)網(wǎng)絡(luò)(圖2D、E),通過全局多巴胺的彌散支持與輸入信號同步,甚至先于輸入信號的正向信息傳播,再加上選擇性的對STDP的調(diào)整,使得NACA表現(xiàn)出明顯的快速收斂和緩解災(zāi)難性遺忘優(yōu)勢。
在兩類典型的圖片和語音模式識別任務(wù)中,該團隊從準(zhǔn)確率和計算成本兩方面對NACA算法進行評估,并在SNN中選取了E-prop和BRP兩種全局學(xué)習(xí)算法作為對比,在ANN中則以TP(Target Propagation)和BP算法作為對比對象。在圖片分類(MNIST)和語音識別(TIDigits)標(biāo)準(zhǔn)數(shù)據(jù)集上,NACA均實現(xiàn)了更高的分類精度(約1.92%)和更低學(xué)習(xí)能耗(約98%)。在驗證了靜態(tài)分類任務(wù)的擬合能力后,該研究重點測試NACA算法在Class-CL上的連續(xù)學(xué)習(xí)能力,并將神經(jīng)調(diào)制擴充到神經(jīng)元可塑性范圍(圖3A、B)。在五大類的連續(xù)學(xué)習(xí)任務(wù)中(包括連續(xù)MNIST手寫數(shù)字、連續(xù)Alphabet手寫字母、連續(xù)MathGreek手寫數(shù)學(xué)符號、連續(xù)Cifar-10自然圖片、連續(xù)DvsGesture動態(tài)手勢),NACA算法相對BP和EWC算法,具有更低的能耗且可緩解“災(zāi)難性遺忘”問題(圖3C-G)。
研究顯示,NACA是一類生物合理的全局優(yōu)化算法。這種采用宏觀可塑性來進一步“調(diào)制”局部可塑性,可被視為是一種“可塑性的可塑性”(Plasticity of Plasticity)方法,與“學(xué)會學(xué)習(xí)”、“元學(xué)習(xí)”(Learn to Learn)等有直觀上的功能一致性。該算法同時在SNN和ANN的優(yōu)化問題中獲得了性能和計算成本上的優(yōu)勢,更在連續(xù)學(xué)習(xí)這一更貼合生物生存環(huán)境和實際應(yīng)用場景的動態(tài)任務(wù)范式下發(fā)揮重要作用。這些純前饋學(xué)習(xí)、低訓(xùn)練能耗、支持動態(tài)連續(xù)學(xué)習(xí)等綜合特征,也將有望進一步引導(dǎo)新型類腦芯片的設(shè)計。
相關(guān)研究成果以A brain-inspired algorithm that mitigates catastrophic forgetting of artificial and spiking neural networks with low computational cost為題,在線發(fā)表在《科學(xué)進展》(Science Advances)上。研究工作得到中國科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(A類)、上海市市級科技重大專項、臨港實驗室專項、中國科學(xué)院青年創(chuàng)新促進會等的支持。
圖1.?大腦中的神經(jīng)調(diào)制。(A)四種神經(jīng)調(diào)質(zhì)及其通路;(B)非線性神經(jīng)調(diào)制;(C)神經(jīng)調(diào)制多樣化局部可塑性。
圖2.?NACA計算模型。(A)神經(jīng)調(diào)制通路建模和群體期望編碼;(B)多類局部可塑性;(C-E)NACA算法整體流程及在SNN和ANN中發(fā)揮作用。
圖3.?NACA算法在Class-CL任務(wù)中的表現(xiàn)。(A、B)神經(jīng)調(diào)制同時影響局部神經(jīng)元和突觸可塑性;(C-G)NACA與EWC、BP等性能對比