第三十章 給你們上堂課!
一周時光匆匆而過,很快就到了交流會開始的時間。
雖然名為國際學術(shù)交流會,但由于神經(jīng)網(wǎng)絡(luò)的概念提出時間太短,其他學者沒有工作內(nèi)容可以分享,因此這次會議的主體仍然只有徐毅的個人報告。
經(jīng)過了上午贊助商、華東大學和魔都政府的揭幕式發(fā)言后,諸多學者終于在午休后等來了會議的戲肉部分。
下午兩點,距離報告開始一個小時,就有不少人早早到場,演講大廳的觀眾席上已經(jīng)落座了三四成的席位;還有許多學者在外面的休息廳,或坐或立地與熟人閑聊,同時等待報告開場。
而作為這次會議的主角,徐毅此時正坐在酒店內(nèi)的化妝間里,脖子僵硬地看著鏡子里在自己臉上忙前忙后的化妝師,一動也不敢動。
“額,我覺得……差不多可以了吧?”慘無人道地接受了一個小時的擺弄,徐毅終于忍不住,從嘴角勉強擠出請求。
“那可不行,”還沒等化妝師答話,站在后面圍觀的周粥就笑瞇瞇地回道,“徐老師,您今天可不止代表了你自己,還代表了我們學校,甚至華國學者的形象,不認真打理怎么能行?”
她今天為了會議同樣作了打扮,一身白色襯衫搭配深藍色格子裙,顯得活力十足又不失沉穩(wěn)。
瞇起雙眼上下打量了一下鏡中的老師,女孩嘿嘿一笑:“沒想到老師你平時也不運動,身材居然還能這么好,真帥!……再看看你,王浩中!”
無辜躺槍的小胖子攢眉苦臉,只能費勁地收了收肚子,以示努力。
………………
臨近報告開場,徐毅才終于擺脫了化妝師的魔爪,帶著兩位徒弟快步走向演講廳。
路上卻被一位文質(zhì)彬彬的中年學者攔下了,他推了推眼鏡,微笑著伸出手問道:“你好,你就是徐毅老師吧?”
“是的,你好?”徐毅有些懵逼地伸出手握了握,看著來者熟悉的面孔,竭盡腦汁回憶對方的身份,卻被一旁激動的王浩中一語道破:“周志強老師!”
周志強是金陵大學AI研究院院長,歐洲科學院院士,也是華國科學院院士候補,在華國AI領(lǐng)域?qū)儆陬I(lǐng)軍人物之一,徐毅之前也在各種新聞報道上見過他,只是初次見面才發(fā)現(xiàn)本人意外地年輕。
對方很有涵養(yǎng)的沖小胖子點了點頭,轉(zhuǎn)頭對徐毅說道:“徐老師上次的報告相當精彩,我也從中得到了不少啟發(fā),十分期待這次您給我們帶來的驚喜?!?p> “相信不會讓周院士失望的,”徐毅微微頷首。
“時間不早,我就不浪費你的準備時間了,這是我的名片,希望會后有機會再交流,”周志強過來攀談了幾句,就叫上旁邊等候的學生一同告辭了。
路上與周院士的談話耽擱了點時間,待徐毅走到后臺時,聽到主持人的介紹已經(jīng)開始。
“接下來請允許我介紹本次報告的主講人徐毅博士,他是……,曾在……”
“下面讓我們有請徐毅博士帶來他的學術(shù)分享!”
徐毅理了一下衣領(lǐng),隨后伴著掌聲,大步走到臺上。
講臺前的屏幕上同時顯出這次報告的演示文檔,看到題目后,臺下產(chǎn)生了一陣陣騷動,一些華人學者則露出了會心的笑容。
“大家好,我是徐毅,我這次的報告主題是……”
講到這里,徐毅的臉上也不禁浮起一絲微笑:
“人工智能的未來:聯(lián)結(jié)主義——從ILSVRC與CNN說起”
稍作停頓后,他繼續(xù)說道,
“大約兩個月以前,我曾經(jīng)在華國人工智能交流大會上使用了相同的題目,在場的部分朋友應(yīng)該對此印象深刻,我相信在當時恐怕有不少人認為‘這是個瘋子’,”
徐毅嘴角含笑,而語氣認真:“但現(xiàn)在,我可以自信地宣稱,神經(jīng)網(wǎng)絡(luò)在未來的三到五年內(nèi),必然會取代傳統(tǒng)的機器學習算法,成為人工智能的主流!”
“雖然在場的各位應(yīng)該都已經(jīng)對多層感知機和卷積神經(jīng)網(wǎng)絡(luò)有了大概的了解,但還是允許我在這里進行一個簡單的介紹……”
“……通過模擬神經(jīng)元,尤其是視覺神經(jīng)元的工作原理,便是我搭建出以CNN為首的各種神經(jīng)網(wǎng)絡(luò)的靈感動機……”
剛剛與徐毅等人有過一面之緣的周志強坐在臺下安靜聽講,突然問起身邊的博士生:“景峰,你覺得徐老師講的怎么樣?”
“徐老師這部分原理的講解還是非常清楚的,”被稱作景峰的年輕人點頭回答,又皺了下眉,補充道,“但這部分內(nèi)容其實在上次已經(jīng)講過一遍了……”
周院士嘴角含笑,不置可否:“開頭而已,還有一個半小時呢,再等等看?!?p> 不需要再等等看,所謂的驚喜來的相當迅疾,徐毅在大概介紹之后,很快就進入了這次的主題。
“當然,現(xiàn)在的神經(jīng)網(wǎng)絡(luò)還存在相當多的問題,這也是我今天報告的主要內(nèi)容,我會指出目前存在的一些缺陷,并針對它們提出解決思路,歡迎各位基于這些方向進行進一步的研究?!?p> 此言一出,臺下又是一片轟然議論,激烈程度甚至遠超上次報告!
因為這句話等于告訴各位,“我有很多后續(xù)的研究方向,就交給你們?nèi)プ霭伞保?p> 眾所周知,好的科研成果最需要的關(guān)鍵就是研究思路和方向,徐毅現(xiàn)在的行為,就像是把餡餅做好丟到各位學者面前,而他們要做的只是張嘴接住就夠了。
聽到這番話,饒是周志強都忍不住輕笑了一聲:“好家伙!徐毅這是要給在場的所有人當一回導師呀,口氣真大!”
口氣雖大,但學者們卻一點都不反感;恰恰相反,他們巴不得這位狂生的口氣再大一點,最好能給一人一條思路,省得還要互相競爭。
至于徐毅所謂的思路是否可行,在座的眾人毫不懷疑——這可是當著全世界最頂級的同行們,沒有人會舍棄自己光明的學術(shù)生涯,只為了跟大家開一個大玩笑的。
何況徐毅的“狂”在上次會議中已經(jīng)有所體現(xiàn)了,但事實證明他只是恃才傲物而不是狂妄自大,這次應(yīng)該同樣言之有物!
看到眾人充滿期待的目光,徐毅微微一笑,繼續(xù)開口說道:
“讓我們按照CNN的結(jié)構(gòu),逐個分析可以改進的地方吧,”
“首先從反向傳播算法開始,我們當前使用的梯度下降法,更新參數(shù)的速度與參數(shù)的梯度完全正相關(guān),但在一個神經(jīng)網(wǎng)絡(luò)中參數(shù)間的梯度差異極大,最大者可能達到1e10這個級別,而往往第二大或者第三大者就只有1e5甚至更低,”
“相對于主要的參數(shù)方向,其他方向上的更新極慢,這就使得梯度下降法每次只在幾百萬參數(shù)中更新最大的一個或者幾個參數(shù),極大地影響了訓練速度……”
“解決方法當然是減少不同參數(shù)梯度之間的差異,sign函數(shù)是一個例子,它可以讓參數(shù)的更新只與梯度的符號相關(guān),但完全消除了梯度大小的影響也過于極端,因此我們可以考慮一種折中的辦法……”
不少學者露出若有所思的神情,徐毅見狀并不多言,只在講完后等待一分鐘留給大家消化,接著開始講起下一個思路:
“其次,卷積神經(jīng)網(wǎng)絡(luò)在層數(shù)堆疊數(shù)量超過一定值后,會出現(xiàn)效果的退化,這顯然是不合常理的,因為假設(shè)我們在兩層之間使用恒等變化,那么N層網(wǎng)絡(luò)就可以變?yōu)镹-1層網(wǎng)絡(luò),理論上多層的效果總會至少不弱于低層網(wǎng)絡(luò)的效果……”
“對于這個問題,我們可以考慮使用某種結(jié)構(gòu),使得兩層之間可以更容易地學到恒等變化……”
“對于批歸一化,有……我們針對這個問題可以……”
“對于卷積層……我們可以……”
“…………”
每說一個內(nèi)容,徐毅都會停頓一分鐘,就這樣洋洋灑灑講了十幾個方向。
在他剛開始講述時,大廳內(nèi)還有此起彼伏的討論聲,但隨著他講的內(nèi)容越來越多,大廳內(nèi)的聲音逐漸低沉,直至落針可聞。
所有的學者,甚至連七八位院士在內(nèi),都掏出紙筆,埋頭沙沙記起了筆記!
這幅場景與其說學術(shù)交流會,倒更像是老師在上一堂別開生面的公開課!
只不過課上的學生們,都換成了名校的教授,和各國的院士……
徐毅講完最后一段,意猶未盡地作出總結(jié):“……以上就是我暫時想到的所有內(nèi)容,期待大家的后續(xù)補充?!?p> 等他毫不拖泥帶水地致謝下臺后,全場仍然處在詭異的安靜中。
直到一位手速最快的教授記完筆記,甩甩發(fā)酸的手腕,猶豫地輕輕鼓起掌,
大廳內(nèi)開始慢慢響起應(yīng)和的掌聲,隨后匯成聲音的巨浪!
全場掌聲雷動,經(jīng)久不歇!
而在周志強旁邊,開始還有所質(zhì)疑的景峰,此時雙手早已拍得通紅,卻仍不舍得停下。
周志強抬頭看了看周圍興奮的人群,無奈嘆了口氣,放下手中的紙筆,跟隨大家輕輕鼓掌致意。
“景峰,你的筆記記完了吧?”優(yōu)雅地鼓著掌,周院士面向臺前,目不斜視。
同時低聲詢問起自己的學生,
“回去之后讓我看看,我抄一份?!?