西湖大學(xué):科學(xué)家+AI,科研新范式的樣本
掃描二維碼
隨時(shí)隨地手機(jī)看文章
北京2024年12月11日 /美通社/ -- 今年的諾貝爾獎(jiǎng),將AI推到了科學(xué)舞臺的中央,標(biāo)志著AI在科學(xué)研究中的重要地位得到了認(rèn)可,也體現(xiàn)了學(xué)科交叉賦能將成為AI時(shí)代的科研發(fā)展趨勢。用AI賦能學(xué)科研究,創(chuàng)新科研新范式。這一點(diǎn)在西湖大學(xué)的科研項(xiàng)目中已得到體現(xiàn)。
成立于2018年的西湖大學(xué)是由施一公院士領(lǐng)銜創(chuàng)辦的、聚焦前沿科學(xué)研究的研究型大學(xué),該校鼓勵(lì)科學(xué)家們探索AI與各學(xué)科交叉融合,為科研創(chuàng)新提速。為此,西湖大學(xué)在浪潮信息等企業(yè)助力下打造了領(lǐng)先的算力平臺,支撐科學(xué)家開展跨學(xué)科研究。在算力助力下,"科學(xué)家+AI"展現(xiàn)了無限可能。
申恩志:生命科學(xué)研究已離不開AI
在2024年諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng)揭曉后那幾天,申恩志很忙,不少媒體聯(lián)系他采訪。2024年諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng)的獲獎(jiǎng)?lì)I(lǐng)域,正是申恩志所研究的RNA領(lǐng)域。而且他與本屆諾獎(jiǎng)得主Victor Ambros屬于"同門嫡系"。申恩志曾在麻省大學(xué)醫(yī)學(xué)院RNA治療研究所師從2006年諾貝爾獎(jiǎng)得主Craig C. Mello,Mello是Victor Ambros的弟子之一。
5年前申恩志從美國來到西湖大學(xué),組建了西湖大學(xué)的非編碼核酸生物學(xué)實(shí)驗(yàn)室,主要致力于非編碼RNA的作用機(jī)制和生物學(xué)功能研究。非編碼RNA約占人類轉(zhuǎn)錄組的98%,它非常重要,它不僅參與生物體的各種基本生命過程,而且與很多重大疾病的發(fā)生密切相關(guān)。
非編碼RNA的數(shù)目非常龐大,而且在生命體里是高度動(dòng)態(tài)的,可以跟很多其他生命分子相互作用、相互調(diào)節(jié)。面對數(shù)量龐大又動(dòng)態(tài)的非編碼RNA分子,如果單純采用傳統(tǒng)實(shí)驗(yàn)方式研究,需要耗費(fèi)大量時(shí)間和精力也很難分析其中復(fù)雜的調(diào)控關(guān)系,找出調(diào)控規(guī)律?,F(xiàn)在,申恩志團(tuán)隊(duì)利用計(jì)算和AI技術(shù),能夠高效解析測序數(shù)據(jù),分析出其中的調(diào)控關(guān)系,找到調(diào)控規(guī)律,解決了以前單靠實(shí)驗(yàn)解決不了的問題,大大加速了研究進(jìn)程。
對申恩志等從事生命科學(xué)研究的科學(xué)家來說,好消息是這個(gè)領(lǐng)域是較早利用AI實(shí)現(xiàn)科研模式變革的領(lǐng)域。本屆化學(xué)獎(jiǎng)得主Demis Hassabis團(tuán)隊(duì)開發(fā)的AlphaFold自問世以來,已被廣泛應(yīng)用在很多生物學(xué)領(lǐng)域研究中,申恩志實(shí)驗(yàn)室團(tuán)隊(duì)不單自己利用數(shù)據(jù)建模型,用AI做分析,也經(jīng)常采用AlphaFold進(jìn)行科研。
申恩志實(shí)驗(yàn)室團(tuán)隊(duì)"海陸空"都有,有做信息學(xué)的,有做生化的,有生物物理的,有做遺傳學(xué)的,有做藥物的,是非常交叉的團(tuán)隊(duì)。申恩志認(rèn)為,AI與生命科學(xué)、尤其是計(jì)算生物學(xué)的跨學(xué)科研究,顯著提高了科學(xué)研究的速度和準(zhǔn)確性,讓很多科學(xué)創(chuàng)新的發(fā)現(xiàn),從不可能成為可能。他相信有了 AI的助力,能夠加速整個(gè)生命研究的進(jìn)程。
金耀初:從生物智能向AI演化
興趣廣泛,好奇心強(qiáng),沉著冷靜,善于思考,見到金耀初的人,無一不被他的科學(xué)家氣質(zhì)所吸引,他的研究領(lǐng)域可謂"上天入地",有汽車的噴氣發(fā)動(dòng)機(jī)和自適應(yīng)巡航系統(tǒng)、空中客車的機(jī)體設(shè)計(jì)、疫苗的預(yù)測、醫(yī)學(xué)圖像的處理、多機(jī)器人的組織等,盡管這些領(lǐng)域千差萬別,但在金耀初看來,它們解決問題的方法是可以共通的,這就是他癡迷研究很多年的演化算法。
演化算法,是把自然的演化規(guī)則引入到人工智能領(lǐng)域,以解決復(fù)雜系統(tǒng)的優(yōu)化和決策問題。金耀初列舉了一級方程式賽車F1的空氣動(dòng)力學(xué)優(yōu)化問題。"一個(gè)賽車好不好,發(fā)動(dòng)機(jī)好不好,無法用傳統(tǒng)數(shù)學(xué)方法有效解決,針對這種復(fù)雜系統(tǒng),可以設(shè)計(jì)相應(yīng)的演化算法,借助機(jī)器學(xué)習(xí)方法更快地找到最優(yōu)解。"
金耀初的演化算法已成功應(yīng)用于多個(gè)復(fù)雜工程系統(tǒng)的優(yōu)化。2024年07月,金耀初因其在復(fù)雜系統(tǒng)進(jìn)化優(yōu)化領(lǐng)域的開創(chuàng)性貢獻(xiàn),榮獲2025年IEEE Frank Rosenblatt Award大獎(jiǎng),成為本年度全球唯一獲此殊榮的學(xué)者。該大獎(jiǎng)創(chuàng)立于2004年,是IEEE為紀(jì)念神經(jīng)網(wǎng)絡(luò)的創(chuàng)始人之一Frank Rosenblatt而設(shè)立的。
金耀初是歐洲科學(xué)院院士、國際電氣和電子工程師協(xié)會(IEEE)會員、IEEE計(jì)算智能學(xué)會主席,2023年10月加入西湖大學(xué),受聘人工智能講席教授,并創(chuàng)立"可信及通用人工智能實(shí)驗(yàn)室"。他希望實(shí)驗(yàn)室更多地投入到基于演化發(fā)育機(jī)制與人工智能相結(jié)合的研究方向。
近兩年遵循scaling law的大模型(LLM)發(fā)展火熱,模型越做越大,帶來的能耗問題也引發(fā)了業(yè)界的擔(dān)憂。與大模型不同,金耀初希望通過演化和發(fā)育的方式,讓AI像生物智能一樣自然演化,以更低的能耗產(chǎn)生更高的智能。為此金耀初專門建立了一個(gè)取名為"演化與發(fā)育神經(jīng)網(wǎng)絡(luò)"(Evolutionary Developmental Neural Systems)實(shí)驗(yàn)室,英文名縮寫是EDEN(伊甸園),他希望在這個(gè)"伊甸園"環(huán)境下用AI模擬人類的起源過程,在自然環(huán)境中不斷演化發(fā)育出更智慧的智能系統(tǒng)。
不同于大模型使用模擬神經(jīng)網(wǎng)絡(luò),金耀初采用脈沖神經(jīng)網(wǎng)絡(luò)進(jìn)行演化和發(fā)育。他認(rèn)為脈沖神經(jīng)網(wǎng)絡(luò)更接近生物的信息處理方式,在能耗上有優(yōu)勢。目前他的團(tuán)隊(duì)正在開發(fā)具有演化發(fā)育功能的具身智能機(jī)器人,讓機(jī)器人像自然界的生命體一樣,大腦和身形都可以根據(jù)自身需求和外界環(huán)境逐漸演變成長。
金耀初的研究方向天然要求著"交叉",他的既往研究成果,與計(jì)算機(jī)、機(jī)器人學(xué)、系統(tǒng)生物學(xué)、計(jì)算神經(jīng)科學(xué)等不同方向科學(xué)家進(jìn)行過交叉合作。加入西湖大學(xué)后,他發(fā)現(xiàn)西湖大學(xué)引進(jìn)了很多做生物工程、發(fā)育生物學(xué)和計(jì)算神經(jīng)科學(xué)的PI,更方便學(xué)校內(nèi)跨學(xué)科交叉合作。盡管這個(gè)研究方向在AI領(lǐng)域很小眾,但金耀初有信心研發(fā)出有自主學(xué)習(xí)能力、更類人的人工智能系統(tǒng),為實(shí)現(xiàn)通用人工智能探索出一條新路徑。
藍(lán)振忠:讓AI更有情商
藍(lán)振忠跟金耀初同在工學(xué)院人工智能系。他2020年從谷歌辭職,回國加入西湖大學(xué),擔(dān)任深度學(xué)習(xí)實(shí)驗(yàn)室負(fù)責(zé)人,他第一個(gè)想做的事就是打造一臺能隨時(shí)隨地陪伴、輔助心理咨詢的對話機(jī)器人。
藍(lán)振忠2017年從卡耐基?梅隆大學(xué)計(jì)算機(jī)學(xué)院博士畢業(yè)后進(jìn)入谷歌,曾主導(dǎo)研發(fā)了谷歌大模型BERT的輕量化版本。在谷歌工作期間,他見證了人工智能技術(shù)的快速發(fā)展,也看到了利用AI解決心理問題的可能性。加入西湖大學(xué)后,他帶領(lǐng)團(tuán)隊(duì)研發(fā)的第一個(gè)產(chǎn)品就是AI心理咨詢師"小天"。
"小天"是藍(lán)振忠團(tuán)隊(duì)研發(fā)的心理咨詢大模型,在研發(fā)心理咨詢大模型的過程中,藍(lán)振忠提出了IQ(智商)和EQ(情商)的雙重要求,"EQ讓模型更有溫度,更深地理解并滿足人的需求。"經(jīng)過大量的語料積累和真實(shí)心理咨詢案例學(xué)習(xí),加上自研的情感計(jì)算和共情模塊,小天能帶有感情地傾聽和溝通。現(xiàn)在,用微信搜索"聊會小天"小程序,就能與"小天"進(jìn)行線上交流。
藍(lán)振忠說,人們普遍關(guān)注身體的健康,但很少關(guān)注心理的健康,他希望通過"小天"能幫到更多被心理健康問題困擾的人。藍(lán)振忠透露,目前"小天"的日活躍用戶有幾萬人,還在不斷提升。"我們不能太急,因?yàn)锳I心理咨詢是一個(gè)新的市場,要考慮用戶接受度,還需要大模型加深對用戶的理解。"藍(lán)振忠實(shí)驗(yàn)室團(tuán)隊(duì)中,不僅有AI科學(xué)家,還有心理學(xué)家、經(jīng)濟(jì)學(xué)家,他認(rèn)為通過交叉學(xué)科合作,能更深刻洞察用戶的心理健康問題。
藍(lán)振忠還強(qiáng)調(diào),"小天"作為大模型產(chǎn)品,最重要的還是繼續(xù)提升模型的能力,把模型做得更好。但這也不意味著模型越大就越好,從模型的領(lǐng)域?qū)傩钥?,模型做得過大,適用性會減弱?,F(xiàn)階段的主要工作是把數(shù)據(jù)做得更精,同時(shí)做一些模型架構(gòu)、訓(xùn)練方法等層面的提升。
藍(lán)振忠近期也在跟金耀初探討合作,尋找大模型與演化優(yōu)化算法的結(jié)合點(diǎn),希望通過模仿交互,實(shí)現(xiàn)自我迭代。他期望"小天"最終能夠超越人類心理咨詢師。
算力:為"科學(xué)家+AI"助力
藍(lán)振忠實(shí)驗(yàn)室發(fā)布在西湖大學(xué)網(wǎng)站上的招聘信息中,列出的吸引應(yīng)聘者的第一個(gè)優(yōu)勢是"實(shí)驗(yàn)室有足夠的服務(wù)器設(shè)備支持大語言模型的研究,可保證實(shí)驗(yàn)項(xiàng)目高效進(jìn)行"。算力對搞大模型的藍(lán)振忠團(tuán)隊(duì)至關(guān)重要,"小天"就是基于西湖大學(xué)的算力平臺打造的,算力對金耀初團(tuán)隊(duì)、申恩志團(tuán)隊(duì)等做AI跨學(xué)科研究的科學(xué)家同樣重要。
西湖大學(xué)算力平臺為這些科學(xué)家們搞科研提供了充足的算力資源。目前西湖大學(xué)算力平臺——計(jì)算中心建有服務(wù)器機(jī)房500平方米,分為科學(xué)計(jì)算算力平臺、冷凍電鏡算力平臺、人工智能算力平臺三類算力資源。計(jì)算中心通過各種類型的計(jì)算資源服務(wù)支撐學(xué)校各項(xiàng)科學(xué)研究,通過統(tǒng)一集中的算力資源并配合合理調(diào)度和管理政策,計(jì)算中心可為校內(nèi)大部分算力需求提供服務(wù)。
浪潮信息自2020年以來持續(xù)參與西湖大學(xué)計(jì)算中心建設(shè),為西湖大學(xué)提供穩(wěn)定可靠的算力系統(tǒng),支撐算力需求。同時(shí)還提供了人工智能平臺AIStation。通過人工智能平臺AIStation,計(jì)算中心能夠統(tǒng)一管理計(jì)算資源,將計(jì)算資源利用率提升到90%以上,減少資源閑置,緩解多人使用下的資源擁擠以及計(jì)算資源不足問題。浪潮信息以計(jì)算之力,為科學(xué)家助力。