作者 | 秦海龍
6 月 14 – 15 日 ArchSummit 全球架構(gòu)師峰會(huì)·深圳,深度探索大模型時(shí)代軟件架構(gòu)最佳設(shè)計(jì)。
寫(xiě)在最前
李生,中國(guó)最早從事機(jī)器翻譯研究的自然語(yǔ)言處理科學(xué)家之一。哈爾濱工業(yè)大學(xué)教授,博士生導(dǎo)師,中文信息學(xué)會(huì)會(huì)士,中國(guó)中文信息學(xué)會(huì)名譽(yù)理事長(zhǎng)。曾任哈爾濱工業(yè)大學(xué)黨委書(shū)記、中國(guó)中文信息學(xué)會(huì)第七屆理事會(huì)理事長(zhǎng)。多年來(lái)在自然語(yǔ)言處理領(lǐng)域培養(yǎng)了四十余名博士研究生,百余名碩士研究生。
李生教授是國(guó)際計(jì)算語(yǔ)言學(xué)會(huì)終身成就獎(jiǎng)五十余年來(lái)的首位華人獲得者,中國(guó)計(jì)算機(jī)學(xué)會(huì)自然語(yǔ)言處理專(zhuān)業(yè)委員會(huì)“杰出成就學(xué)者”獎(jiǎng)獲得者,中國(guó)中文信息學(xué)會(huì)終身成就獎(jiǎng)獲得者。他還是黨的十六大代表、全國(guó)五一勞動(dòng)獎(jiǎng)?wù)?/span>獲得者。
上世紀(jì)六十年代,李生教授畢業(yè)于哈爾濱工業(yè)大學(xué),師從中國(guó)計(jì)算機(jī)科學(xué)與工程奠基人之一陳光熙教授,他是中國(guó)人工智能領(lǐng)域的第一位博士候選人。
我母校哈爾濱工業(yè)大學(xué)的自然語(yǔ)言處理研究團(tuán)隊(duì)曾被譽(yù)為“世界上規(guī)模最大、人數(shù)最多的自然語(yǔ)言處理實(shí)驗(yàn)室”。同時(shí)哈工大也是中國(guó)最早從事人工智能、自然語(yǔ)言處理方向研究的高校之一。從上世紀(jì)五十年代最開(kāi)始涉足機(jī)器翻譯研究開(kāi)始,學(xué)校一直在從事自然語(yǔ)言處理和語(yǔ)音處理中各個(gè)方向的研究。為中國(guó)人工智能中的自然語(yǔ)言處理領(lǐng)域培養(yǎng)了大量科學(xué)家和工程師。
李生教授是哈工大近 70 年來(lái)人工智能和自然語(yǔ)言處理發(fā)展的見(jiàn)證者。倍感榮幸的是,李生教授也是當(dāng)年我博士論文答辯委員會(huì)的主席。雖然當(dāng)初在學(xué)校的很多會(huì)議和活動(dòng)上都接受過(guò)李老師的言傳身教,但是這么多年都沒(méi)有跟他單獨(dú)交流的機(jī)會(huì)。
2024 年 4 月,我在北京拜訪(fǎng)了李生教授,他向我講述了學(xué)校以及他自己在人工智能研究領(lǐng)域的很多經(jīng)歷。他的講述仿佛把我身臨其境地帶入了母校老一輩計(jì)算機(jī)科學(xué)家早年的科研場(chǎng)景。
就讀大學(xué)
心懷報(bào)國(guó)志向的數(shù)學(xué)學(xué)霸
1943 年,李生出生在黑龍江省蘭西縣一個(gè)農(nóng)村家庭。1949 年新中國(guó)成立,也是這一年,李生就讀初小,開(kāi)始了他的學(xué)生生涯。1954 年,李生考入蘭西縣初級(jí)中學(xué)就讀初中。三年后,他考入肇東市第一中學(xué)開(kāi)始就讀高中。
上世紀(jì)五十年代,國(guó)家大力推動(dòng)“兩彈一星”的研發(fā)。1960 年,李生參加高考,懷著報(bào)效國(guó)家的夢(mèng)想,李生報(bào)考了哈爾濱工業(yè)大學(xué)核物理專(zhuān)業(yè),并以?xún)?yōu)異的成績(jī)順利考取。其實(shí)他當(dāng)時(shí)他也不太明白核物理究竟要學(xué)些什么,只是知道這是當(dāng)時(shí)國(guó)家建設(shè)最需要的專(zhuān)業(yè)。
由于李生高考時(shí)數(shù)學(xué)成績(jī)特別好,入學(xué)報(bào)到的時(shí)候,學(xué)校決定根據(jù)實(shí)際需要把他調(diào)劑到計(jì)算機(jī)專(zhuān)業(yè)。
李生老師回憶說(shuō),當(dāng)時(shí)他根本不了解什么是計(jì)算機(jī),作為農(nóng)村出來(lái)的孩子,他用過(guò)算盤(pán),見(jiàn)過(guò)計(jì)算器,可是計(jì)算機(jī)真的連見(jiàn)都沒(méi)有見(jiàn)過(guò)。不過(guò)對(duì)于那個(gè)年代的年輕人,學(xué)習(xí)工作的志向就是到國(guó)家最需要的地方去。所以他接受了調(diào)劑,成為了計(jì)算機(jī)專(zhuān)業(yè)的本科生。
當(dāng)時(shí)的哈工大跟清華大學(xué)、北京大學(xué)一樣,本科都是五年學(xué)制。經(jīng)過(guò)五年的學(xué)習(xí),1965 年李生本科畢業(yè),并留校任教。
早期科研
參與大型電子計(jì)算機(jī)的研制
剛留校的時(shí)候,李生承擔(dān)了系里的大量教學(xué)任務(wù),其中包括講課、批改作業(yè)、給學(xué)生答疑等。他講授過(guò)包括計(jì)算機(jī)原理、Basic 語(yǔ)言、Fortran 語(yǔ)言在內(nèi)的很多專(zhuān)業(yè)基礎(chǔ)課和專(zhuān)業(yè)課。
從上世紀(jì)五十年代開(kāi)始,中國(guó)的很多科研機(jī)構(gòu)和工廠(chǎng)都在大批量研發(fā)和生產(chǎn)大型數(shù)字電子計(jì)算機(jī)。
1968 年,李生帶領(lǐng)計(jì)算機(jī)專(zhuān)業(yè) 64 級(jí)學(xué)生參與 441C 計(jì)算機(jī)的調(diào)試工作,這是當(dāng)時(shí)哈爾濱軍事工程學(xué)院研制的晶體管計(jì)算機(jī)。
1970 年 -1974 年國(guó)家三線(xiàn)建設(shè)期間,李生隨學(xué)校南遷到重慶市。在重慶,他曾在學(xué)校為部隊(duì)辦的計(jì)算機(jī)學(xué)習(xí)班授課,也曾與重慶鐘表廠(chǎng)合作研制線(xiàn)切割機(jī)床(一種電加工機(jī)床,主要用于通過(guò)電火花放電來(lái)切割金屬)。
1974 年,李生隨學(xué)校重返哈爾濱,在學(xué)校搬遷辦公室參與哈爾濱工業(yè)大學(xué)的重建。
1976 年,李生參與 DJS—11 型計(jì)算機(jī)的研制工作,由北京大學(xué)提供計(jì)算機(jī)研發(fā)的圖紙和技術(shù)資料,哈爾濱電子儀器廠(chǎng)為主機(jī)總裝廠(chǎng),產(chǎn)品的交付標(biāo)準(zhǔn)參照北京大學(xué)電子儀器廠(chǎng)生產(chǎn)的 150 機(jī)。
1978 年,李生開(kāi)始進(jìn)行“區(qū)域性西文期刊機(jī)讀聯(lián)合目錄”項(xiàng)目的研制。機(jī)讀目錄是一種可以利用計(jì)算機(jī)讀取和處理的書(shū)目信息,這些信息可以被計(jì)算機(jī)自動(dòng)識(shí)別并編輯,機(jī)讀目錄很大程度上方便了書(shū)目信息的查詢(xún)和共享。
這個(gè)項(xiàng)目于 1986 年通過(guò)黑龍江省科技成果鑒定,這是李生第一個(gè)通過(guò)成果鑒定的科研項(xiàng)目,項(xiàng)目也獲得了航天部科技進(jìn)步三等獎(jiǎng)。
1979 年,李生被評(píng)為黑龍江省優(yōu)秀教師。
1983 年,李生開(kāi)始跟隨陳光熙教授攻讀博士學(xué)位,他也成了中國(guó)和哈爾濱工業(yè)大學(xué)人工智能領(lǐng)域的第一個(gè)博士候選人。之后因?yàn)橐恍┰蚪K止了博士學(xué)位的攻讀。
李生教授與陳光熙教授
陳光熙教授是中國(guó)計(jì)算機(jī)工程學(xué)科奠基人,也是哈工大計(jì)算機(jī)學(xué)科的創(chuàng)始人。當(dāng)時(shí)他們的研究方向是信息檢索,那時(shí)候的信息檢索也稱(chēng)為情報(bào)檢索,就是在國(guó)外早期的數(shù)據(jù)存儲(chǔ)磁帶中查詢(xún)數(shù)據(jù),獲取國(guó)外最新的科研工作進(jìn)展,以確定專(zhuān)業(yè)接下來(lái)的研究方向。
其間,李生參與了陳光熙教授主持的“TDM 數(shù)據(jù)庫(kù)機(jī)”的項(xiàng)目研制,數(shù)據(jù)庫(kù)計(jì)算機(jī)是一種實(shí)現(xiàn)數(shù)據(jù)庫(kù)存儲(chǔ)、管理和控制的專(zhuān)用計(jì)算機(jī)。這個(gè)項(xiàng)目獲得了航天部科技進(jìn)步二等獎(jiǎng)。
文獻(xiàn)標(biāo)引
機(jī)器翻譯的研究契機(jī)
哈爾濱工業(yè)大學(xué)和中國(guó)人民大學(xué)是蘇聯(lián)援建中國(guó)的兩所高校。上世紀(jì)五十年代,有一批蘇聯(lián)專(zhuān)家到哈工大從事教學(xué)工作,帶來(lái)了很多俄文資料。把俄文資料翻譯成中文成了急需完成的工作。當(dāng)時(shí)俄語(yǔ)系的王畛老師和計(jì)算機(jī)系的王開(kāi)鑄老師就開(kāi)始了俄漢機(jī)器翻譯的研究,這是哈工大最早期的機(jī)器翻譯工作。
改革開(kāi)放初期,中國(guó)的科學(xué)研究全面復(fù)蘇,由于之前中國(guó)的大多技術(shù)和經(jīng)驗(yàn)都是向蘇聯(lián)學(xué)習(xí)。這時(shí)全國(guó)很多高校都派出老師去歐美高校訪(fǎng)問(wèn)學(xué)習(xí),哈工大計(jì)算機(jī)專(zhuān)業(yè)當(dāng)時(shí)也派出了老師到美國(guó)學(xué)習(xí),以便開(kāi)展新的科研方向。
比如,王開(kāi)鑄老師去美國(guó)訪(fǎng)問(wèn)回來(lái)后開(kāi)始從事俄漢題錄翻譯、自動(dòng)文摘等方向的研究。題錄是一種描述文獻(xiàn)外部特征的條目,主要包括文獻(xiàn)的題名、著者、出處等信息。俄漢題錄翻譯就是通過(guò)計(jì)算機(jī)自動(dòng)把這些條目從俄文自動(dòng)翻譯成中文。自動(dòng)文摘是通過(guò)計(jì)算機(jī)在一篇文章中自動(dòng)提取出文章的摘要。這兩個(gè)方向都是自然語(yǔ)言處理中的重要研究方向。
再比如,舒文豪老師在美國(guó)訪(fǎng)問(wèn)時(shí)師從國(guó)際模式識(shí)別創(chuàng)始人傅京孫教授,回國(guó)后開(kāi)始了手寫(xiě)漢字識(shí)別的研究。
在同一時(shí)期,李生教授開(kāi)始從事漢英機(jī)器翻譯研究,正式開(kāi)啟了自然語(yǔ)言處理的學(xué)術(shù)生涯。
1984 年,李生晉升為副教授。
1985 年,李生教授的碩士研究生周明入學(xué)。李生教授為周明最初確定的研究方向?yàn)橹形奈墨I(xiàn)的主題詞自動(dòng)標(biāo)引。自動(dòng)標(biāo)引,就是利用計(jì)算機(jī)從情報(bào)和文獻(xiàn)中自動(dòng)抽取檢索標(biāo)志。主題詞自動(dòng)標(biāo)引,就是自動(dòng)抽取可以代表情報(bào)和文獻(xiàn)內(nèi)容的關(guān)鍵詞。這一年,李生 42 歲。
在北京,周明認(rèn)識(shí)了中國(guó)科學(xué)院科學(xué)考察委員會(huì)的吳蔚天研究員(后來(lái)吳老師加入了中國(guó)軟件技術(shù)公司語(yǔ)言工程部)。吳蔚天老師是理工科背景出身,特別喜歡自然語(yǔ)言處理。那時(shí)候吳老師也在做中文文獻(xiàn)自動(dòng)標(biāo)引的工作。
吳蔚天老師提議周明考慮漢英機(jī)器翻譯方向,他覺(jué)得英文的相關(guān)數(shù)據(jù)和工具都比中文多,要是有辦法把中文翻譯成英文,則英文中的自動(dòng)標(biāo)引、自動(dòng)文摘等技術(shù)都可以直接應(yīng)用,于是他提出了跟李生教授團(tuán)隊(duì)一起合作,通過(guò)漢英機(jī)器翻譯進(jìn)行自動(dòng)標(biāo)引的研究。
結(jié)果初步協(xié)商后,李生教授和周明再次來(lái)到北京,與吳蔚天老師簽訂了科研合作協(xié)議。雙方也討論了自動(dòng)標(biāo)引研究的初步研究思路:先將中文語(yǔ)句分詞,然后依次判斷每個(gè)詞是否跟文獻(xiàn)的主題有關(guān)聯(lián),有關(guān)聯(lián)就保留下來(lái),沒(méi)有關(guān)聯(lián)就棄用。這種思路被稱(chēng)為“有聯(lián)系則取,無(wú)聯(lián)系則斷。”
相比中文,除了數(shù)據(jù)和工具比較多,英文自動(dòng)標(biāo)引工作還有其他優(yōu)勢(shì)。因?yàn)橹形恼Z(yǔ)句的詞語(yǔ)之間沒(méi)有明確的間隔符,而英文語(yǔ)句的詞語(yǔ)之間是通過(guò)空格分隔的,分詞容易很多。
李生、吳蔚天和周明進(jìn)一步討論決定,先把中文句子翻譯成英文,然后選取英文句子中的主題詞,再把主題詞翻譯回英文。
這樣項(xiàng)目就確定了漢英翻譯,接著確定主題詞,最后再做英漢翻譯的流程。
哈工大人的科研精神態(tài)度是務(wù)實(shí)和謹(jǐn)慎。李生教授意識(shí)到這個(gè)項(xiàng)目的工作量非常大,別說(shuō)一個(gè)碩士生,就是一個(gè)博士生也很難完成,想要完成這個(gè)工作,需要一個(gè)科研團(tuán)隊(duì)。
為了逐步完成這個(gè)項(xiàng)目,周明的課題確定為漢英翻譯,也就是整個(gè)中文文獻(xiàn)標(biāo)引的第一個(gè)環(huán)節(jié)。
1987 年起,李生任哈工大計(jì)算機(jī)系系主任。
1988 年,CEMT-I 漢英翻譯系統(tǒng)開(kāi)發(fā)完成,CEMT-I 系統(tǒng)利用了詞法、語(yǔ)法、語(yǔ)義等語(yǔ)言學(xué)特征實(shí)現(xiàn)漢英翻譯需求,實(shí)現(xiàn)了 300 多個(gè)漢語(yǔ)句子和題錄的機(jī)器翻譯。
同年,周明碩士畢業(yè),開(kāi)始攻讀博士學(xué)位,由于李生教授當(dāng)時(shí)還不是博士生導(dǎo)師,周明的博士導(dǎo)師為陳光熙教授,李生教授是他的實(shí)際指導(dǎo)教師,博士期間,周明繼續(xù)漢英機(jī)器翻譯的研究。
1989 年,CEMT-I 成為中國(guó)第一個(gè)通過(guò)技術(shù)鑒定的漢英機(jī)器翻譯系統(tǒng)。
CEMT-I 漢英翻譯系統(tǒng)鑒定會(huì)
繼 CEMT-I 的成功開(kāi)發(fā)之后,CEMT-II 和 CEMT-III 系統(tǒng)也陸續(xù)誕生。CEMT-II 解決了航天部 103 所軍貿(mào)產(chǎn)品技術(shù)說(shuō)明書(shū)的英漢翻譯需求。CEMT-III 則實(shí)現(xiàn)了科技文章的英漢翻譯,這個(gè)系統(tǒng)由李生教授團(tuán)隊(duì)與中國(guó)運(yùn)載火箭技術(shù)研究院計(jì)算機(jī)應(yīng)用研究所共同研制。1993 年,這個(gè)系統(tǒng)通過(guò)了國(guó)家鑒定,鑒定委員會(huì)主任為時(shí)任中國(guó)中文信息學(xué)會(huì)理事長(zhǎng)陳力為院士。
1990 年,李生被評(píng)為計(jì)算機(jī)專(zhuān)業(yè)教授。
1991 年,周明博士畢業(yè)。在周明的博士論文答辯會(huì)上,李生教授邀請(qǐng)了清華大學(xué)的張鈸教授和黃昌寧教授,以及國(guó)防科技大學(xué)的胡守仁教授。
現(xiàn)在來(lái)看,這場(chǎng)博士論文答辯會(huì)的專(zhuān)家陣容可謂相當(dāng)豪華。張鈸教授于 1995 年被評(píng)為中國(guó)科學(xué)院院士,黃昌寧教授也是中國(guó)最早從事自然語(yǔ)言處理的科學(xué)家之一,胡守仁教授曾經(jīng)領(lǐng)導(dǎo)了中國(guó)第一臺(tái)軍用專(zhuān)用電子管計(jì)算機(jī) 901(331) 機(jī)的研制。
周明博士是李生教授指導(dǎo)的第一位博士,也是李生教授培養(yǎng)的第一位中國(guó)自然語(yǔ)言處理科學(xué)家。周明博士畢業(yè)后到清華大學(xué)從事博士后研究工作,后任清華大學(xué)副研究員。1999 年,他加入微軟亞洲(中國(guó))研究院,負(fù)責(zé)自然語(yǔ)言處理研究組,他在微軟工作二十多年,直至微軟亞洲研究院副院長(zhǎng)。大模型時(shí)代,周明博士離開(kāi)微軟,創(chuàng)立了知名人工智能公司瀾舟科技。
1992 年,李生教授被評(píng)為計(jì)算機(jī)專(zhuān)業(yè)博士研究生導(dǎo)師。
1993 年,李生教授獲“國(guó)務(wù)院政府特殊津貼”。
同年,李生教授團(tuán)隊(duì)與清華大學(xué)、原航天工業(yè)總公司共同開(kāi)發(fā)達(dá)雅翻譯工作站。當(dāng)時(shí)周明博士已經(jīng)加入清華大學(xué),并代表清華大學(xué)一方負(fù)責(zé)這個(gè)項(xiàng)目的工作。
達(dá)雅翻譯工作站可以用于漢英和英漢的輔助機(jī)器翻譯和輔助寫(xiě)作。這個(gè)項(xiàng)目成功的實(shí)現(xiàn)了翻譯軟件的商品化。項(xiàng)目連續(xù)三年在北京計(jì)算機(jī)產(chǎn)品交易會(huì)上展出。1997 年,該項(xiàng)目獲得部級(jí)二等獎(jiǎng)。
1994 年起,在國(guó)家 863 高技術(shù)研究發(fā)展計(jì)劃的支持下,李生教授的團(tuán)隊(duì)開(kāi)展了漢英 – 英漢雙向機(jī)器翻譯研究。先后開(kāi)發(fā)了 BT863-I 和 BT863-II 雙向機(jī)器翻譯系統(tǒng),實(shí)現(xiàn)了基于規(guī)則和基于統(tǒng)計(jì)的翻譯方法混合的機(jī)器翻譯策略。
基于規(guī)則的翻譯方法,核心思想是根據(jù)語(yǔ)言的句法、語(yǔ)義等特征,寫(xiě)出翻譯過(guò)程中的相關(guān)規(guī)則?;诮y(tǒng)計(jì)的翻譯方法,核心思想是利用統(tǒng)計(jì)和數(shù)學(xué)方法,計(jì)算出翻譯過(guò)程中的相關(guān)策略和選擇。
與微軟合作
中國(guó)互聯(lián)網(wǎng)”黃埔軍校“的緣起
1996 年,李生教授省獲“黑龍江優(yōu)秀中青年專(zhuān)家”稱(chēng)號(hào)。
1998 年,李生任哈爾濱工業(yè)大學(xué)黨委書(shū)記。
這一年年末,微軟在北京成立微軟中國(guó)研究院。這是微軟公司在美國(guó)境外開(kāi)設(shè)的第二家基礎(chǔ)科研機(jī)構(gòu),也是微軟在美國(guó)境外規(guī)模最大的研究機(jī)構(gòu)。
研究院剛成立的時(shí)候,在國(guó)內(nèi)還沒(méi)有那么高的認(rèn)可度。雖然北京的高校很多,但是研究院并沒(méi)有開(kāi)展很多校企合作。
這個(gè)時(shí)候,周明博士已經(jīng)在微軟中國(guó)研究院工作。研究院希望在哈工大成立學(xué)生俱樂(lè)部,負(fù)責(zé)高校合作的馬歆找到周明,希望他跟李生教授溝通,討論研究院跟哈工大的合作事宜。
周明隨即聯(lián)系了導(dǎo)師李生教授,時(shí)任學(xué)校黨委書(shū)記的李生同意與微軟中國(guó)研究院開(kāi)展合作。李生教授協(xié)調(diào)了學(xué)校的團(tuán)委、學(xué)生會(huì)等相關(guān)部門(mén)進(jìn)行對(duì)接。1999 年,微軟中國(guó)研究院到哈工大舉辦宣講活動(dòng),微軟 – 哈工大學(xué)生俱樂(lè)部成立。與此同時(shí),微軟中國(guó)研究院與中國(guó)高校的合作也拉開(kāi)帷幕。
2000 年,微軟 – 哈工大機(jī)器翻譯聯(lián)合實(shí)驗(yàn)室成立,李生教授任實(shí)驗(yàn)室主任。研究院也先后委派黃昌寧教授、周明博士和馬維英博士擔(dān)任實(shí)驗(yàn)室微軟方面的聯(lián)合主任。
2001 年,微軟中國(guó)研究院更名為微軟亞洲研究院。
之后,微軟亞洲研究院與中國(guó)很多其他頂尖高校也展開(kāi)了學(xué)生培養(yǎng)和科學(xué)研究方面的合作,為中國(guó)互聯(lián)網(wǎng)和人工智能行業(yè)培養(yǎng)了大量的優(yōu)秀人才,被譽(yù)為中國(guó)互聯(lián)網(wǎng)的“黃埔軍?!?。這些都開(kāi)始于李生教授當(dāng)初對(duì)待校企合作開(kāi)放、包容的態(tài)度。
回到一線(xiàn)科研崗位
獲得計(jì)算語(yǔ)言學(xué)領(lǐng)域國(guó)際最高榮譽(yù)
2002 年,李生教授榮獲“全國(guó)五一勞動(dòng)獎(jiǎng)?wù)隆薄?/span>
2004 年,李生教授卸任學(xué)校黨委書(shū)記,回到計(jì)算機(jī)學(xué)院繼續(xù)從事教學(xué)科研工作。
同年開(kāi)始,連續(xù)兩屆擔(dān)任國(guó)家自然科學(xué)基金信息科學(xué)部專(zhuān)家評(píng)審組成員。
也是在這一年,微軟 – 哈工大機(jī)器翻譯聯(lián)合實(shí)驗(yàn)室升級(jí)為“哈工大語(yǔ)言語(yǔ)音教育部 – 微軟重點(diǎn)實(shí)驗(yàn)室”,李生教授繼續(xù)擔(dān)任重點(diǎn)實(shí)驗(yàn)室主任。
2008 年,李生主持國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目“下一代信息檢索”。
2011 年,李生擔(dān)任中國(guó)文信息學(xué)會(huì)理事長(zhǎng)。
2012 年,李生教授參加了由百度公司牽頭的國(guó)家 863 重大項(xiàng)目“互聯(lián)網(wǎng)語(yǔ)言翻譯系統(tǒng)研制”。這個(gè)項(xiàng)目在 2015 年獲得國(guó)家科技進(jìn)步二等獎(jiǎng)。
2015 年,李生教授獲國(guó)際計(jì)算語(yǔ)言學(xué)學(xué)會(huì)(Association for Computational Linguistics,ACL)終身成就獎(jiǎng)。這個(gè)獎(jiǎng)項(xiàng)是國(guó)際計(jì)算語(yǔ)言學(xué)領(lǐng)域的最高榮譽(yù)。他也是這個(gè)獎(jiǎng)項(xiàng)開(kāi)設(shè)以來(lái)的首位華人獲得者。曾經(jīng)的獲獎(jiǎng)?wù)甙?IDF(逆文檔頻率) 的提出者 Karen Sp?rck Jones 等學(xué)界泰斗。
Manning 教授為李生教授頒發(fā)國(guó)際計(jì)算語(yǔ)言學(xué)會(huì)終身成就獎(jiǎng)
同一年,李生教授獲中國(guó)中文信息學(xué)會(huì)終身成就獎(jiǎng)。
2016 年起,李生教授擔(dān)任中國(guó)中文信息學(xué)會(huì)名譽(yù)理事長(zhǎng)。
2023 年,李生教授獲中國(guó)計(jì)算機(jī)學(xué)會(huì)自然語(yǔ)言處理專(zhuān)業(yè)委員會(huì)"杰出成就學(xué)者"獎(jiǎng)。
桃李天下
為業(yè)界培養(yǎng)多位科學(xué)家的科學(xué)家
2015 年年末,哈爾濱工業(yè)大學(xué)機(jī)器智能與翻譯研究室和社會(huì)計(jì)算與信息檢索研究中心共同為李生教授舉辦執(zhí)教 50 周年紀(jì)念活動(dòng)。活動(dòng)發(fā)布了一本紀(jì)念冊(cè),名為《春華秋實(shí),桃李天下》。
五十多年來(lái),李生教授培養(yǎng)了近 50 名博士生,百余名碩士生。
光是早年開(kāi)發(fā) CEMT 三個(gè)機(jī)器翻譯系統(tǒng)的過(guò)程中就培養(yǎng)了中國(guó)自然語(yǔ)言處理領(lǐng)域的數(shù)位科學(xué)家。
其中包括瀾舟科技的周明博士、哈爾濱工業(yè)大學(xué)的趙鐵軍教授和張民教授、百度 CTO 王海峰博士等。哈爾濱工業(yè)大學(xué)的劉挺教授也自從博士畢業(yè)后就開(kāi)始加入李生教授團(tuán)隊(duì)從事研究工作。
其中周明和王海峰曾擔(dān)任國(guó)際計(jì)算語(yǔ)言學(xué)會(huì)主席,他們二位也都曾當(dāng)選國(guó)際計(jì)算語(yǔ)言學(xué)會(huì)會(huì)士(ACL Fellow)。
在學(xué)術(shù)界,李生教授還培養(yǎng)了北京語(yǔ)言大學(xué)的荀恩東教授、哈爾濱工業(yè)大學(xué)的楊沐昀教授、秦兵教授和車(chē)萬(wàn)翔教授等多位知名學(xué)者。
在工業(yè)界,他的弟子包括聯(lián)想控股副總裁于浩博士、百度公司副總裁趙世奇博士等。
后記
在北京見(jiàn)到李生教授時(shí),他對(duì)我說(shuō):“中國(guó)的人工智能是從機(jī)器翻譯開(kāi)始的,雖然早期的時(shí)候機(jī)器翻譯還沒(méi)有提升到人工智能的高度,不過(guò)這也是自然語(yǔ)言處理學(xué)者的一個(gè)驕傲?!?/span>
從學(xué)生的培養(yǎng),到微軟亞洲研究院在國(guó)內(nèi)的首次合作,聽(tīng)李老師講述幾十年來(lái)的往事。其中的很多細(xì)節(jié)和李老師務(wù)實(shí)的精神讓我特別感動(dòng)。
一個(gè)多小時(shí)的交談過(guò)程中,我能感受到李生老師早年科研過(guò)程中條件的艱苦,以及面對(duì)方向選擇時(shí)的謹(jǐn)慎。五十多年來(lái),從零開(kāi)始到若干機(jī)器翻譯系統(tǒng)的研制成功,李老師與他的學(xué)生們?yōu)橹袊?guó)的機(jī)器翻譯研究做出了開(kāi)拓性的貢獻(xiàn)。
ACL 終身成就獎(jiǎng)的獲得,不僅是國(guó)際學(xué)術(shù)界對(duì)李生教授長(zhǎng)期貢獻(xiàn)的認(rèn)可,也是對(duì)中國(guó)自然語(yǔ)言處理學(xué)術(shù)研究的認(rèn)可。
個(gè)人電腦時(shí)代、互聯(lián)網(wǎng)時(shí)代、大模型時(shí)代……時(shí)間滾滾向前,新的時(shí)代接踵而至,人工智能在人們生活中的比重越來(lái)越大,自然語(yǔ)言處理方向的研究?jī)r(jià)值也越來(lái)越高。
中國(guó)的自然語(yǔ)言處理研究正是源于幾十年前李生教授這一批腳踏實(shí)地的學(xué)者。他們的工作為中國(guó)的自然語(yǔ)言處理事業(yè)打下堅(jiān)實(shí)的基礎(chǔ)。他們培養(yǎng)的學(xué)生是中國(guó)這一領(lǐng)域雄厚的人才資本。這些夯實(shí)的積累和持續(xù)傳承的精神足以讓我們對(duì)未來(lái)中國(guó)相關(guān)領(lǐng)域的發(fā)展充滿(mǎn)信心。
作者簡(jiǎn)介:
秦海龍,香港科技大學(xué)社會(huì)科學(xué)部博士后研究員,中國(guó)中文信息學(xué)會(huì)社會(huì)媒體處理專(zhuān)業(yè)委會(huì)委員。主要研究方向?yàn)橹袊?guó)人工智能發(fā)展史、中國(guó)人工智能科學(xué)家口述史、計(jì)算社會(huì)學(xué)。博士畢業(yè)于哈爾濱工業(yè)大學(xué)社會(huì)計(jì)算與信息檢索研究中心,前自然語(yǔ)言處理研發(fā)工程師,曾就職于小米科技和三角獸科技。
原文鏈接:走近李生教授:培養(yǎng)出周明、王海峰等數(shù)位AI科學(xué)家,NLP國(guó)際最高獎(jiǎng)項(xiàng)得主的科研之路_AI&大模型_秦海龍_InfoQ精選文章
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶(hù)自發(fā)貢獻(xiàn),該文觀(guān)點(diǎn)僅代表作者本人。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容, 請(qǐng)發(fā)送郵件至 舉報(bào),一經(jīng)查實(shí),本站將立刻刪除。