新闻  |   论坛  |   博客  |   在线研讨会
朱晨光:一个从不通宵的AI研究员(1)
数据派THU | 2021-05-16 17:21:23    阅读:842   发布文章

[ 导语 ]从斯坦福计算机系博士毕业后第4年,朱晨光便已升为微软的首席研究经理,管理认知服务研究部门下的知识与语言研究组。而在读博期间,他的研究方向并不是自然语言处理。

学习、竞赛、打乒乓、搞科研、写书、工作……朱晨光的生活总是同时被其中至少3件事情占据,给人一种很活跃的印象,所以,在听到他曾与赵薇同台参加1994年安徽省芜湖市的春节联欢晚会时,笔者也没有太吃惊:

“那一年是狗年,我演狗,是我们幼儿园的领舞,而她是她们学校(芜湖师范学校)的领舞。”谈起家乡芜湖,朱晨光首先想到的不是三只松鼠,而是芜湖老乡、《还珠格格》里的小燕子。

紧接着是出于兴趣,他从8岁就开始学习LOGO语言。这是一门面向儿童的编程语言,由3位知名计算机科学家(Wally Feurzeig、Seymour Papert与Cynthia Solomon)在1967年设计而成。

最开始他是用LOGO在电脑上画图,敲键盘就能画出一个正方形或圆形,让他觉得很有趣,于是小学就参加竞赛,拿了市区第一名。自然而然地,小升初进入芜湖一中时,他被选入学校的信息学竞赛队伍,一路打到市赛、省赛、全国赛,初三就进入NOI国家集训队,获得清华大学预录取的资格。

朱晨光是一名80后。在他8岁那年(1996年),许多人的家里都还没有安装电脑,而他的父亲就已坚定地认为计算机在未来一定会有非常大的发展。果不其然,随着互联网浪潮的兴起,计算机成为信息时代的技术奠基,“码农”成为21世纪收入最高的行业之一。

但朱晨光没有成为一名“码农”,而是成了一名“NLPer”,进入了人工智能领域,在Windows的老东家微软研究自然语言处理(NLP)。但实际上,他在斯坦福大学读博期间的研究方向并不是NLP,而是交通优化。

2016年博士毕业后,朱晨光入职微软,先是做自然语言理解(NLU),出了一本NLU相关的入门书籍,叫《机器阅读理解:算法与实践》。2019年,他又从NLU转向研究文本总结与知识图谱。

“如果你问我未来5年的研究方向是否还会转变,我的答案是肯定的。”朱晨光答道。在他看来,在企业做研究与在高校做研究的一个区别就在于:你需要根据公司的业务来调整自己的研究方向,而市场是瞬息万变的。

1 源于竞赛的自学能力

从交通优化到自然语言处理,再到知识图谱与文本总结,朱晨光认为,自己能够快速上手新的研究内容,主要归功于他从小参加信息学竞赛所锻炼出来的自学能力。

“当时上竞赛训练课时,我们并不是老老实实地坐在底下听老师讲课,而是需要自己找学习资料,发现问题,主动与老师、学生讨论。”他谈及,在这个过程中,竞赛选手往往很早就锻炼了自己主动学习的能力。

比如,进入微软后,面对人工智能领域的迅速发展,他很自觉就养成了一个习惯:每天至少阅读一篇论文,以此来掌握NLP领域的最新知识与研究动态。既是为了能够及时调整自己的研究内容、以适应产品的需求,也是为了紧跟潮流、不被时代淘汰。

朱晨光从初一开始就参加信息学竞赛。竞赛是他在中学时代的主旋律:初中那会是一边学习一边搞竞赛;到了高中,他直接脱产搞竞赛,“我一共就在班里待了半年,上完高一上学期的课我就把所有时间放在竞赛上了。但其实我文化课的成绩也不错,在班上待的那半年也拿了一个全班第一名。”

初三那年(2003年),他第一次参加NOI就获得银牌,进入前20名选手组成的国家集训队。之后,他又连续两年参赛,分别获得一枚金牌与一枚银牌。然而,尽管朱晨光连续3年进入国家集训队,却没有一次进入IOI国家队4人名单:2004年NOI,他考了477分,拿了全国第8名;2005年NOI,“前期成绩是第一名,但最后一次大考没有发挥好,非常遗憾与国家队擦肩而过。”回忆当年,朱晨光感慨道。

尽管如此,朱晨光也觉得自己非常幸运有机会参加3次集训,得以认识3批优秀的竞赛选手。他们中的许多人都被引以为NOI竞赛的榜样,比如楼天城、胡伟栋、鬲融、朱泽园、唐文斌等人。他们至今仍保持紧密联系,而其中与他关系最好的,要数同届的朱泽园与唐文斌。

朱泽园来自南京外国语学校,与朱晨光的参赛节奏完全一致,都是2003年至2005年的信息学国家集训队成员。他们同时去了清华,本科时一起组队参加过ACM/ICPC;大三那会,两个人都去了微软亚洲研究院实习,一起发表了5篇顶会论文;大四申请学校时,两个人都拿到了去斯坦福读博的offer,但朱泽园最终选择了MIT。如今,他们两个又都在位于美国西雅图的微软总部工作。

唐文斌来自绍兴市第一中学,高中毕业那年,朱晨光与他曾一起给NOI出题;上了清华后,他们一起组队参加了两岸清华程序设计竞赛,代表北京与来自台湾、香港的队伍一起比赛,并获得了第一名。如今,唐文斌在旷视科技担任联合创始人与CTO。

1.jpg

图注:2007年,朱晨光(最左)与唐文斌(中间)、刘贺组队参加两岸清华编程竞赛

除了自学能力的锻炼,朱晨光认为,NOI竞赛对历届选手的影响还体现在计算机基础与英语学习上。就他个人的经历来说,NOI竞赛内容涉及到数据结构、算法等大学阶段才有的计算机课程,所以后来他在清华读计算机专业时,觉得学习很轻松,因为“有些课程在高中时已经学过了”。

此外,当时他们备考NOI时,90%以上的题目都是英文的,这对他的英语阅读与理解能力有很大提升。刚上大一时,他参加GRE考试,满分1600,他考了1520分;托福满分120,他考了115。朱晨光因此谈道:“我们搞竞赛的,英语都不差。”

但在参加竞赛的过程中,对朱晨光产生最大影响的,并不是知识的增长,而是他的竞赛教练江涛老师,以及行万里路所形成的开阔眼界。

朱晨光从初一开始就跟着江涛学习,一直到高三毕业。“他教了我很多,不仅仅是信息竞赛方面的知识,在意志品质、为人处世方面,我也从江涛老师那受益弥久。”虽然远在西雅图,但朱晨光仍与老师保持联系,逢年过节都会送上祝福与问候。

江涛是信息学竞赛界一号响当当的人物。15岁那年,他在一次造火箭的实验事故中失去了双手,但是他非常坚毅,靠自己的努力上了大学、学了计算机,毕业后分配到芜湖一中任教。

在他的组织下,芜湖一中成为历年IOI国家队最能打的中学之一。他的学生一共进入国家集训队29次,7人代表中国参加IOI比赛、获得7枚国际奖牌。

江涛老师对科学的热爱,对自我的要求,以及坚毅的精神,一直影响着朱晨光在知识的道路上不断求索。从江老师的身上,他认识到,人生路上所遇到的小磨小难,似乎是不值一提的。

而行万里路,则是竞赛地点散布在全国不同城市,因为参赛,他不仅结识了来自五湖四海的朋友,还去了省内省外的许多地方,甚至因为一次偶然的机会,远赴美国科罗拉多州参加信息学奥林匹克竞赛的集训。

2005年,17岁的朱晨光在网上报名参加了美国信息学奥林匹克竞赛,名列前茅,作为国际学生,被主办方邀请去科罗拉多州的一所大学里与美国的学生一起参加集训。在这次集训中,他最终获得了第二名,达到了进入美国国家队的水平,但由于他是中国人,所以并未入队。

“与国内相比,我觉得美国的选拔比较科学,考6次,算综合成绩,万一哪次发挥不好,后面还可以再赶上来。国内是一锤定音,有很多偶然性。而且美国的题目比较有趣,可能比国内的要容易些。”

这次集训经历对朱晨光的影响很大。在之前,他对美国没有感性的认识,以为发达的美国到处都是高楼大厦、鳞次栉比;去了美国科罗拉多州之后,他发现,到处都很干净,建筑都不高,很开阔,与国内的氛围很不一样,这激发了他以后想到美国学习的念头。

2 发表8篇论文的姚班学生

2006年,朱晨光从安徽芜湖来到首都北京上学,成为清华大学计算机系的一名新生。那一年,与朱晨光一同来到清华园的NOI选手,还有朱泽园、唐文斌、龙凡等10人。

大二那年,久仰于图灵奖得主姚期智的风采,朱晨光又通过考试选拔,考入了当时由姚期智发起、成立还不到三年的软件科学实验班,也就是传说中的“姚班”。那一届,姚班一共有27名同学,除了朱晨光,还有包括唐文斌在内的4名NOI集训队成员。

当时,交叉信息研究院还未成立,姚班仍属于计算机系,朱晨光等人的上课内容一半由姚班老师授予,一半是计算机系的其他课程。在姚班的10门核心课程中,姚期智教授其中的2门,其余课程则由来自微软亚洲研究院的高级研究人员负责。这对朱晨光起到了很大的影响。

“姚先生在我心中就是大神,成就高山仰止,我非常荣幸能够做他的学生。”朱晨光感慨。直到现在,他仍然每年都会与姚先生联系,每当取得好成绩时都会与恩师汇报。

朱晨光谈到,姚先生非常重视对姚班学生的培养,虽然他有很多繁杂事务,但还是坚持每周都亲自给姚班的学生上课。在姚先生教授的两门课(《理论计算机》上下)中,朱晨光考得特别好,第一门满分100,第二门99分,两门课都是全班第一。

此外,姚先生一直鼓励姚班学生尽早接触科研,与领域里的大师多交流。姚先生每年都会举办几次高级别的计算机会议,邀请国内外知名的学者来交流,并让姚班的本科生也参加。在“中国计算机科学2020”的论坛现场,朱晨光便有幸与1985年图灵奖得主、UC Berkeley的教授Richard Karp进行了交流。

2.jpg

图注:2010年临近毕业之际,朱晨光与姚期智合影

除了北京的学术交流活动,姚班还会组织与港澳大学进行交流的冬令营活动。大三那年寒假,朱晨光便与姚班的同学一起去了香港科技大学,待了一个星期,与港科大的学生一起上课、交流,开阔眼界。

姚班的授课教材几乎是全英文,课程内容前沿,难度也比较高。因为很早就萌发出国读书的念头,出国申请要求高绩点,所以朱晨光从大一开始就很用功,在专业课与英语学习上投入了大量的时间与精力,希望每门课都能拿高分。

最后,功夫不负有心人,他的平均分达到92.2/100,排名全班第2、全级第4,荣获清华大学优秀学术奖学金(授予排名前2%的学生),成为当年清华计算机系唯一拿到斯坦福博士offer的学生。

*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。

参与讨论
登录后参与讨论
推荐文章
最近访客