十年磨一剑,辛苦不寻常 ——对话ACM SIGMM 杰出博士论文奖得主李锡荣
李锡荣,荷兰阿姆斯特丹大学博士,现任中国人民大学信息学院数据工程与知识工程教育部重点实验室多媒体计算组讲师。获2013 年度ACM SIGMM 杰出博士论文奖。
研究方向:图像搜索,多媒体内容分析,社群媒体搜索。
“李老师是一个很有实力的老师,看代码写代码都特别快,看过的论文也很多。老师性格很有趣,不仅乒乓球、羽毛球及台球打得非常好,还特别喜欢开玩笑。记得去年我们做毕设的时候,遇到不会的地方,李老师看了一眼,开玩笑地说,‘真是痛心疾首,这么简单都不会,让开让开’,然后就坐下来,帮我敲代码,几分钟就敲完了。”多媒体实验室中,何希僖同学的一番描述,让我们未见其人,就已对李锡荣老师的采访充满期待。果不其然,一见面李锡荣老师就以其阳光爽朗的笑声打破了信息楼里严肃的气氛,我们的访谈也就在这轻松愉悦的氛围之中开始了。
十年终磨一剑——李锡荣获奖历程回顾
国际计算机协会(Association for Computing Machinery,简称ACM)创立于1947 年,是世界上最大、最负盛名的科学性及教育性计算机学会。ACM 在各个专业领域设置特别兴趣小组。据了解,ACM 多媒体兴趣小组(Special Interest Group for Multimedia,简称SIGMM)是多媒体信息处理领域最大的世界性专业组织。SIGMM 主办的国际多媒体年会 ACM MM 是多媒体计算、通信和应用等领域的顶级国际会议,每年参会人数在600 人次左右。SIGMM Award for Outstanding PhD Thesis 是ACM 在2009 月6 月份批准设立的,还不到十年。到今年累计颁给了3 个人。2013 年4 月,李锡荣被其在荷兰阿姆斯特丹大学的博士生导师提名为今年的sigmm 的杰出博士论文奖,经国际专家评奖委员会评审,最终荣获sigmm13 年的最佳博士论文奖。ACM SIGMM 杰出博士论文奖由SIGMM 评选,每年至多授予一名研究人员。主要遴选标准是该研究人员的博士论文是否具有对多媒体计算、通信和应用等领域产生高影响力的潜质。
谈到得知获奖时的心情,李锡荣坦言,“当时非常兴奋,因为这个奖真的是很难得。” 这个难得,大概有两层意义:一是因为这个奖有着举足轻重的地位,获得这个奖意味着国际学术界对于获奖者极大的肯定;二是因为李锡荣博士在多媒体方面投入了太多的心血和光阴。
其实,李锡荣对于多媒体技术的研究,可以追溯到他在清华读硕士的时期。“我在清华攻读硕士学位的时候就已经参与这个研究方向了。我感觉与图像打交道非常有意思——比如照片,世界各地不同人的照片都不一样,从这些幻化万千的照片中分析出照片的内容是一件非常有趣的事情。”正是因为这份最初的兴趣,让李锡荣博士坚定地踏上了多媒体研究的道路。
硕士毕业以后,出于多方面的考量,李锡荣选择了荷兰的阿姆斯特丹大学继续自己的多媒体生涯。其中很重要的一个原因,是欧洲独特的博士培养体制。李锡荣认为,这种体制对他在学术研究方面产生了积极的影响。“荷兰的培养体制类似于学徒制,导师会对学生关于怎么写论文、做presentation 等各方面进行言传身教。在国内,写论文特别强调‘我做了什么’,而荷兰则更强调‘你为什么要去做这件事?你背后研究的问题是什么?研究的科学意义是什么?’。他们总是推着学生去思考、去问问题、提炼问题、定义问题。虽然当时我在国内也写过论文,但是对比之下,我感觉做研究的方法,写论文的原则,还是那边更科学一些。”
从2007 年到2012 年,李锡荣将其博士阶段全部精力投入到了图像分析课题的研究当中。荷兰自由的博士培养体制加上自己日复一日的钻研,十年终磨一剑,李锡荣在博士阶段完成了这篇获奖论文。
创新与突破——李锡荣研究内容介绍
当谈及一个让很多人既感到神秘,又感到好奇的问题——李锡荣老师的具体研究内容是什么?李锡荣老师用通俗的语言和生动的举例为我们揭开了这层神秘的面纱。
“我现在在做的工作,是建立一个智能的图像搜索引擎,能够帮助普通用户去更便利地管理和检索他的图片。”目前的图像搜索引擎,都是建立在图像所嵌入的网页文本之上,通过文本的关键字匹配实现的。但是对于大多数用户上传的照片,并不会添加详细标注,这样一来,基于关键词匹配的方法就难以达成目的了。“所以我们必须把分析放到像素一级,从像素里面提取语义信息——这个照片是关于什么的?里面有什么物体?有什么场景?是关于什么事件的?在哪里拍的?这样即使没有任何标注,也可以实现一个语义层次的搜索。”针对这一问题,李锡荣进而解释道,“要实现基于内容的搜索,我们要对视觉的语义概念要进行建模。一个可行的实现手段是建立一个分类器,去判断图片里面有什么物体,没有什么物体。人和机器最大的区别在于人有很强的泛化能力,但是计算机却难以做到。比如告诉一个小孩子什么是狗,当他下次看到一个脏兮兮的狗或者形状有点怪的狗,也可以很快地推理出这是狗。但是计算机如果要学习关于狗的判断,则需要大量的训练样本——不同拍摄角度的狗、不同种类的狗、不同场景下的狗……只有采集到大量的训练样本,才有可能去建立很好的分类器。”然而,怎样去搜集大量可行的训练样本?怎样对样本添加标签却是亟待解决的问题。面对庞大数量的样本,采用人工标注的方法显然太过繁琐。李锡荣的获奖论文内容则为这一问题指出了新的突破方向。“我们做的工作是怎么从网上自动获取训练数据。利用各类社交网站上用户上传的带有标签的照片,我们可以获取大量的训练样本。但是普通用户的标注是很主观的不受控制的行为,因而这些标签本身不能直接利用。所以我们做了一系列工作,设计出计算机算法,来自动判断出图片是否和图像标签相关。如果我们可以判断相关的话,我们就可以获得可靠的训练样本。”
正如评审委员会所言,李锡荣的博士工作“显著地推进了基于内容多媒体索引与检索的理论与实践”。特别地,该论文为利用社会化媒体蕴藏的大量信息实现图像检索提供了全新的见解。这一思路被李锡荣解释得很简单,但是在当时提出这个突破性的思想,本身就需要非凡的智慧;为了实现设想,更是倾注李锡荣大量的心血。
站在巨人的肩膀上——亦师亦友,且学且乐
李锡荣老师以其随和、阳光的性格,颇受其所在的多媒体实验室学生的喜爱。多媒体实验室的本科学生王晓旭向我们透露,“李老师对我们要求不算严格。老师总是会先考虑我们的学业状况,合理地分配任务。就算有时因为急事没能完成任务,老师也会说以学业为重。老师非常温和。”不似大多数人想象中的老师,李锡荣老师对其实验室的每位学生都了解之至。谈论起自己的学生,李老师更像是在谈论自己的朋友。“我跟我的学生也是说我们是一种合作的关系,我们希望创造一个双赢的局面,为了一些感兴趣的事情聚在一起,没有绝对的权威。所以和大家讨论之后可能会更有一些想法。”李老师笑着说。
谈及对想要加入实验室的学生的要求时,李锡荣老师说,“最重要的是容易沟通。因为编程能力、创造性都是可以培养的,因为只要沟通顺畅,我就可以把我的想法、科学思维研究思维慢慢传达,让学生慢慢接受。正如牛顿所说‘我是站在巨人的肩膀上’,但是首先我们需要找到巨人,知道怎么爬上去。”李老师进而鼓励大家道,“你们如果有同学想做毕业设计都可以和我们聊一聊,很希望大家都来我们实验室看一看。”
给大学一点纪念——李锡荣对学生的期许
作为一名信息学院的老师,李锡荣对信息学院的学生也有着自己的期许。“我知道计算机系的学生课业负担比较重,大家也对实习之类的事情比较活跃。我个人认为大学四年的确是一个很重要的阶段,应该多样化。但是本科毕业设计应该好好做,这相当于大学阶段的一个纪念品。大学毕业之后再回过来想,即使这个阶段的工作并不能算有多么突出,却也是一个很完整的工作。通过毕业设计参与到科研过程中,有这样一段经历,即便以后不做科研也是有好处的。如果还能够产生一些正式发表的东西,我觉得这对于大学四年更是一个很有意义的纪念品。”