文继荣:跳出盒子去思考

发布时间:2015-12-18 08:43 浏览量:3652来源:本文原载于校报第1552期,略有删改

文继荣

信息学院副院长、教授、博士生导师

北京市重点实验室主任

国家“千人计划”特聘专家

 

 导言

正午后的阳光总有几分慵懒,信息楼的一间办公室却回荡着急促的键盘声,偶尔打破沉默的叩门与电话铃声,也只能开启一段简洁明了的对话。文继荣已经习惯了这样的工作节奏,精于时间管理的他笑称是自己选择了“疲于奔命”。他说,希望通过自己和团队的努力,在提升学校信息学科整体实力的同时,深化与人文社会学科的交流与合作,为解决现实的社会问题拓展有效、便捷之道。

 

文继荣为新生解惑

 

面向社会:大数据研究得天独厚

在当今世界,“大数据”已成为一个热门话题,受到学术界、产业界乃至社会各界的广泛关注。作为业内的知名学者,文继荣表示,应当理性地看待“大数据”热,“大数据源于已日趋成熟的互联网搜索技术,是一种运用已有经验对新事物进行判断与预测的新兴思维和方法,但大数据并不是包治百病的灵丹妙药,我们所需要做的是去证明它的价值和意义,而不是单纯炒作这个概念”。

在人类传统的思维、行为模式中,受数据收集的历史条件局限,所谓理性主义长期占据主导地位,即通过长期观察和经验的积累,人类能透过现象看到本质,从而总结出事物发展的一般规律。然而,由于各方参与和博弈的人类社会复杂纷繁,人们并非总能从有限经验中抽象出一般规律,也难以处处以理性分析建立模型。文继荣认为,“大数据”作为一种代表“新经验主义”的研究方法,其优势在于省略复杂的模型,尽可能多地收集样本,直接寻求面临情况与已知样本的匹配,从而运用老经验解决新问题。 

今年5月,文继荣主持的“大数据管理与分析方法研究北京市重点实验室”得到北京市科学技术委员会认定,成为本校第三个省部级重点实验室,也是北京市首个以大数据为研究方向的重点实验室。在一些人看来,人民大学是一所传统的人文社科强校,多少意味着数据科学研究的先天不足。但在文继荣看来,这里人文社科领域学术积淀深厚、文理视角兼备且大师云集,恰恰具有面向社会开展大数据研究的独特优势;社会发展及社会治理中的诸多新老问题,恰恰可以在这里得到更加全面、更加深刻的认知。

文继荣参加信息学院夏令营开营仪式

大数据研究在人文社科领域得天独厚,这让文继荣领略了与政府决策部门紧密合作带来的发展契机,“与政府部门进行合作不仅能获得更多实际的研究机会,而且能接触到许多具有价值的大数据资源,这是其他研究机构难以获得的”。他主持的重点实验室,由信息学院牵头,整合新闻、经济、公共管理、社会与人口、统计等学院的学术力量,围绕实时大数据查询与分析、社会大数据分析与预测开展研究。用于实时舆情分析与预测的“时事探针”系统已投入使用,该系统可以有效地感知、获取、跟踪、分析互联网上任何主题和事件,在网络大数据感知技术和多维分析技术上具有国际领先性,得到了教育部、科技部、政法委、中宣部、北京市委的高度评价,并作为“九三学社”中央准备两会提案的重要依据。

关注前沿:科研与教学良性互动

两年前,文继荣放弃微软亚洲研究院高级研究员、互联网搜索与数据挖掘组主任的职位,回到阔别多年的母校任教。他认为,我校一脉相承的学术路径以及熟悉的校园氛围,是他毕生从事科学研究最好的土壤。不过,转入高校工作需要承担科研与教学的双重任务,如何妥善处理二者关系成为他需要直面的首要问题。

“要对自己的时间有所取舍,最好做到科研成果与教学资源的转化”。在文继荣看来,大学本科是打基础的阶段,作为教授应以经典理论的传授为主,科研成果起到相对间接的辅助作用;而在研究生阶段,科研成果的作用则与导师平行,对教学的影响是非常直接的。于是,在重点实验室所承担的科研项目之外,他为本科生开设了基础性的数据结构课程,面向研究生开设了数据科学研讨课程。

 

文继荣与国家司局级干部交流

他说:“研究生教学中增加了很多研讨课程,需要导师引导学生去做研究。导师在关注前沿的过程中,对于自己的研究领域会有一个‘全景图’式的认知,能够明确所在领域正在做哪些研究,还有哪些问题尚未解决,对于该领域的剖析和判断也会更为深入,能够引导学生更为有效地去进行学术研究,避免他们偏离正轨。”

在科研与教学的有机结合中,文继荣一向坚持“问题导向”原则,即要求学生带着问题去关注学科前沿,寻找学科前沿的关键问题,在厘清问题定义之后再开展研究。

敢为天下先:实力与魄力缺一不可

在数据科学领域,文继荣已获得45项美国发明专利,发表了一百多篇学术论文,可谓硕果累累。他认为:在传统意义上,寻找已有理论和工具的缺点并加以修补的‘微创新’只能够叫做改进,并不是真正意义上的创新。真正的创新应该具有相当的力度。“跳出盒子去思考(out-of-box thinking)”——这是他过去在微软工作时的理念,如今正激励着后来者的“实力与魄力”。

论及“实力”,他认为在于积累:一方面要脚踏实地,因为知识离不开实践,理念需要一点点摸索;另一方面,寻找到喜欢和擅长的研究方向,才能保证自己耐得住寂寞。他回忆道,当年报考本科时就是被专业名称“经济信息管理”吸引,后来发现课程内容与想象的不同,但还是庆幸找到了自己所爱,“科学研究,实际上是很苦的,尤其在未成名的时候,需要靠领悟力和兴趣来支撑自己”。

论及“魄力”,他深有感触:长期从事一个领域的研究,人的思维常常出现惯性,难以跳出固有的框架,容易失去“弃旧图新”的魄力。而他凭借“喜欢尝试”的天性,养成既不固执己见、多换角度思考,又不畏权威、敢做首创的魄力。在从事“查询日志挖掘”研究时,传统的自然语言无法解决问题,近似语义查询的概念尚未形成,几番碰壁促使他寻找新的思路,最终发明了“查询聚类”的新方法。

 

文继荣介绍数据工程与知识工程创新引智基地

在谈到“敢为天下先”时,文继荣回顾了自己发表第一篇国际论文的经历,并反复提到“orthogonal”(正交的)这个词,所谓“正交”就是指与现有方法完全不同的新想法。当时,他对自己的论文能否被接受并无把握,但觉得虽然是针对传统问题的研究,但确实提出了突破性的理论观点,于是鼓足勇气投稿而获成功。评审专家对他的论文的评价是orthogonal,肯定了他的创新性,“这是我记忆最深刻的英文单词,也是激励我勇于探索的开端”。

 

(本文原载于校报第1552期,略有删改)