数据科学与大数据技术

发布时间:2018-06-15

数据科学传统与未来的交融

继计算机和互联网革命之后,大数据技术进一步席卷近乎所有行业,在“数据驱动决策”的新模式下,很多行业和企业从大数据技术中受益。全球第一家信息技术研究和分析公司盖特纳咨询公司预测明年全球将新增440万个与大数据相关的工作岗位,且会有25%的机构设立首席数据官职位。美国通用电气公司正启动在旧金山湾区投资15亿美元,建立一个全球软件和分析中心。另据CSDN(中国软件开发联盟)2016年中国大数据调查报告显示,全国32.5%的公司正在搭建大数据平台,29.5%的公司已经在生产环境实践大数据,并有成功的应用案例和产品,24.5%的公司已经做了足够的了解,开发准备就绪。

在人才市场上,社会对大数据相关岗位的需求也空前高涨。CSDN网站发布的大数据人才市场薪酬报告表明,社会上大数据相关职位需求越来越大,薪酬也相应比一般IT职位要高。对大数据职位需求最旺盛的城市是北京、上海和深圳,目前约有10万个岗位空缺。互联网、地产、金融行业需求最为强劲,位列前三名。相关人士预测,未来3-5年,国内大数据领域人才需求缺口将达到150万。

为满足社会的迫切需求,人大信息学院于2017年开设了新的“数据科学与大数据技术(工学)”本科专业。人大计算机学科长期以来一直以数据库等数据科学与技术著称,是孕育新的大数据专业最合适的地方,是数据科学传统与未来的交融之地。 

传统——国产数据库先驱

人大信息学院是国内最早开展数据库理论与实践工作的学院,萨师煊教授是信息学院的奠基者之一,是我国数据库技术的奠基者和学术活动的倡导者和组织者,为数据库领域的学科建设和人才培养作出了开创性贡献,出版国内第一本教材《数据库系统概论》,最早发表了数据库技术的研究论文。

以王珊教授为代表的人大数据库团队在国产数据库的设计和研发工作中做了巨大的贡献,1999年,王珊教授带领一批从事数据库技术研发的学者创立了北京人大金仓信息技术股份有限公司并担任董事长和首席科学家。经过十多年发展,人大金仓公司以成为国产数据库的领军企业,研发的具有自主知识产权的大型通用数据库管理系统—金仓数据库KingbaseES获得北京市科技进步一等奖,入选国家自主创新产品目录。王珊教授被评为推动中国软件产业发展的25位功勋人物之一。

王珊教授与萨师煊教授合著的《数据库系统概论》是我国第一部数据库教材,一直被国内大多数院校采用,并因此获得了国家级优秀教材奖(2次),北京市精品课程奖、国家精品课程奖等多项奖励。

人大一直是国内数据库研究领域的核心高校,我院王珊教授和杜小勇教授先后担任中国计算机学会数据库专委会主任。

 

萨师煊教授

王珊教授

 

未来——全面的大数据方向布局

近年来,人大信息学院基于在数据库领域的科研优势,进而在大数据领域进行全面布局,拓展方向,目前建立了以教育部重点实验室和北京市重点实验室为核心的、研究方向全面的大数据研究团队。

其中杜小勇教授牵头的 “数据工程与知识工程”教育部重点实验室,是我国目前在数据库领域唯一的一个教育部重点实验室。国家“千人计划”特聘教授文继荣教授负责的“大数据管理与分析方法研究”北京市重点实验室专注于大数据分析与智能的研究工作,例如实验室的研发成果“网络扶贫行动大数据分析平台”入选了国家“砥砺奋进的五年”大型成就展。

以教育部重点实验室和北京市重点实验室为核心,人大信息学院建立了全面的大数据研究体系,包括数据挖掘与大数据分析、大数据与云计算系统、人工智能与机器学习、多媒体大数据、信息检索、区块链技术、生物大数据、信息安全与数据安全等多个大数据相关研究方向,并取得了优异的科研成果。下图展示了大数据相关的主要研究方向和各方向的部分教师。

 

关于信息学院

信息学院近年来承担了大量国家重点项目,包括国家重点研发计划“云计算和大数据”重点专项项目、国家核高基重大专项课题、国家973项目、国家863计划重大课题、国家自然科学基金重大、重点项目等。并在SIGMOD、VLDB、AAAI、ACM TODS、IEEE TPAMI、TKDE、TPDS等顶级国际会议和期刊上发表大量学术论文,在学术界有很大的影响力。

在学术交流方面,我们在2012年成立了萨师煊国际大数据研究中心,每年暑假邀请一批国际著名学者来校进行合作研究。这些学者包括美国UIUC的韩家炜教授,美国纽约州立大学的孟卫一教授,美国University of Texas的堵丁柱教授,新加坡国立大学的黄铭钧教授,丹麦Aarhus大学的Christian S. Jensen教授等等。此外,还建立了中澳数据与知识工程联合实验室,开展与昆士兰大学的联合博士生培养工作。

在大数据实习基地方面,我们与多个世界顶级企业在人民大学建立联合实验室,例如,2012年建立华为-人大数据管理联合实验室,2014年与Infosys合作建立数据科学联合实验室。

本学科已经建成了“人大行云”计算平台,为广大师生提供弹性的、可伸缩的计算资源和存储资源的多功能服务提供平台。人大行云利用虚拟化技术和云计算技术使得我们可以利用有限的硬件资源可以为师生提供更多的个性化服务,使得硬件和软件资源都能得到有效的利用。 

精心打造的大数据人才培养方案

为提高大数据人才的培养质量,信息学院投入了大量优秀师资,专门为数据科学与大数据技术专业精心打造了一系列精品课程,在本科阶段给学生打下扎实的数学、大数据和计算机基础。数据科学与大数据技术是一个宽口径的专业,与很多行业都有相关性,全面而扎实的基础可以提高本专业学生的适应能力,可以从事多种职业方向。

如下图所示,其中标记红色字体的课程是专门为大数据专业开设的新课程,我院精选了优秀教师组建课程建设团队,例如《数据科学导论》由杜小勇教授和文继荣教授牵头,陈跃国副教授等参与;《大数据计算智能》和《非结构化大数据分析》由信息学院副院长、计算机系系主任李翠平教授和社会网络数据挖掘专家张静博士负责;《计算机系统基础》课程由计算机副主任柴云鹏副教授负责;《并行与分布式计算》由并行计算专家张峰博士负责。此外,我院的精品课程《数据库系统概论》将由杜小勇教授和信息学院党委书记陈红教授等联合授课。