大数据科学与工程

更新时间:2021-05-31

一、 大数据科学与工程专业既是硕士学位授予点,也是博士学位授予点。

二、 研究方向:1、大数据系统;2、大数据算法;3、大数据应用。

三、 专业背景、专业概况、建设成果:

本专业主要培养学生掌握计算机科学与技术的坚实的基础理论和系统的专门知识,具有从事科学研究工作或独立承担技术工作的能力,对所研究的课题有新的见解,取得新的成果,了解相关的学术研究动态,能够从事大数据有关研究的高级专业人才。

师资雄厚,教师们30多年来始终站在学科前沿,跟踪国际先进技术,是国内最早开展面向对象的数据库技术、并行数据库技术、数据仓库与商务智能技术、XML数据库等研究的单位之一,承担了七五、八五、九五国家攻关项目、863高科技计划项目、国家自然科学基金重点项目等20多项。获电子部科技进步特等奖、国家科技进步二等奖、国家计委杰出贡献奖、北京市科技进步二等奖,教育部科技进步二等奖等多项奖励。累计培养了百余名研究生,在国内外杂志上发表论文四百多篇,出版著作几十部。学术研究在数据库领域位居全国领先地位。积极开展对外交流与合作,为我国计算机应用技术,特别是数据库技术的发展做出了突出贡献。是中国计算机学会数据库专业委员会挂靠单位。

四、 毕业生就业去向:外企公司、国内大型IT公司、银行、国家机关等。

五、 主要开设的主要课程

现代统计方法

(Modern Statistic Methods)

(本课程主要涉及现代统计方法及其应用。主要内容包括:统计的基本概念、数据的收集、数据文件的建立,基本统计分析,主成分分析和因子分析,聚类分析,判别分析,时间序列分析,多选变量分析等。)

运筹学与优化理论

(Operational Research and Optimization Theory)

(目的是让学生掌握线性规划,运输问题,整数规划,动态规划等几种重要而成熟的运筹学模型为以后的应用及研究提供必要的基础。)

理论计算机科学

(Theoretical Computer Science)

(介绍自动机与语言,可计算性理论和计算复杂性理论。)

学术规范和论文写作

(Academic Norms and Paper Writing)

(本课程主要目的是对硕士和博士研究生进行必要的计算机科学研究的训练。其中包括阅读科学文献,选择研究方向,归纳具体的研究问题,论文写作技巧,计算机试验技术,硕士和博士论文写作和将来的计算机研究工作寻找和就业等等。本课程对于研究生提高专业研究水平,增加研究兴趣,提高论文写作水平都大有裨益。必修课。)

高级操作系统

(Advanced Operating System)

(结合分布式系统网络编程,重点讲解:分布式系统的概念与设计,包括:分布式系统体系结构,通信、进程、命名、同步化、一致性和复制、容错性以及安全性等;同时介绍前沿的分布式系统:客户/服务器,P2P系统,网格计算,云计算与大数据,移动和普适计算等。)

网络与通信

(Network and Communication)

(本课程以无线通信为背景,系统地介绍了现代移动通信网络的基本概念、基本组成、基本原理、基本技术和典型系统等。)

数据库管理系统原理与实现

(Principle and Implementation of Database Management Systems)

(深入介绍数据库管理系统的实现技术,包括数据存储、索引、查询执行、查询编译、恢复、并发控制等技术。)

云计算与大数据

(Cloud computing and big data)

(随着技术的进步,人们收集了各种各样的数据,数据规模庞大,这些数据里面蕴含着价值。大数据是新的“石油”,我们需要新的工具对其进行分析处理,方可发挥它的价值。大数据处理和分析的主流平台是Hadoop和Spark。云计算是基于虚拟化技术的按需计算资源,大数据处理需要高度可扩展的集群系统,云计算技术提供了完美的底层支撑。本课程在云计算技术支撑下,对两个大数据生态系统及其主要工具进行深入介绍,包括原理、部署、开发和运维等,并且通过案例讲解和编程练习,提高学生的大数据应用设计和开发能力。)

软件工程与方法

(Software Engineering and Methods)

(涉及软件工程的理论与实践、对于不同的软件需求研究和讨论新的方法和思路。)

言语信息处理

(Spoken Language Processing)

(围绕语音识别、语音合成、语音翻译、以及音频信息处理等内容,介绍该领域的基本概念、基本原理、以及基本计算方法。使学生不仅了解言语信息处理技术的工作原理,而且培养学生分析、解决问题的能力和实验技能。)

知识库的构建与应用

(Knowledge Base Construction and Application)

(智能社会中,人们迫切地需要把各种知识表示成一种可推理的形式,从而能产生更多的知识,并支撑智能化的应用。大规模知识图谱应运而生,被广泛应用在各个领域,如科学、医疗、教育、金融等等。本课程主要介绍知识库(又称为知识图谱)的基本概念和技术;以及如何构建知识图谱,包括命名实体识别、关系抽取等信息抽取技术,以及数据融合等集成技术;和知识图谱的一些实际应用,如语义搜索、自然语言问答等等。)

数据集成技术

(Techniques of Data Integration)

(过去20年,数据库的角色,尤其是数据库技术的角色已经发生了翻天覆地的变化。传统数据库应用中,企业或者组织为了保存全部的数据记录,往往都拥有一个集中的、相对封闭的数据库。而如今,我们已经进入了以Web为主导的新时代,在新的应用环境下,不同的数据库和结构化信息源之间往往需要进行交互和相互操作,这需要为用户提供一个完整的集成视图。本课程主要讨论以下问题:如何对数据库思想进行扩充和深化,从而使其能够容纳外部信息源,处理Web的分布式特性和信息共享带来的问题,特别是异构性和不确定性。本课程作为研究生和博士生的一门专业选修课程。通过学习,使学生掌握数据集成的基本原理,并在此基础上了解扩展数据集成以及各种新的集成技术,从而为未来的研究工作打下理论基础。)

分布与并行数据库

(Distributed and Parallel Database System)

(分布式数据库和并行数据库是新一代数据库技术的两个分支,分别介绍分布式数据库和并行数据库的基本概念与核心技术。)

内存数据管理

(In-memory Data Management)

(在掌握数据库技术的基础上,进一步了解在当前硬件新技术支持下数据库技术的前沿发展方向,了解内存数据库的应用需求、实现技术和关键技术点,了解新硬件对数据库技术变革的影响,了解当前主流数据库产品的技术特点及未来数据库发展的趋势。)

人工智能算法与应用

(Artificial Intelligent Algorithm and Application)

(讲解人工智能算法(含支持向量机,神经网络,群智能,软计算等)的基础性概念、原理、计算方法和优化方法,并结合多媒体的应用场景和问题,确实部署使用此类算法,形成对传统问题的使用和分析,并进一步激发学生在应用方面的创新潜力,培养学生分析问题,解决问题的能力。)

PostgreSQL源代码深入分析

(PostgreSQL source code analysis)

(面向计算机应用技术以及计算机软件与理论专业研究生的一门专业课。课程将使得学生了解开源关系数据库系统PostgreSQL的体系架构、技术特点,特别是通过对系统的源代码的大量阅读和深入分析掌握RDBMS系统实现的关键技术和方法,提高学生的系统设计和开发能力。)

机器感知

(Robot Perception)

(本课程主要介绍机器人感知技术的的基础理论,包括贝叶斯滤波,Kalman滤波算法,粒子滤波算法,机器人定位导航技术,机器人SLAM算法,图优化算法等。使得学生了解机器人感知的理论、技术基础与学术前沿,特别是通过对基础知识学习和对相关算法的实现,提高学生的智能算法、数据处理、与智能系统的研发能力。)

社会网络分析与挖掘

(Soical Network Analysis and Mining)

(本课程以计算机科学的典型思维方法为工具,围绕社会学与经济学中的一些经典问题进行分析与研究,学习与体会两类学科知识的交叉与互动。)