信息学院覃雄派、陈跃国、杜小勇出版教材《数据科学概论》

发布时间:2018-04-09 16:37 浏览量:1130来源:学院办公室新闻类型: 学院新闻

近日,《数据科学概论》一书正式出版。该书由信息学院覃雄派、陈跃国、杜小勇历经5年授课、2年编写而成,系中国人民大学出版社推出的“数据科学与大数据技术丛书”首部教材。该书由中国人民大学信息学院院长文继荣教授作序。

数据科学是一门正在兴起的学科,是“数据科学与大数据技术”专业一门入门和统领式的课程。这本教材为《数据科学概论》课程而设计,兼顾理论、技术、方法的论述和实践性。教材包括四大模块,前两个模块主要讲述数据科学的基本概念、原则、方法,以及各种类型数据的管理和分析技术,后两个模块介绍具体的平台和工具,以及数据科学的成功案例和具体领域的实践。

该教材采用深度展开和宽度展开的内容展示路线图,将内容有效组织起来。

在理论部分,先由浅入深,层层递进,再宽度展开,旨在培养学生宽广的视野,形成完整的知识体系。在介绍数据科学基本概念、原则和方法的基础上,本教材按照在线事务处理和数据服务、在线数据分析和结构化数据分析、到数据的深度分析(包括统计分析、机器学习和数据挖掘)的路线,从简单分析到复杂分析,层层引导用户了解数据的管理和分析的主要技术和方法。而后进行宽度展开,介绍批处理模式之外的流数据处理,结构化数据之外的文本数据、社交网络数据、时间序列数据、轨迹数据等的管理和分析的技术与方法。

在应用部分,先宽度展开,再深入量化交易领域,旨在培养学生的动手能力和浓厚兴趣。该部分在介绍云平台、Hadoop和Spark生态系统、Python语言以及相关数据挖掘/机器学习/统计分析函数库基础上,带领读者深入金融应用中的量化交易领域,实现全流程的数据分析和应用(各位老师在实际教学中,也可以根据需要替换成政府、电商、互联网、金融、经济、新闻、法律等领域的应用案例)。

同时,作为一本入门的教材,该教材避免陷入数学公式的复杂推导过程。在对数据管理和分析的主要技术和方法的介绍中,采用直观的案例、形象化的图形等手段,通过浅显易懂的语言,深入浅出地进行论述。

据悉,教育部于2018年3月公布第三批“数据科学与大数据技术”新专业,至此共有200多所高校获批建设该专业。如何建设这个新型的学科、各门课程如何设置等是各位学科负责人和教师都非常关心的问题。中国人民大学出版社“数据科学与大数据技术丛书”结合学科研究与教学实践,编写配套教材,探索数据科学学科发展与课程教学路径。

注:

其它信息,请关注作者博客:

http://blog.sina.com.cn/qinxiongpai    https://blog.csdn.net/xiongpai1971

欢迎各高校相关课程任课教师填写“教师服务登记表”,并返回出版社,获赠该教材。[教师服务登记表链接]

 

文章关键词:数据科学概论