周晓方:让数据库应用简单化
周晓方,1963年生于江苏南京,澳大利亚籍,澳大利亚昆士兰大学计算机专业博士,曾任澳洲科学院(CSIRO)空间信息系统研究室主任、澳大利亚昆士兰大学讲席教授,现加入我校数据工程与知识工程教育部重点实验室。历任《超大型数据库国际会议期刊》(VLDB Journal)、《电气和电子工程师协会数据与知识工程学报》(IEEE Transactions on Data and Knowledge Engineering)、《信息处理快报》(Infor-mation Processing Letters)、《网络信息系统(World Wide Web Journal)》等国际期刊丛书编辑,网络信息系统工程协会(The Web Information Systems Engineering Society)执委会委员,澳大利亚企业信息基础研究组织主任,澳洲水文信息系统集成项目发起人之一,推动中澳双方在水利建设上的合作。
我校数据工程与知识工程重点实验室是我国目前在数据库领域唯一的教育部重点实验室,已建成目前国内一流水平的高性能数据库测试实验室和数据永久保存技术实验室,承担了国家“863”计划数据库领域的重大项目、重点项目,是国产数据库发展的重要推动力量。自2006年开始,实验室团队成员在国际顶级数据库会议上连续发表论文,引起了国际学术界的关注。2010年,作为昆士兰大学及澳大利亚数据库研究领域学术带头人,周晓方教授加入这个团队,共同致力于把实验室建设成为数据工程与知识工程领域第一个国家重点实验室,以信息技术推动人文社会科学研究。
数据库创新:挑战与机遇
数据库是“按照数据结构来组织、存储和管理数据的仓库”。在经济管理的日常工作中,常常需要把某些相关的数据放进这样的“仓库”,并根据管理的需要进行相应的处理。随着社会的发展,数据管理与数据使用严重脱节的问题日益显现。
周晓方:现在有大量的数据不在数据库管理之内,比如从事生物技术研究的人员,需要花费很多时间在数据管理上。我觉得这是我们数据库研究人员的失职,因为我们没能提供一个足够好的数据管理方式,没有一个简单好用的数据库。目前限制数据库广泛应用的原因主要有三点:数据量大、用户多、数据类型复杂。下一阶段数据库的发展就是要解决应用困难的问题。
在我的研究中,把解决数据质量问题作为数据库研究的重点。上一代数据库的应用特点是只要数据库提供的数据就是正确的,比如银行系统、学生信息系统。但是在水文信息等科学领域的应用中,对于数据库提供的数据,需要具体考虑数据是从哪儿来的,经过什么样的处理,怎样进入这个系统,有没有进行过验证等等。现有的数据库系统忽略了这一点,但是对各个应用领域来说,这是很大的问题,花费了大量的人力物力,还是解决不了。我希望能做出简单好用的数据库,同时解决这些应用领域的共同问题。
在大规模复杂数据管理、集成与分析的基础研究及海量数据前端应用方面,周晓方教授积累了大量经验和成果,目前他的研究重点为开发新一代信息管理基础设施,解决海量和开放数据环境、新型硬件环境带来数据管理与数据使用严重脱节的新问题。他认为,要实现“简单好用”的数据库需要数据库技术的创新,这也正是中国数据库发展在国际新型数据管理研究的竞争中取得领先地位的契机。
周晓方:新一轮的数据库技术创新即将来临,技术创新的方向就是创造出能够支持更广泛应用的新型数据库。在上一轮的科研环节中美国处于领先地位,如果谁能在这一轮的科研环节中领先,将来在数据管理上就能占有主导地位。
数据积累、数据采集、数据整理、数据分析,这是每个人都要做的事情。数据库是应用领域,我们的目标是要让人们能够应用,并让数据库的应用简单化,提高数据管理效率。在上个世纪70年代,通常研发出一个数据库需要花费很长时间培训专门的使用人员,在实际使用中也要投入很多的管理时间。现在多数用户是日常用户,如果能把更多的共同部分放到数据库中去处理,人们管理数据的时间和精力就会减少,相对而言可以为人们提供更好的工作和生活方式。
数据库:学科融合的平台
2009年美国科技政策论坛上,美国麻省理工学院(MIT)校长苏珊·霍克菲尔德(Susan0Hockfield)以生命科学与工程学和物理学融合为例,作了题为“在学科融合中寻找答案:下一次创新革命”的主旨报告,并指出学科融合的趋势“不可避免”。
我校数据工程与知识工程重点实验室一直将文理交叉结合作为实验室建设的特色之一,并由此突破了省部级以上重点实验室100%属于自然科学领域的先例。在实验室定位中,提出了将信息科学技术与管理科学、法学的发展紧密联系起来,将数据库领域的研究优势与信息资源管理学、档案学、证据法学的学科优势结合起来,将自然科学与人文社会科学的研究方法结合起来,通过共同的项目将从事自然科学研究的人员与主要从事社会科学研究的人员紧密结合起来。
周晓方:我在研究中一直注重数据库研究与各个应用领域的关联,将数据库在不同领域应用中的问题集中,提炼出共有的问题并予以解决。我认为,这有助于具有普适意义的数据库的研发,这样的数据库为创造学科融合的平台提供了可能。比如“治理中国的环境”这样一个大问题,要求大量的数据支持,包括经济模型、人口管理、环境监测、废水处理、太阳能应用等等。如果我们有一个好的数据平台,数据库能够管理好不同学科的数据,并且应用简单,就会提高研究效率,支持并推动相关研究。
数据工程与知识工程重点实验室:未来的研究蓝图
不久前,周晓方教授回国和数据工程与知识工程重点实验室的同事们交流,确立了具体研究目标。2010年国际小学期,周晓方教授将开设课程并正式加入研究室团队展开工作。
长期以来,周晓方教授的研究领域主要涵盖空间数据库、多媒体数据库、数据质量、高性能数据处理及网络信息系统,以及这些技术在生物信息学、地理信息系统、移动对象管理、水文信息系统、医疗卫生系统、Web查询及视频数据检索等方面的应用。同时,他领导了澳大利亚多个重大研究项目,有着大型合作项目、跨学科与应用型项目的管理经验。加入中国人民大学这所以人文社会科学为主的综合性研究型大学,对于推进他本人的研究和学校各学科的发展无疑注入了新的灵感,提供了新的可能。
周晓方:不进入应用领域,就不知道现有的数据库存在什么问题。为了更好地发现和解决共有的问题,我的研究不拘于某一个应用领域。我在人文社会学科的应用上做的研究比较少,这正是我来人大工作以后希望做的一件事情。文科的数据,特别是国民经济方面,数据数量多,数据质量需要优化,数据的使用要求也在提高。希望我们的数据库研究能为人文社会学科领域提供更好的数据管理方式。
人民大学的研究团队具备了成为数据库学界领头人的条件。我希望能够以人大为基地和依托,与国内从事数据库研究的同事们一起,为新一轮的科研环节做出贡献。第一步,通过发表高质量的学术文章提升人民大学在国际上的知名度;下一步,努力把教育部重点实验室建成国家重点实验室,在国家科学技术创新和国民经济发展中真正起到作用;第三步,数据库研究的重要性体现在大型的前端应用上,通过先进的数据管理和使用方式,更好地发挥人民大学的国民经济、人文社会学科数据作用,为这些领域的研究带来新的变化。
(原刊载于中国人民大学校报第1343期(总第1343期)2010年4月26日, 作者:学生记者 刘林琳)