人大“芯”智造 做中国自己的数据库 访人大金仓数据库产业化研发团队

发布时间:2019-01-11 21:52 浏览量:426来源:中国人民大学校报作者: 记者/刘晓阳

1999年6月,时任中国人民大学信息学院院长的王珊攥着东拼西凑筹来的53万元,创办了北京人大金仓信息技术有限公司(以下简称“人大金仓”),这是人民大学建校以来孵化的首家产学研一体化高科技企业。时隔20年,这家企业再次出现在聚光灯下。2019年1月8日,人大金仓第一任掌门人杜小勇与其三数据库产业化研发团队一同迎来了属于他们的高光时刻。在人民大会堂刚刚闭幕的全国科技大会上,由杜小勇团队自主研发的“数据库管理系统核心技术的创新与金仓数据库产业化”成果荣获国家科学技术进步二等奖。

20年,在时代洪流中转瞬即逝,但置身日新月异的科技浪潮中,这一时空坐标却被无限拉长。从1999到2019,人大数据库技术研发团队以敢为天下先的勇气,在国产数据库科研攻关领域砥砺前行,书写出一部由0到1、敢为人先的人大金仓创业史,擎起了中国数据库领域的一面旗帜。

中国要有自己的数据库

上世纪90年代,中国没有具备自主知识产权的数据库产品,国内市场几乎全为国外三大巨头企业所垄断。

1984年,师从人民大学信息学院萨师煊教授的王珊应邀赴美访问留学,在美国马里兰大学参与“可扩展关系数据库系统XDB”。这时,距人民大学信息学科筹办也才不过短短六年时间。在每天编码10小时+的高强度工作中,王珊的两年“洋插队”生活过得很快。

走出国门,王珊看到了中国自主研发数据库的可能性。“我们不仅能做,而且我们一定要做!”行将回国之际,她给时任中国人民大学校长的袁宝华写了一封信。

王珊在信中建议学校批准成立“数据与知识工程研究所”,她写道:“我想成立研究所确实是当务之急。我们要集中人力,搞一些切实的研究课题,开发真正能与国外竞争的数据库系统、应用生成系统产品。这是对国家最大的贡献…没有这样的研究机构,无法‘真刀真枪’地干,没有和国际合作的‘interface’ ”。

于是,1987年,中国人民大学信息学院数据与知识工程研究所成立,王珊担任首任所长。刚组建的研究所一无房产、二无电话、三无经费、四无人员,被她戏称为“四无所”。从“无”到“有”,在这里,王珊和她的团队着手研制出了我国第一个自主知识产权的数据库系统COBASE,撰写出版了我国第一部数据仓库技术和联机分析处理的专著《数据仓库技术和联机分析处理》,接连拿下了包括国家攻关项目、863高技术项目、国家自然科学基金重点和重大项目等多项重量级科研项目。

很快,研究所的一系列研究成果在国内外数据库领域产生了广泛影响,如何将这些创新型学术成果转化为面型市场的应用型产品,成了摆在当时的数据库研发团队面前的一个最为迫切的问题。

1999年,王珊带着人大数据库技术研发的“老班底”,攥着大家伙儿你捐一笔、我凑一笔筹来的43万元,再加上学校支持的10万元,踩在90年代末那场 “下海”热潮的尾巴上,创办了人大金仓。

刚刚留日归国的杜小勇,放弃了国外优厚的教职待遇,回到人民大学信息学院执教,欣然答应老师王珊的邀请,成了人大金仓的第一任总经理,考虑到公司财政紧张,他在自己任上一分钱工资也没拿。

人大金仓挂牌开张了,可最开始市场并不买账。

要将抽象的理论成果转化为面向市场的可操作应用,只凭研究所雄厚的学术实力与创新能力,是很难做到的。掌握前沿技术固然重要,但洞察市场需求和用户体验才是“点金”的关键。一开始,人大金仓举步维艰。产品市场不认可、卖不出去,就没有钱搞研发,研发跟不上,势必会被市场淘汰出局。

在这个节骨眼上,杜小勇拉来了一笔600万的融资,解了燃眉之急。研发团队由此意识到只有尊重市场逻辑,用产品说话,研发成果才能真正“变现”。于是,第一个十年间,人大金仓花大力气开始了面向市场的国产数据库应用研发,产品不断迭代优化,单子一个接一个地进来,客户类型也从边缘行业一点点深入核心部门,逐渐打开了国产数据库领域产学研一体化的大门。

打破国内数据库市场的国外垄断

2001年12月11日,中国正式加入WTO,大大小小的国内企业纷纷走出国门,拥抱经济全球化浪潮所带来的巨大红利。国门打开,外资企业瞄准中国市场所蕴含的发展机遇和广阔前景,纷纷鱼贯而入。随着全球化时代国与国之间的经济较量与政治博弈日趋白热化,信息安全成了一柄悬在国家上空的达摩克里斯之剑。

作为信息系统基础与核心的数据库管理系统,是维护国家信息安全的有力屏障。但是,数据库管理系统结构复杂、开发难度大,囿于技术实力与软件研发的滞后性,中国数据库市场几乎为国外软件巨头瓜分殆尽,这不仅导致信息化建设成本居高不下,也严重威胁国家信息安全。

抱着国家信息安全不能受制于人的强烈信念,推进国产数据库技术和产业发展、打破数据库市场的国外垄断,成了杜小勇及其团队的头号使命。随着初创时面临的一系列问题被一一克服,人大金仓驶入了发展的快车道。

十五期间,人大金仓连续承担了3个国家863计划数据库重大专项项目,杜小勇任数据库重大专项专家组组长,从数据库管理系统Kingbase ES V2.0到通用数据库管理系统Kingbase ES V4.0,再到大型通用数据库管理系统Kingbase ES V6.0,团队自主研发了一系列具备国际领先核心技术的数据库管理系统,实现了国产数据库从无到有的突破。十一五和十二五期间,人大金仓又先后承担了一个国家863计划目标导向项目——“纯XML-关系数据库系统PXRDB研制与应用”和一个“核高基”重大专项项目——“大型通用数据库管理系统与套件”。全部项目累计国家拨付科研经费近8000万元。

为粉碎国外数据库品牌的技术封锁,人大金仓在数据库管理系统的高可靠性技术、高安全性技术和高性能技术方面取得了一系列新突破。

2011年,金仓数据库管理系统Kingbase ES V7.0发布,这既是国产数据库中为数不多的能在测试期间实现主备双机系统5*7*24小时持续稳定运行并有效确保“系统不宕机、数据不丢失”的数据库管理系统,也是最早获得国内最高安全等级的国产数据库产品。

KingbaseES数据库安全性能达到了国际数据库安全标准(TCSEC)的B2级别,不仅从技术上瓦解了国外禁止对华输入高于B1级别数据库的销售禁令,还结合国家对数据库安全的特定需要,进一步完善了安全性加强技术,获得了两项国家发明专利。

在追求数据库基准测试性能指标方面,Kingbase ES数据库管理系统也已达到国际领先水平。2006年中国软件评测中心数据库性能测试结果表明,Kingbase ES数据库管理系统与国外数据库巨头Oracle 的旗舰产品“Oracle Database 11g” 在TPC-C上的性能相当,具备在核心应用中替代国外数据库的能力。

技术创新与科研攻关,就像两根时刻紧绷的神经,分毫不差地在人大金仓的中枢系统中运行着追求卓越、不断创新的源代码。

2014年,金仓KingbaseRAC集群数据库软件问世; 2015年,KingbaseES数据库推出8.0版本;2016年,金仓大数据平台Kingbase DP发布,金仓并行分布式云数据集群系统V3.1正式上线……一个功能完备、全面覆盖的人大金仓国产数据库管理系统产品集群正在形成并不断发展壮大。

从零开始,人大金仓用20年时间最终实现了基于国产数据库的信息系统从无到有、从点到面、从边缘到核心的转变。

目前,人大金仓数据库产品广泛应用于电力、军工、金融等十多个行业领域,在60多个全国性重大信息化工程核心关键业务中得到了规模化应用,全国累计推广超过50万套,遍布近3000个县市。2015-2017年,企业新增直接和间接销售额达6.433亿元,新增直接和间接利润9865万元。

建设“中国特色、世界一流”的数据库学科

从初创之日起,人大金仓就被贴上了“产学研一体化”的标签。面向高校,它是充当科研创新的平台;面向市场,它是输出应用产品的企业;面向学院,它是培养拔尖人才的基地。从学科建设到产品研发,从科研攻关到人才培养,人大金仓走出了一条中国特色的产学研协同发展之路。

为理顺这一机制,2004年,杜小勇做了一个决定,人大金仓数据库研发团队与信息学院数据库学科教学科研团队开始正式“分家”。数百人的团队,拆成两半,一部分人回到学院专心搞科研,另一部分人则留在公司继续做产品。“要想实现市场化和专业化,老师带着学生兼职做的路子是行不通的。做学术也好,搞研发也好,靠得都是持续专注的投入。”改革虽大刀阔斧,却在团队内达成了高度共识。

“分家”后,杜小勇回到中国人民大学信息学院。2005年,他担任信息学院院长,一掌舵就是10年。2008年,中国人民大学信息学院成立教育部数据工程与知识工程重点实验室,杜小勇成为第一任实验室主任。

从人大金仓到教育部数据工程与知识工程重点实验室,人民大学数据库学科由此锻造出一支能打胜仗、不怕吃苦的坚强队伍,也培养了一批又一批专业过硬、肯干能干的青年学子。

在不少人民大学信息学院数据库专业研究生的记忆里,到人大金仓实习几乎已成为他们的必修课,少则数月,多则几年。

2006年,刚刚考上博士的卢卫,在导师杜小勇的指导下,和许多师兄师姐一样,也来到人大金仓成为了一名实习生。他从最初级的软件测试做起,一点点接触核心产品,涉足内核研发。“当时有一个bug印象最深刻,几百万行的代码,一行一行对照检查,调了大半年都没解决。”强调动手、苛求细节、团队作战,这些卢卫对人民大学数据库学科的第一印象,都始于人大金仓。

2014年,卢卫以新加坡国立大学博士后的身份学成归国,面对国内多所一流高校接二连三抛出的橄榄枝,他毫不犹豫地选择回到了母校,“这个团队让每一个人都有很强烈的归属感。”

2018年,卢卫以子课题负责人的身份接连拿下了“大数据共享融合关键技术研发及政务治理验证”北京市重大专项课题和“高时效、可扩展的大数据计算模型、优化技术与系统(共性关键技术类)” 国家重点研发计划。

“只有打造一流的平台、建设一流的实验室,才能吸引一流的人才、迸发一流的学术生命力。” 人大金仓“创始团队”成员之一的陈红,现已是信息学院的党委书记,在她眼中,人大金仓就是这样的一个平台,能招徕人才、能锻造团队、能驱动创新。

“打胜仗不骄傲,失败了不气馁,团队才有凝聚力。” 王珊总说,人大金仓数据库产业化研发团队能取得今天的成绩,是靠一群“初生牛犊不怕虎”的“傻子”不知深浅闯出来的,正是这群“傻子”数十年如一日的坚持,中国才有了中国自己的数据库,人民大学数据库学科也才有更加辉煌的明天。