二十年点“数”成金
20年前,收到那封国内来信时,杜小勇面临两个选择:留在日本,教书做研究,按部就班等待晋升;回到祖国,进入中国人民大学工作,壮大数据库学科,为国家培养更多数据库人才。
抉择,最能亮出人的本心。他选择了后者。自此,杜小勇和他所在的中国人民大学数据库研究团队,逢山开路、遇水搭桥,每次关键时刻的抉择,都是从心而动。
20年来,中国人民大学数据库学科不断壮大,经过科研人员的不懈奋斗,一个能用、好用的国产数据库管理系统磨砺而出。今年1月8日,在2018年度国家科学技术奖励大会上,这个团队凭借“数据库管理系统核心技术的创新与金仓数据库产业化”获得国家科学技术进步奖二等奖,这是中国人民大学首次获得国家科技“三大奖”奖项。
“祖国正飞速发展,蕴藏更多机遇”
日历翻至 1999 年,杜小勇在日本拿到博士学位已有两年,并顺利留校任教,孩子也开始在日本读小学。那封信是在中国人民大学信息学院担任院领导的师姐王珊写的,她在信中透露人大要成立计算机科学与技术系,急需人才,邀请杜小勇回去担当重任,还提到了办公司的想法。
王珊和杜小勇师出同门,两人在人大读研的导师萨师煊教授,是我国数据库学科的奠基人,早在上世纪 70 年代末,这位有远见的学者就率先在国内开展数据库技术的教育与研究工作。
开公司的想法,起源于王珊的留学经历。1984 年,王珊应邀赴美,在马里兰大学当访问学者,两年的“洋插队”时光,她和很多中国学者共同参与开发研制“可扩展关系数据库系统XDB”。
上世纪80年代,国外已经有了数据库产品,但在国内,计算机还是稀罕物件,更别提数据库了。王珊预感到,未来数据库在中国必然大有用处。启程回国之前,她给时任人民大学校长袁宝华写了一封信,建议学校设立数据与知识工程研究所,“我们要集中人力,搞一些切实的研究课题,开发真正能与国外竞争的数据库系统、应用生成系统产品。这是对国家最大的贡献……”
预想中的研究所成立了,王珊担任首任所长。在这个一无办公用房、二无电话、三无经费、四无人员编制的所谓 “四无所”里,她带领师生参与研制了我国第一个自主知识产权的数据库系统COBASE,撰写出版了我国第一部数据库系统概论教材以及数据仓库技术和联机分析处理等领域的专著,并承担了国家科技攻关项目、“863”高技术项目、国家自然科学基金重大项目等多项重大科研项目。
团队实力在学界名声渐起,王珊又瞄准新的目标——将研究成果产业化。这个时候,她想到了杜小勇。反复阅读信件后,杜小勇踟躇不决:那个时候,有些留学生宁愿“黑”在日本,也不愿回国,何况他还有稳定教职;如果回国,月薪不过千元,但是当教授、建学科、办公司,每一样都很有诱惑力,也充满不确定性。
“如果放眼十年之后,在日本,我可能按部就班地当上了教授,而祖国正飞速发展,蕴藏更多机遇。”他又想到自己的孩子,他希望下一代在祖国受教育,感受中华传统文化的熏陶。想通这些,他果断地决定——回国。当年,他拖家带口回到北京。
同一年,人大金仓正式成立,王珊任董事长,杜小勇当总经理,员工是人大数据库团队的许多老师和研究生。“金仓”,寄托着大伙儿的美好期待,数据库是存储数据财富的“仓库”,他们希望从海量数据中挖到宝藏。
“支撑我们坚持的就是理想”
公司启动资金仅 53 万元,除了学校支持的 10万元,其他都是大伙儿一万两万地“众筹”而来。公司运转一年,急需新的投资。习惯编程序写论文的学者,不得不千方百计找融资。起初,他们连商业计划书是什么都不知道,后经多方请教,边干边学,凭借认真撰写的商业计划书和扎实的技术积淀,获得了首批600万元融资。
那个时候,人大金仓没有正式员工,主要是老师带学生兼职干活儿。对市场定位把握不准,产品开发的质量控制也不规范,为此,还曾栽过跟头。杜小勇清晰地记得,他们与恒基伟业、联想合作为一款名为商务通的产品开发嵌入式数据库软件,电视广告片已制作完成,1000 台样机也灌装完成,发货前夜测试时,因为一个程序 bug(漏洞),系统突然崩溃。发货紧急取消,所有前期投资打了水漂,这对于一个刚起步的小公司而言,无异于重创。
另一个契机也出现了。21世纪之初,中国数据库市场几乎为国外软件巨头瓜分殆尽,这不仅导致信息化建设成本居高不下,也严重威胁国家信息安全。国家开始从战略层面鼓励数据管理系统软件的国产化。
是继续做市场化产品,还是争取国家支持研发国产数据库,投资商与公司管理层发生激烈争吵。有投资商直言不讳:打造国产数据库不是一个小公司能干得起来的。而王珊、杜小勇他们也明白,从投资角度讲,国产数据库管理系统不该由人大金仓这样的小公司来做,应该由大型国企来主导。王珊说,“能否成功,我们真的不知道,也没有考虑个人回报。支撑我们坚持的就是理想,是研发具有自主知识产权、自主可控的国产数据库管理系统。”
在公司发展的这个节骨眼上,急需开发大型数据库产品的技术人才,在王珊盛邀之下,她的学生、香港中文大学博士任永杰放弃了留港工作机会,加盟人大金仓担任技术总监,专门负责数据库产品研发。
在他们的坚持和努力之下,一场大型国产数据库管理系统的研发之旅开启了。
“在哪里跌倒就在哪里站起来”
挑战很快到来。
2002 年,科技部启动“863”计划数据库重大专项,邀请国内几家数据库团队参与测试,优胜者才能获得资金支持。
基于人大数据与知识工程研究所前期的研究成果,王珊和杜小勇挂帅,经过近一年备战,带着尚不成熟的 KingbaseES 数据库管理系统前去应战。
2002 年 8 月底,测试当天,中国软件评测中心的测试现场相当热闹,时任研发部负责人的人大计算机系教师张孝在现场当技术支持。尽管前晚一夜没合眼,这位年轻学者在现场依然神采奕奕,打开笔记本电脑严阵以待,一旦有人喊“人大金仓”,就马上过去判断问题、修改程序。
一周之后,总分出来,人大金仓数据库排第四,差点就被淘汰了,用王珊的话来讲,“原来以为会跑了,实际上也就刚刚能爬”。
对于结果,人大金仓接受,但不认输。王珊和大家都憋着一口气:人大是国内数据库学科起源之地,这点困难算什么,在哪里跌倒就在哪里站起来!
那年国庆节,一场涮火锅聚餐之后,杜小勇和团队骨干认真讨论研究了技术路线,大家达成共识,要走自主创新和学习借鉴相结合之路,保持 KingbaseES1.0 系统架构和存储体系,并广泛学习国际数据库的先进技术,有选择地消化吸收。
2002年下半年,任永杰带着8个老师和研究生封闭近一个月潜心研究数据库产品技术方案选型与规划,之后,人大数据库团队开始了长达半年的攻关,大家兵分四组,从标准符合性、内核改造、应用等方面提升数据库性能。2003年4月,第二次测试时,人大金仓总成绩跃居第二,到了 2004 年测试时,就升至第一名。
从2002年到2011年的十年间,靠着这股“逢山开路、遇水搭桥”的劲头,人大金仓将 KingbaseES系列数据库更新了七个版本,实现国产数据库从无到有的突破。期间,通过参与多个国家“863”计划和“核高基”重大专项项目,人大金仓在数据库管理系统的高可靠性、高安全性和高性能以及面向大数据的数据类型与数据规模的可扩展性方面,取得显著突破。
基于这些技术打造的 KingbaseES V7.0,是国产数据库中为数不多的能在测试期间实现主备双机系统5×7×24 小时持续稳定运行并有效确保“系统不宕机、数据不丢失”的数据库管理系统,也是最早获得国内最高安全等级的国产数据库产品。
人大金仓另一位创始成员陈红记得,攻关期间经常做封闭开发,常常是寒暑假期间,把项目研发人员拉到郊区,心无旁骛地赶进度、攻难点。
更多的成果在人大金仓不断问世,2014 年,金仓 KingbaseRAC 集群数据库软件问世;2015年,KingbaseES 数据库推出 8.0 版本;2016 年,金仓大数据平台 KingbaseDP 发布,金仓并行分布式云数据集群系统 V3.1 正式上线……一个功能完备、全面覆盖的国产数据库管理系统产品集群正在形成。
如今,人大金仓数据库产品广泛应用于电力金融等十多个行业领域,在 60 多个全国性重大信息化工程核心关键业务中开展规模化应用,全国累计推广超过 50 万套,遍布近3000 个县市;2015 年至 2017 年,人大金仓新增直接和间接销售额达 6.433 亿元,新增直接和间接利润 0.987 亿元。
“创新的土壤是基础研究”
人大金仓是人民大学数据库学科产学研一体化中的关键一环,然而,要理顺高校和企业的关系,并非易事。
2005年,经过慎重思考,王珊和杜小勇做了一个决定,人大金仓数据库研发团队与信息学院数据库学科教学科研团队正式“分家”:一部分人回到学院专心搞科研,另一部分人则留在公司继续做产品。
多年的磨练、旁人的误解、公司管理的麻烦,王珊和杜小勇都挺了过来;摆在眼前的另一残酷现实是,推进成果产业化,耗费不少精力,导致团队缺少发表在高水平国际期刊和会议的论文。他们深知,长此以往,绝非良久之计,“要让国产数据库与国外产品竞争,创新的土壤是基础研究,而这其中学科建设是关键。”
这一次,做学术的本心使杜小勇毫不犹豫地做出了选择,他回到人民大学信息学院并担任院长;2008 年,学校设立教育部数据工程与知识工程重点实验室,他担任首任实验室主任。这里汇聚了一批专职人员心无旁骛地深耕数据库基础研究,高水平论文持续产出,与此同时,实验室也与人大金仓研发团队保持密切联系,充当人大金仓的“研发智囊”。
去年,实验室主任换届,杜小勇再次当选,掌舵实验室,他带领团队要去追逐更大的梦想。
当前,互联网和大数据技术飞速发展,给数据库研究带来新的机会,国外 Oracle 系统一统天下的局面被打破,互联网急需分布式系统,需要研发云端的数据管理,大容量的存储设备和新型计算设备也在快速变化,这些都是数据库发展的新机遇。数据工程与知识工程教育部重点实验室,在多个方向部署研究力量,迎头追赶这波浪潮。
比如,在“云计算与大数据”国家重点研发计划中,人大信息学院党委书记、教授陈红是“高时效、可扩展的大数据计算模型、优化技术与系统”项目的负责人,该项目计划研发一套支撑平台,其中包括大数据存储和计算系统、机器学习系统和交互式分析向导系统。陈红告诉记者,目前大数据系统主要是独立发展的各种开源软件,构建大数据应用时需要根据需求选择合适的开源计算系统和存储系统,这种定制应用的方式存在诸多问题,而这套平台可以透明地支撑不同的存储和计算模型,摆脱定制限制。未来,他们将在阿里“双11”和“城市大脑”项目上做示范应用。
今年 1 月,杜小勇和王珊牵头申报的“数据库管理系统核心技术的创新与金仓数据库产业化”获得国家科学技术进步奖二等奖。这群从改革开放之初就专攻数据库领域的学者,实现了20年前的梦想。和王珊一起并肩领奖那天,杜小勇深深感激师姐王珊的邀约,他更感谢飞速发展的祖国带来的人生机遇!正如他回国后,给母校日本名古屋工业大学校刊撰文所写的那样——祖国的舞台更大。
人大金仓数据库
数据库管理系统是计算机基础软件。经过近 20 年研发,人大金仓构建了覆盖数据管理全生命周期、全技术栈的产品、服务和解决方案体系,产品广泛应用于电子政务、电力、金融等重点行业,装机部署超过 50 万套,遍布全国近 3000 个县市。此次由中国人民大学与北京人大金仓信息技术股份有限公司完成的“数据库管理系统核心技术的创新与金仓数据库产业化”项目,突破数据库管理系统核心技术难题,创新点归纳为 “三高一大”:即在数据库管理系统的高可靠性、高安全性和高性能以及面向大数据的数据类型与数据规模的可扩展性方面,取得显著突破。