我们生活在一个数据时代。最早提出“大数据”时代到来的麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”人们网购时能够便捷地调取既往订单,每月缴费时能够按时地收到个人话费账单,在银行办理业务时能够快速地查询账户信息,这些都离不开数据库对于信息存储和调取的强大功能。数据库是指长期储存在计算机内有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。数据库产生于距今六十多年前,随着信息技术和市场的发展,到了二十世纪九十年代以后,数据管理不再仅仅是储存和管理数据,而转变成用户所需要的各种数据管理的方式。在以纸质储存信息方式为主的时代,大量的数据或以时间,或以内容,或以用途等为标准进行划分,存放于文件柜中,以便查询和调取使用。而在数据信息无纸化逐渐普及的今天,数据库就是在这样的背景下应运而生的电子化的文件柜。数据库在金融、政务、教育、电信、医疗健康等一系列领域都有运用,为各领域在运营、决策、战略上提供数据方面的支持。对于数据信息的充分收集和分析往往是做出一个合理决策的基础。数据的运用与各行各业的结合就像是不断向外延伸的枝干,而数据库所存储的海量数据信息就是支撑滋养着这无数枝干的根源。树大需根深。相比传统纸质化的数据储存方式,数据库的广泛应用虽然优势凸显,但也带来了一些亟待思考的问题,其中,信息安全首当其冲。作为信息的聚集体,数据库是计算机信息系统的核心部件,其安全性至关重要。如何有效地保证数据库系统的安全,实现数据的保密性、完整性和有效性,这不仅关系到企业的兴衰,更关乎国家的安全。我国的数据库产业受国内信息化产业整体发展较晚的影响,市场成长时间滞后于全球,国外成熟的商业数据库产品进入我国市场后便长期占据着市场主导地位。阿里于2008年首先开始数据库的去“IOE”运动,到2013年已经彻底完成了去“IOE”的计划。此后,许多企业和政府机构也开始开展设备国产化的运动。后疫情时代,外部发展环境更加恶劣复杂,反全球化也势头正盛,出于信息安全考虑的数据库国产化替代需求显得更为迫切。守住数据库信息安全的根,才能保住各行各业的枝干稳定生长。从应用方向来看,交易型数据库和分析型数据库,即OLTP与OLAP,是关系型数据库最为常见的两种类型。交易型数据库主要面对与企业业务数据相关性强的事物场景,保证强一致性,面向一线业务人员,支持多并发,实时快速地增删查改,用于银行转账等业务支撑。分析型数据库则是通过对其他数据库的历史数据查询,以实现高速多维分析来自数据仓库、数据集市或者数据湖的数据,可使用关系型或者非关系型的数据库,主要面向分析师和管理者用于企业决策数据分析。二者面向的使用场景不同,需要解决的问题也各有侧重,因而也有着各自非常显著的优劣势。为了避免在传统架构中,在线与离线数据库之间大量的数据交互,混合事务分析处理(HTAP)应运而生,这一概念由Gartner在2014年首次提出。HTAP解决了存储与并发处理的扩展性问题,能同时实现高并发读写和实时更新,底层数据可快速复制,减少了数据负担,节省了各类成本。虽然当前市场OLTP仍是主流,但可以看到HTAP的融合性尝试应是未来方向。“湖仓一体”是融合高效在另一方向上的尝试。数据湖更注重原始信息的保留,基于它可以运行多种类型的分析;而数据仓库则恰好相反,基于SQL体系往往具备很强的结构化数据计算能力,但原始数据都需要经过一系列的处理才能入仓,储存的数据更加靠近数据的消费端。在“湖仓一体”的架构下,数据仓库与数据湖之间的壁垒被打通,底层多套存储系统并存且互相数据共享,形成了资源池,上层各引擎可以通过一体的封装接口访问,实现了联机交易和联机分析的同时支持。作为数据湖极低成本存储大量数据和数据仓库高性能进行大量数据处理的有机结合,与HTAP一道,“湖仓一体”也应是未来发展方向之一。随着大数据、机器学习算法、新型硬件技术的发展,人工智能与各个行业都在尝试着有机融合,数据库产业也是其中之一。DB与AI优势互补,互推发展。一方面AI对DB能力增益,使得DB能获得更好地执行表现、实现数据库系统的自洽、免运维等;另一方面DB可以优化AI模型,可用于降低使用AI模型的复杂性,加速AI算法,并在数据库内提供人工智能能力。近几年随着云基础设施的高速发展,数据库的部署形态也在发生着变化,基于云模式提供的数据库服务即云数据库得到蓬勃发展,并因为按需扩展、按需付费等优异特性获得中小企业及互联网客户的青睐。现阶段云数据库主要包括两种,一种是托管在云厂商上的“传统”数据库,另一种是基于云环境的云原生数据库。数据库的云部署相比本地部署,一来能够缩短部署、配置和调试的时间,使得企业能够更快用上产品;二来也花费更少的成本,不需要运维人员,不需要硬件。除此之外,它的拓展性也更强,在更新与升级时也不需要重新部署,更加方便快捷。Gartner 预测到2023年,全球75%的数据库将完成云平台的迁徙。尽管当前国产化替代仍是我国数据库现阶段必须先行的一步和重点行进的方向,但放眼未来的发展,竞争或许终将会是逐鹿于“云上”。树高叶茂,系于根深。数据时代,作为各行各业的发展记录和决策依据,数据库的根基作用不容忽视。只有根扎得深咬得牢,才能汲取更多向上生长与向外延伸的力量。