01
数据库分类
近些年数据库发展迅速,新增了很多新的词汇,例如分布式数据库、云原生数据库、HTAP数据库、NewSQL数据库、自治数据库等,这些数据库并不完全都是是新型数据库,而是根据不同维度,不同特点,对数据库进行了重新定义。
数据库分类有很多种,根据不同维度,可以有如下多种分类方式。
1.按照数据模型分类
关系型(SQL)、非关系型(NoSQL)、NewSQL型
简单来讲,NewSQL 就是在传统关系型数据库上集成了 NoSQL 强大的可扩展性。
传统的SQL架构设计基因中是没有分布式的,而 NewSQL 生于云时代,天生就是分布式架构。
关系型数据库发展史(民生证券研究院)
关系型数据库主要类型比较
非关系型数据库主要类型比较(东兴证券研究所)
关系型数据库和非关系型数据库用户规模统计
(民生证券研究院)
2.按照需求功能分类
OLTP(On-Line Transaction Processing)、
OLAP(On-Line Analytical Processing)、HTAP(Hybrid Transactional/Analytical Processing)
其中,HTAP的价值在于更加简单通用,对于绝大部分中等规模的客户,数据量不会特别大,只需要一套系统即可,但对于超大型互联网企业,HTAP数据库的分析性能可能不如专用 OLAP 数据库或大数据平台。
HTAP应运而生按照具体架构可以分成三类:
HTAP不同架构解析
3.按照商业模式分类
开源、商业
开源模式的三大要素
4.按照技术架构分类
分布式、非分布式
5.按照部署方式分类
本地、云部署、云原生
6.按国家分类
国外数据库、国产数据库
7.其他分类
自治数据库
自治数据库是一种采用了机器学习技术,可自动执行数据库调优、保护、备份和更新以及其他传统上由 DBA 执行的常规管理任务的云数据库,与传统数据库不同,它无需人工干预就能执行所有这些以及更多其他任务。
例如:Oracle 、GaussDB等。
02
中国数据库发展历程
1.中国数据库起点
照片来自1977年在黄山召开第一届数据库学会会议,第二排左七是中国数据库的泰斗萨师煊老师,这一年被认为是中国数据库的起点。
2.中国数据库发展历程
数据库发展历程
03
国产数据库发展背景
1.信创产业的发展
三次历史事件倒逼信创产业加速推进,也促进了国产数据库的发展。
俄乌战争期间,甲骨文暂停俄罗斯地区Oracle业务。
信创相关政策梳理
信创相关政策梳理(国务院)
2.互联网行业的发展
阿里2009年提出去”IOE”,是国内第一个喊出“去IOE”的公司。
电商兴起,淘宝的用户数激增,产生的数据也呈指数级增长。甲骨文已经把单机性能做到了极致,稳定性和兼容性都非常强大,但系统极限也非常明显,可扩展性不高,而且维护成本很高。
出于自身业务需要和节省成本的考虑,最终阿里决定砍掉IT系统里的IOE架构。
阿里做关系型数据库的人叫阳振坤,北大数学系博士,师从王选,2010年加入阿里搞数据库OceanBase的研发。
2013年5月17日,阿里巴巴的最后一台IBM小型机在支付宝下线。当时团队还专门拉了个横幅,合影留念。2个月后,淘宝广告系统使用的甲骨文数据库下线,这也是整个淘宝最后一个甲骨文数据库。
2015年,支付宝的整个交易库都换成了 OceanBase。
04
信创产业乱象
近几年,信创工作开展的如火如荼,国内一批CPU、操作系统、数据库、中间件、办公软件厂商获得了发展机遇期,营业收入和利润均有较快增长。可以说,政策给予一直被国外寡头压制的本土厂商一个成长的阶梯,信创市场已经成为本土企业茁壮成长的摇篮。
不过,在看到成绩的同时,我们也注意到信创市场存在一些乱象,这些乱象加剧了内耗,与信创的初衷南辕北辙。
1.恶意杀价
一些厂商为了争端信创市场份额,往往恶意杀价,以大幅低于成本价的价格抢订单,这种现象在OS、数据库等软件竞标中比较多见。
这些厂商的目的是先抢下市场,挤压竞争对手的市场份额,然后让业主单位对于所采购的基础软硬件形成用户粘性,之后再通过升级或提供服务持续榨取利润。
就技术的持续进步来看,这种发展模式只会带来垄断,使少数厂商可以利用用户粘性垄断市场,天然遏制创新和技术进步。
2.浮夸宣传
信创是相对封闭的事业,一些硬件和软件在公开商业市场上不太常见,也没有大量发烧友可以对各家的硬件和软件进行公平公正的测试,这就造成信息不透明。在宣传上,往往是厂商王婆卖瓜,自卖自夸。
比如:某厂商 2019年宣布,他们的数据库又拿下世界第一,性能超越Oracle,再一次刷新世界纪录, 将霸屏 9 年的 Oracle 远远甩在了后面!
实际上:这家厂商用2019年的测试数据和2010年Oracle的数据对比,并没有在同一时间维度上做对比。
3.自研还是引用
大多数国产数据库厂商,都会强调自己的数据库产品是完全自研,
至于为什么在使用上非常类似MySQL、Oracle、PG等,是因为借鉴了国外数据库架构理念,
但是代码是100%完全自研,然而有点产品是否完全100%自研有待确认。
05
国产数据库分类
1.按照源代码类型分类
根据源代码来源不同,国产数据库可以分为四大类:
Oracle系,MySQL系,Informix系,PostgreSQL系。
2.按照数据库厂商分类
国内主流数据库厂商
国内主流互联网厂商
国内初创厂商
06
国产数据库热度排行
1.国外数据库热度排行
简单了解下Oracle发展历程。
Oracle发展历程
2.国产数据库热度排名
墨天轮中国数据库流行度排行
国产数据库热度前十名
07
国产数据库简介
下面针对达梦数据库、TiDB数据库、GaussDB数据库进行简单介绍。
1.达梦数据库
达梦数据库公司,2000年在武汉成立,数据库从1993年DM1发展到DM8。
有多种类型数据库产品:
数据库管理系统DM8、共享集群DMDSC、分析型集群DMMPP、读写分离集群DMRWC等。
达梦数据库体系结构
如下是Oracle数据库体系结构,可以看到达梦数据库和Oracle数据库体系结构相似度很高。
2.TiDB数据库
PingCAP是国内第一家开源的新型分布式关系型数据库公司,成立于2015年,其代表产品为分布式关系型数据库TiDB。截止2021年9月,PingCAP在中国、美国等地有9个分支机构,TiDB数据库已经应用于互联网、金融等多个行业1500多家企业的真实生产场景,客户遍布海外20多个国家和地区。
2021年7月,PingCAP完成最新一轮融资,由红杉领投,明势资本、新加坡政府投资公司(GIC)等跟投,投资后估值达30亿美元。
TiDB数据库历史更新表
PingCAP在各个行业的主要客户
体系结构
自动分片
3.GaussDB数据库
GaussDB是华为数据库产品品牌名,名称致敬数学家高斯(Gauss)。
GaussDB T(OLTP)
前身是GaussDB 100,GaussDB OLTP数据库是华为公司自主研发的分布式数据库,基于华为公司在2007年开始研发并在电信计费领域规模商用的自研内存数据库全面改造,支持x86和华为Kunpeng硬件架构,基于创新性数据库内核,提供高并发事务实时处理能力、两地三中心金融级高可用能力和分布式高扩展能力,用于支撑金融、政府、电信等行业核心关键系统。当前支持单机、主备、分布式等主流部署方式。
简单易用,Oracle语法兼容性98%。
全自研企业级OLTP数据库
数据库高可用同步机制
GaussDB A(OLAP)
前身是GaussDB 200,一款具备分析及混合负载能力的分布式数据库,从2011年开始,基于PostgreSQL 9.2.4的基础上自主研发,支持x86和华为Kunpeng硬件架构,支持行存储与列存储,提供PB(Petabyte)级数据分析能力、多模分析能力和实时处理能力。
GaussDB 300
OLTP和OLAP混合型数据库HATP,功能拆分给GaussDB T(100)和GaussDB A(200),取消GaussDB 300产品。
参考文献:
《【国盛证券】国内数据库核心标的、openGauss佼佼者,受益者行业信创快步向前》
《【民生证券】数据库行业深度报告:行业信创最具弹性的数据库》
《eygle – 国产数据库发展十策(二)》
《六大国产数据库生态演进 潘春秋 – 墨读数据库专题》
《PingCAP–开源新星,国产数据库的突破成长之路》
《信创乱象那些事!》
《【国盛证券】计算机行业周报:Gauss数据库跨越式发展,信创产业空间广阔》
作者:陈举超
往期回顾
1
Log4j远程代码执行漏洞分析
2
网络I/O简介
3
云计算时代-选择适合业务的云负载均衡
4
终端防泄密功能与原理解析
微信公众号|EBCloud
赶快扫码关注我们吧!
原创文章,作者:EBCloud,如若转载,请注明出处:https://www.sudun.com/ask/33591.html