什么是云数据库HBase2.0版本
云数据库HBase2.0是基于开源HBase2.0版本,结合阿里HBase技术和经验的演进过来,其完全兼容HBase2.0,拥有HBase2.0的所有新特性的同时,更享受阿里专家&HBase committer们在源码级别上的保驾护航。同时云数据库HBase版还根据云环境生态以及HBase存储系统的特点,并针对企业定制了一系列如oss、公网、本地盘、共享存储、冷热分离、备份恢复、安全等企业级功能。
应用场景
Cube分析
特点:高并发、海量储存
应用场景:实时报表
推荐画像
特点:万列稀疏矩阵
应用场景:用户特征
对象存储
特点:1B-100M海量存储
应用场景:图片、网页、新闻
消息/订单存储
特点:强同步、海量数据
应用场景:聊天消息、订单/保单存储
时序数据
特点:高并发、海量存储
应用场景:传感器、股票K线
Feeds流
特点:高并发请求访问
应用场景:朋友圈
时空数据
特点:高并发、海量储存
应用场景:轨迹、气象网格
NewSQL
应用场景:SQL、二级索引、动态例、索引查询、元数据库
读延时低
2.0版本针对读写全链路优化,rpc改进等,随机读写延时更低
高并发多读
2.0支持多region replicas服务,充分利用集群资源支持更高并发随机读
实时对象存储
适合10M以内小对象实时存取,​具有毫秒级低延迟
冷数据归档
一套接口,自动冷热分离,适合读多写少的场景,成本下降60%
规格优势
功能丰富
全面兼容HBase2.0各种新特性,并深度定制一系列企业级功能
高性能
深度内核优化,高效于社区最新2.0版本;延时远低于社区1.x版本
稳定性
读写全链路优化,配置调优,运行更稳定
运维自动化
内置最新的分布式技术,异常自动恢复一致性,自动化运维
云数据库HBase2.0产品架构
接入层
云数据库HBase2.0 陆续支持更多云产品链路直通访问,如:blink、CDP、LogService、emr、物联网套件等,让企业在云上完成数据库业务架构闭环。
网络层
网络层继续支持经典网/VPC专有网络选择,并支持弹性公网开关服务,方便了云上生产/云下开发调试用户。
内核层+存储层
云数据库HBase2.0 采用的最新版的2.0内核,结合阿里HBase多年的技术积累经验,针对企业上云定制了许多商业化功能。
中间件层
支持并优化SQL 二级索引的创建与使用,支持多语言服务,thrift/rest服务化;并将陆续开放更强大的检索功能,包括全文检索、图检索等,满足复杂业务检索需求。
对比优势
HBase1.0 云数据库HBase2.0 对比优势
冷热分离/分级存储 不支持 支持 1.0/2.0社区都没有针对这类场景应用定制功能,云数据库hbase2.0针对企业云上业务场景定制支持了这个功能
region replica 不支持 支持 云数据库hbase2.0与社区2.0一致,云上环境可用针对机器不同规格进行自适配这个功能过程运用到的性能调节参数
二级索引 不支持 支持 1.0、2.0社区并没有加入这类索引功能,依旧保留传统kv检索方式。但对于企业云上实际业务是远远不够的,云HBase针对这些场景需求,支持了这个功能
备份恢复 不支持 支持 云HBase针对企业云上环境,支持同城、异地灾备方案
netty rpc通信 不支持 支持 提高吞吐,高压力下延时降低
读写链路offheap 不支持 支持 云HBase2.0,相比1.0,降低毛刺率,QPS提高,减少内存碎片,降低GC压力等
in-Memory-Compaction 不支持 支持 内存利用率提高,减少小内存碎片,降低gc压力。在内存尽可能保存多的数据,可以减少flush hfile个数,一定程度上也就减少了后期compaction的频率,从而减少写放大
对象存储 不支持 支持 设计的MOB region单独管理,compaction策略定制,使得对象存储在HBase得到特殊对待处理,减少传统split/flush/compaction的影响,从而达到高效存储 中等对象的能力
异步client 不支持 支持 异步client提供客户端吞吐,一定程度上不会因为某个线程卡住而引起整个client卡住,减轻client端故障放大问题
异步DFS写入 不支持 支持 之前HBase 访问HDFS 都是同步的,经常发生因为HDFS 访问慢,而阻塞Handler的情况,而异步DFS Client则不需要等待。可大大提高系统性能以及可用性
混网访问 不支持 支持 云HBase支持混合网络访问, 利用云上环境弹性IP支持 用户可以在线下轻松debug远程 访问云HBase