摘要: 纵观数据库发展的几十年,从网状数据库、层次数据库到RDBMS数据库,在最近几年的NewSQL的兴起,加上开源的运动,再加上云的特性,可以说是日新月异。云HBase数据库及时上线,一站式解决客户的大数据存储问题。

   

云数据库 HBase免费公测,查看详情

产品背后的思考


纵观数据库发展的几十年,从网状数据库、层次数据库到RDBMS数据库,在最近几年的NewSQL的兴起,加上开源的运动,上云的特性,可以说是日新月异。在20世纪80年代后,大部分的业务确定了使用RDBMS数据为存储基础。随着互联网的发展,数据量的增大,慢慢RDBMS数据库撑不住,就出现了读写分离策略。随着压力增加,Master撑不住,这时就要分库了,需要借助中间层。随着数据量的进一步增加,一个表的记录越来越大,查询就变得很慢,于是又得搞分表…


在不同的场景下,就出现各自优秀的分布式数据库,比如在文档型存储下的MongoDB,KV类型的Redis,到本文介绍的列族类型的HBase。


为什么要上云,需要了解到HBase本身比较复杂,这涉及到分布式、数据存储、响应延迟,索引等一些分布式、数据库的知识,对于运维好这个复杂系统还是有一定的难度;要有很好的使用姿势,虽然API比较简单,但是各种组合情况下,畅玩好HBase还是需要一定的功力;上云是趋势,自己去基于ECS建设又不太了解云环境下,怎么正确部署HBase,怎么跟OSS等云上组件配合。


为此,我们提供云HBase加上专家服务解决以上3个问题


HBase在阿里集团使用了6年之久,已经在HBase的性能、运维等积累了大量的经验,我们希望把这些回馈给客户,例如:单条低字节高频写入情况就比社区版本高出30%+的性能。


已提供的价值点有:
高可靠:至少三个副本,数据可靠性9个9
高可用:Master节点强制HA机制,出现问题后直接切换
易运维:增加节点、修改配置、重启、健康大盘、监控报警
高性能:比开源性能大幅度提升30%+
低成本:后续本地盘、云盘、OSS分级别存储

技术架构


从技术架构层面看,大致如下:


基础资源层: 底层使用了ECS及本地磁盘的架构,保证在低成本的同时又具备高性能
基础软件层: 使用了Ali-JDK及Ali-Linux,背后是源码级团队维护
HBase内核层: 与阿里集团一致的版本,阿里内部所有的性能优化、功能增强在公共云的客户都可以享受到。这些包括但不限于:提升读写性能、增强稳定性、降低磁盘等
运维平台方面: 逐步完善,后续会包括 监控报警、配置管理、健康诊断等,易于运维的功能


目前支持两种访问网络类型,第一种是经典网络;第二种是VPC网络。区别就是VPC再加了一层网络隔离。

使用场景


HBase作为默认的大数据时代的存储,基本解决以下三大类的场景:


平台类,存放是平台的产品,就是其它软件的存储,比如目前很就行的Kylin,阿里内部的日志同步工具TT,图组件Titan等。此类存放的往往平台的数据,有时候往往是无业务含义的。作为平台的底层存储使用。
用户行为类,此类主要是面向各个业务系统。这里的用户不仅仅指的人,也包括物,比如物联网。在阿里主要还是人产生的数据,比如:淘宝收藏夹、交易数据、旺旺聊天记录等等。这里使用比较直接,就直接存放HBase,再读取。难度就是需要支持千万级别的并发写访问及读取,需要解决服务质量的问题。
报表类的需求,比如报表、大屏等,如阿里巴巴的天猫双十一大屏。


查看云数据库Hbase

相关产品推荐

  • 云数据库 HBase
    云数据库 HBase 是基于 Hadoop 的一个分布式数据库,支持海量的PB级的大数据存储,适用于高吞吐的随机读写的场景。了解更多>
  • E-MapReduce
    构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务了解更多>
  • 云数据库 MongoDB
    云数据库 MongoDB 版 支持三节点副本集版和集群版两套高可用架构。服务容灾切换,故障迁移完全透明化,并提供专业的数据库在线扩容、备份回滚、性能优化等解决方案。了解更多>