为什么需要HBase技术?Hadoop可以很好地解决大规模数据的离线批量处理问题,但是,受限于Hadoop MapReduce编程框架的高延迟数据处理机制,使得Hadoop无法满足大规模数据实时处理应用的需求
HDFS面向批量访问模式,不是随机访问模式
传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题(主从结构、分库分表也不能很好解决)
传统关系数据库在数据结构变化时一般需要停机维护;空列浪费存储空间
因此,业界出现了一类面向半结构化数据存储和处理的高可扩展、低写入/查询延迟的系统,例如,键值数据库(Redis、Riak、BerkeleyD
HBase已经成功应用于互联网服务领域和传统行业的众多在线式数据分析处理系统中
分析HBase和BigTable的底层技术对应关系。
(含图)
对比分析HBase与传统关系数据库。
(含图)
画图解释HBase系统架构。
(含图)
注:Hive章节题(112-129)