
hba 分布模式更好需要几个节点,hba 的数据分区机制
- 科技
- 2023-09-25
- 8

hba 的作用 HBa 是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储...
hba 的作用
HBa 是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储 ”。
HBa 的定位是hadoop的数据库,电脑培训发现是一个典型的Nosql,所以HBa 是用来在大量数据中进行低延迟的随机查询的。
hba :适合大型数据存储,其作用可以类比于传统数据库的作用,主要关注的数据的存取。hive:适合大数据的管理,统计,处理,其作用类比于传统的数据仓库,主要关注的数据的处理。
什么是hba 中的散列和预分区
1、partition 顾名思义就是分区式,这种分区有点类似于 mapreduce 中的 partitioner,将区域用长整数作为分区号,每个 Region 管理着相应的区域数据,在 RowKey 生成时,将 id 取模后,然后拼上 id 整体作为 RowKey 。
2、首先我们应该考虑的是rowkey的设置,之一:散列或者反转,保证数据会随机分布到不同的region当中。
3、像这样预先创建hba 表分区的方式,称之为预分区。hash(主键) + 年月日时( 062315)这里只取hash(主键)的前6位,使得行键的长度正好是16,也就是8的整数倍,在64位计算机中,效果更好。
4、HBa 每张表在底层存储上是由至少一个Region组成,Region实际上就是HBa 表的分区。
hba 采用了什么样的数据结构?
1、综上所述,HBa 采用了L -Tree、Bloom Filter、MemStore和Compaction等多种数据结构和技术,以实现高并发、高吞吐量的分布式存储和查询功能。
2、hba 的核心数据结构为L 树。 树分为内存部分和磁盘部分。内存部分是一个维护有序数据 的数据结构。
3、HBa 使用了基于内存的索引结构,可以实现快速的数据访问。它支持高并发的读写操作,并且能够在毫秒级别响应查询请求。此外,HBa 还支持数据的批量处理和并行计算,可以在大规模数据集上进行高效的数据分析和处理。
4、与nosql数据库们一样,RowKey是用来检索记录的主键。
5、Hba 是一个面向列存储的分布式存储 ,它的优点在于可以实现高性能的并发读写操作,同时Hba 还会对数据进行透明的切分,这样就使得存储本身具有了水平伸缩性。通常,顺序读取数据要比随机访问更快。
本文链接:http://www.depponpd.com/ke/30506.html