数据库分区、分库和分表-电子发烧友网

今天先说说数据库的数据分区，分库以及分表的内容吧!

数据库分区、分库和分表

数据库分区、分库和分表是针对大型数据库系统的优化策略。它们的主要目的是提高数据库的性能和可靠性，以满足不断增长的数据存储需求。

数据库分区

将一个大型数据库分成多个逻辑部分，每个部分被称为一个分区。每个分区可以独立进行管理和维护，使得数据库系统的可扩展性和可用性得到了提高。

水平分区和垂直分区是数据库分区的两种主要方式,其主要存在如下的区别：

水平分区是将一个大表按照某个条件（如按照时间、地理位置等）分成多个小表，每个小表中包含相同的列，但是行数不同。在选择水平分区的分区键时，需要考虑数据的访问模式和数据的增长模式。例如按照时间分区可以提高历史数据的查询效率，按照地理位置分区可以提高地理数据的查询效率。水平分区的优点是可以提高数据的查询效率和并发处理能力，缺点是可能会导致数据的冗余和数据的一致性问题。
垂直分区是将一个大表按照列的不同将其分成多个小表，每个小表中包含相同的行，但是列数不同。选择垂直分区的分区键时，可将经常一起查询的列分到同一个分区中可以提高查询效率，将经常被更新的列分到单独的分区中也可以提高更新效率。垂直分区的优点是可以减少数据的冗余，提高数据的查询效率，也可能会导致数据的一致性问题。

水平分区栗子：

CREATE TABLE mytable (
  id SERIAL PRIMARY KEY,
  data TEXT,
  created_at TIMESTAMP WITH TIME ZONE
)
PARTITION BY RANGE (created_at);

CREATE TABLE mytable_2021_01 PARTITION OF mytable
  FOR VALUES FROM ('2021-01-01') TO ('2021-02-01');

CREATE TABLE mytable_2021_02 PARTITION OF mytable
  FOR VALUES FROM ('2021-02-01') TO ('2021-03-01');

CREATE TABLE mytable_2021_03 PARTITION OF mytable
  FOR VALUES FROM ('2021-03-01') TO ('2021-04-01');

-- 创建更多的分区表，每个表代表一个月份

垂直分区栗子：

CREATE TABLE users (
  id SERIAL PRIMARY KEY,
  name VARCHAR(50) NOT NULL,
  gender VARCHAR(10) NOT NULL,
  age INTEGER NOT NULL,
  address VARCHAR(200) NOT NULL,
  phone VARCHAR(20) NOT NULL
);

CREATE TABLE users_name_gender (
  id INTEGER PRIMARY KEY REFERENCES users(id),
  name VARCHAR(50) NOT NULL,
  gender VARCHAR(10) NOT NULL
);

CREATE VIEW users_info AS
SELECT users.id, users_name_gender.name, users_name_gender.gender, users.age, users.address, users.phone
FROM users
JOIN users_name_gender ON users.id = users_name_gender.id;

数据库分表

将一个大型表分成多个小型表，每个表被称为一个分表。每个分表可以独立进行管理和维护，使得数据库系统的可扩展性和可用性得到了提高。同时，分表还可以提高数据库系统的查询速度和并发处理能力，降低数据冲突和死锁的发生概率。

分表的复杂性就比分区大多了，需要业务逻辑的配合才可以。

数据库分表的方式有以下几种：

垂直分表：按照列的业务逻辑将表拆分成多个表，每个表包含一部分列。这种方式适用于表中某些列的访问频率较低，或者某些列的数据量较大，可以将这些列独立成一个表，从而提高查询性能和并发能力。
水平分表：按照行的业务逻辑将表拆分成多个表，每个表包含部分行数据。这种方式适用于表中数据量较大，或者访问频率较高的行可以分散到多个表中，从而减少单个表的数据量，提高查询性能和并发能力。
分区表：按照某个特定的规则将表分成多个逻辑上的部分，每个部分称为一个分区。分区可以按照时间、范围、哈希等方式进行划分。这种方式适用于表中数据量较大，或者访问频率较高的数据可以按照某个规则分散到多个分区中，从而提高查询性能和并发能力。
组合分表：将垂直分表、水平分表和分区表结合起来使用，可以根据具体的业务需求和数据特点进行灵活的组合，从而达到最优的性能和可扩展性。

举栗子：

假设有一个订单表，包含订单号、用户ID、下单时间、订单金额等字段，数据量较大，需要进行分表操作。

垂直分表：将订单表按照列的业务逻辑进行拆分，可以将订单金额独立成一个表，每个表包含订单号、用户ID、下单时间和订单金额。
水平分表：将订单表按照行的业务逻辑进行拆分，可以按照用户ID进行拆分，将同一个用户的订单分散到多个表中，每个表包含订单号、下单时间和订单金额。
分区表：将订单表按照时间进行分区，可以按照下单时间的年份、月份或日期进行分区，每个分区包含一段时间内的订单数据。
组合分表：可以将垂直分表、水平分表和分区表结合起来使用，例如按照用户ID进行水平分表，再按照下单时间进行分区，每个分区包含一个用户在一段时间内的订单数据

数据库分库

将一个大型数据库分成多个小型数据库，每个数据库被称为一个分库。每个分库可以独立进行管理和维护，使得数据库系统的可扩展性和可用性得到了提高。同时，分库还可以提高数据库系统的并发处理能力，降低数据冲突和死锁的发生概率。

垂直分库：

垂直分库是指将一张表按照列的业务逻辑划分成多个表，每个表只包含部分列。这种方式适用于某些列经常被查询，而其他列很少被查询的情况。垂直分库的优点是可以将数据分散到不同的物理节点上，从而提高查询效率和可用性。在 PostgreSQL 中，可以使用视图或表继承来实现垂直分库。

水平分库:

水平分库是指将一张表按照行的业务逻辑划分成多个表，每个表包含部分行。这种方式适用于数据量很大，单个节点无法存储全部数据的情况。水平分库的优点是可以将数据分散到多个物理节点上，从而提高查询效率和可用性。在实现水平分库时，可以使用分片键将数据分散到不同的节点上，同时需要考虑数据的一致性和事务处理等问题。

分库的常见实现方式

数据库代理：通过在客户端和数据库之间插入代理层，将请求分发到不同的数据库节点上。
分布式事务协议：通过协议实现分布式事务的一致性，保证数据的正确性。
分片键路由：通过分片键将数据分散到不同的节点上，同时需要考虑数据的一致性和事务处理等问题。
数据库复制：将数据复制到多个节点上，提高查询效率和可用性。

什么时候分库

单台DB的存储空间不够时。
随着查询量的增加单台数据库服务器已经没办法支撑业务扩展。

总的来说，数据库分区、分库和分表的目的都是为了提高数据库系统的性能和可靠性，使得它能够更好地应对不断增长的数据存储需求。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

存储

存储

+关注

关注
13

文章
4298

浏览量
85807
服务器

服务器

+关注

关注
12

文章
9129

浏览量
85343
数据库

数据库

+关注

关注
7

文章
3795

浏览量
64364
视图

视图

+关注

关注
0

文章
140

浏览量
6575

谈分布式数据库中间件之分库分表　　

　　　　在分布式数据库中，可以通过分库分表存储方式，轻松解决大数据量单表容量达到单机

发表于 08-02 20:19

分库分表是什么？怎么实现？

数据库分库分表、读写分离的原理实现，使用场景

发表于 10-25 17:24

基于聚类分析分库策略的社交网络数据库查询性能与数据迁移

了基于聚类分析的社交网络数据库分库策略。将社交网络主体的特征标量进行聚类，使得聚集程度高的主体尽量分割到一个或尽可能少的几个分库中去，从而提高事件的查询效率，并在此基础上兼顾负载均衡与大数据

发表于 12-05 14:13 •2次下载

数据库分库分表基础和实践

的分布式数据库中间件产品，实现了读写分离和数据分片功能，使用DDM来分库分表，应用0改动，对应用完全透明。　　

发表于 09-05 16:40 •254次阅读

数据库瓶颈及分库分表示例

就可以想象了吧（并发量、吞吐量、崩溃）。 1、IO瓶颈第一种：磁盘读IO瓶颈，热点数据太多，数据库缓存放不下，每次查询时会产生大量的IO，降低查询速度 -分库和垂直分

发表于 09-24 15:52 •1926次阅读

你们知道为什么要分库分表吗

表？这些问题你都搞清楚了吗？相信看完这篇文章会有答案。为什么要分库分表？首先回答一下为什么要分库分

发表于 08-16 10:37 •1526次阅读

优化MySQL数据库中朴实无华的分表和花里胡哨的分库

4、水平分库总结首先我们要知道分库、分表都是干啥的，本文主角还是我们的MySQL为第一视角。首先从字面意思来看：分库：由单个

发表于 08-26 16:33 •1252次阅读

什么是分库分表？为什么分库分表？什么情况下会用分库分表呢？

分库分表是由分库和分表这两个独立概念组成的，只不过通常分库

发表于 11-30 09:37 •7537次阅读

MySQL数据库性能优化的意义及其措施

数据库性能优化的常见手段有很多，比如添加索引、分库分表、优化连接池等

发表于 02-03 14:12 •1292次阅读

数据库优化最有效的方式是什么？

随着业务数据量和网站QPS日益增高，对数据库压力也越来越大，单机版数据库很快会到达存储和并发瓶颈，就需要做数据库性能方面的优化，分库

发表于 02-28 09:46 •692次阅读

数据库数据恢复-数据库文件被删除/分区被格式化的SQL SERVER数据恢复方案

数据库数据恢复-数据库文件被删除/分区被格式化的SQL SERVER数据恢复方案

发表于 09-21 14:34 •832次阅读

oracle数据库分区有哪些

Oracle数据库的分区是指将表或索引的数据划分为不同的部分，使得数据存储和查询变得更加高效。分区

发表于 12-05 16:18 •2093次阅读

分库分表后复杂查询的应对之道：基于DTS实时性ES宽表构建威廉希尔官方网站实践

1 问题域业务发展的初期，我们的数据库架构往往是单库单表，外加读写分离来快速的支撑业务，随着用户量和订单量的增加，数据库的计算和存储往往会成为我们系统的瓶颈，业界的实践多数采用分而治

发表于 06-25 18:30 •857次阅读

数据库数据恢复—SQL Server数据库所在分区空间不足报错的数据恢复案例

SQL Server数据库数据恢复环境：某品牌服务器存储中有两组raid5磁盘阵列。操作系统层面跑着SQL Server数据库，SQL Server数据库存放在D盘

发表于 07-10 13:54 •481次阅读

软件系统数据库的分库分表设计

软件系统数据库的分库分表设计系统读写分离、分库分表

发表于 08-22 11:39 •316次阅读

搜索历史

数据库分区、分库和分表