现代IM系统中消息推送和存储架构的实现

即时通讯（Instant Messaging，简称IM）是一个实时通信系统，允许两人或多人使用网络实时的传递文字消息、文件、语音与视频交流。实现方式有两种。第一种基于Server转发的，Client双方通信会经过Server转发来完成消息传递。例如QQ、微信。

第二种是基于P2P（点对点）的。P2P的实现依赖于客户端之间的互联，但由于NAT与防火墙的存在，客户端无法直接互联，需要coturn服务器用来穿越NAT网络。

架构设计

本章主要会介绍基于TableStore的现代IM消息系统的架构设计，在详细介绍架构设计之前，会先介绍一种Timeline逻辑模型，来抽象和简化对IM消息同步和存储模型的理解。理解了Timeline模型后，会介绍如何基于此模型对消息的同步以及存储进行建模。基于Timeline模型，在实现消息同步和存储时还会有各方面的威廉希尔官方网站权衡，例如如何对消息同步常见的读扩散和写扩散两种模型进行对比和选择，以及针对Timeline模型的特征如何来选择底层数据库。

传统架构 vs 现代架构

现代IM系统中消息推送和存储架构的实现

上图是消息系统传统架构与现代架构的简单对比。

传统架构下，消息是先同步后存储。对于在线的用户，消息会直接实时同步到在线的接收方，消息同步成功后，并不会进行持久化。而对于离线的用户或者消息无法实时同步成功时，消息会持久化到离线库，当接收方重新连接后，会从离线库拉取所有未读消息。当离线库中的消息成功同步到接收方后，消息会从离线库中删除。传统的消息系统，服务端的主要工作是维护发送方和接收方的连接状态，并提供在线消息同步和离线消息缓存的能力，保证消息一定能够从发送方传递到接收方。服务端不会对消息进行持久化，所以也无法支持消息漫游。

现代架构下，消息是先存储后同步。先存储后同步的好处是，如果接收方确认接收到了消息，那这条消息一定是已经在云端保存了。并且消息会有两个库来保存，一个是消息存储库，用于全量保存所有会话的消息，主要用于支持消息漫游。另一个是消息同步库，主要用于接收方的多端同步。消息从发送方发出后，经过服务端转发，服务端会先将消息保存到消息存储库，后保存到消息同步库。完成消息的持久化保存后，对于在线的接收方，会直接选择在线推送。但在线推送并不是一个必须路径，只是一个更优的消息传递路径。对于在线推送失败或者离线的接收方，会有另外一个统一的消息同步方式。接收方会主动的向服务端拉取所有未同步消息，但接收方何时来同步以及会在哪些端来同步消息对服务端来说是未知的，所以要求服务端必须保存所有需要同步到接收方的消息，这是消息同步库的主要作用。对于新的同步设备，会有消息漫游的需求，这是消息存储库的主要作用，在消息存储库中，可以拉取任意会话的全量历史消息。

以上是传统架构和现代架构的一个简单的对比，现代架构上整个消息的同步和存储流程，并没有变复杂太多，但是其能实现多端同步以及消息漫游。现代架构中最核心的就是两个消息库『消息同步库』和『消息存储库』，是消息同步和存储最核心的基础。而本篇文章接下来的部分，都是围绕这两个库的设计和实现来展开。

Timeline模型

在分析『消息同步库』和『消息存储库』的设计和实现之前，在本章会先介绍一个逻辑模型-Timeline。Timeline模型会帮助我们简化对消息同步和存储模型的理解，而消息库的设计和实现也是围绕Timeline的特性和需求来展开。

现代IM系统中消息推送和存储架构的实现

如图是Timeline模型的一个抽象表述，Timeline可以简单理解为是一个消息队列，但这个消息队列有如下特性：

每个消息拥有一个顺序ID（SeqId），在队列后面的消息的SeqId一定比前面的消息的SeqId大，也就是保证SeqId一定是增长的，但是不要求严格递增。

新的消息永远在尾部添加，保证新的消息的SeqId永远比已经存在队列中的消息都大。

可根据SeqId随机定位到具体的某条消息进行读取，也可以任意读取某个给定范围内的所有消息。

有了这些特性后，消息的同步可以拿Timeline来很简单的实现。图中的例子中，消息发送方是A，消息接收方是B，同时B存在多个接收端，分别是B1、B2和B3。A向B发送消息，消息需要同步到B的多个端，待同步的消息通过一个Timeline来进行交换。A向B发送的所有消息，都会保存在这个Timeline中，B的每个接收端都是独立的从这个Timeline中拉取消息。每个接收端同步完毕后，都会在本地记录下最新同步到的消息的SeqId，即最新的一个位点，作为下次消息同步的起始位点。服务端不会保存各个端的同步状态，各个端均可以在任意时间从任意点开始拉取消息。

消息漫游也是基于Timeline，和消息同步唯一的区别是，消息漫游要求服务端能够对Timeline内的所有数据进行持久化。

基于Timeline，从逻辑模型上能够很简单的理解在服务端如何去实现消息同步和存储，并支持多端同步和消息漫游这些高级功能。落地到实现的难点主要在如何将逻辑模型映射到物理模型，Timeline的实现对数据库会有哪些要求？我们应该选择何种数据库去实现？这些是接下来会讨论到的问题。

消息存储模型

现代IM系统中消息推送和存储架构的实现

如图是基于Timeline的消息存储模型，消息存储要求每个会话都对应一个独立的Timeline。如图例子所示，A与B/C/D/E/F均发生了会话，每个会话对应一个独立的Timeline，每个Timeline内存有这个会话中的所有消息，服务端会对每个Timeline进行持久化。服务端能够对所有会话Timeline中的全量消息进行持久化，也就拥有了消息漫游的能力。

消息同步模型

消息同步模型会比消息存储模型稍复杂一些，消息的同步一般有读扩散和写扩散两种不同的方式，分别对应不同的Timeline物理模型。

现代IM系统中消息推送和存储架构的实现

如图是读扩散和写扩散两种不同同步模式下对应的不同的Timeline模型，按图中的示例，A作为消息接收者，其与B/C/D/E/F发生了会话，每个会话中的新的消息都需要同步到A的某个端，看下读扩散和写扩散两种模式下消息如何做同步。

读扩散：消息存储模型中，每个会话的Timeline中保存了这个会话的全量消息。读扩散的消息同步模式下，每个会话中产生的新的消息，只需要写一次到其用于存储的Timeline中，接收端从这个Timeline中拉取新的消息。优点是消息只需要写一次，相比写扩散的模式，能够大大降低消息写入次数，特别是在群消息这种场景下。但其缺点也比较明显，接收端去同步消息的逻辑会相对复杂和低效。接收端需要对每个会话都拉取一次才能获取全部消息，读被大大的放大，并且会产生很多无效的读，因为并不是每个会话都会有新消息产生。

写扩散：写扩散的消息同步模式，需要有一个额外的Timeline来专门用于消息同步，通常是每个接收端都会拥有一个独立的同步Timeline，用于存放需要向这个接收端同步的所有消息。每个会话中的消息，会产生多次写，除了写入用于消息存储的会话Timeline，还需要写入需要同步到的接收端的同步Timeline。在个人与个人的会话中，消息会被额外写两次，除了写入这个会话的存储Timeline，还需要写入参与这个会话的两个接收者的同步Timeline。而在群这个场景下，写入会被更加的放大，如果这个群拥有N个参与者，那每条消息都需要额外的写N次。写扩散同步模式的优点是，在接收端消息同步逻辑会非常简单，只需要从其同步Timeline中读取一次即可，大大降低了消息同步所需的读的压力。其缺点就是消息写入会被放大，特别是针对群这种场景。

在IM这种应用场景下，通常会选择写扩散这种消息同步模式。IM场景下，一条消息只会产生一次，但是会被读取多次，是典型的读多写少的场景，消息的读写比例大概是10:1。若使用读扩散同步模式，整个系统的读写比例会被放大到100:1。一个优化的好的系统，必须从设计上去平衡这种读写压力，避免读或写任意一维触碰到天花板。所以IM系统这类场景下，通常会应用写扩散这种同步模式，来平衡读和写，将100:1的读写比例平衡到30:30。当然写扩散这种同步模式，还需要处理一些极端场景，例如万人大群。针对这种极端写扩散的场景，会退化到使用读扩散。一个简单的IM系统，通常会在产品层面限制这种大群的存在，而对于一个高级的IM系统，会采用读写扩散混合的同步模式，来满足这类产品的需求。

阅读全文

12 3 下一页全文

本文导航

第 1 页：现代IM系统中消息推送和存储架构的实现
第 2 页：消息库设计
第 3 页：架构实现

通讯(34151) 通讯(34151)

全台网存储架构的选择分析

【作者】：王敏建;【来源】：《电视威廉希尔官方网站》2010年02期【摘要】：介绍了FCSAN和IPSAN两种存储架构在全台网环境下构建存储局域网所能发挥的不同优势和特性,结合未来威廉希尔官方网站的发展方向,提出选择存储

2010-04-23 11:22:24

聊聊消息推送架构设计

类似的，文件存储、数据存储、推送服务、身份验证服务等功能，都会沉淀为原子服务，业务开发人员，在原子服务基础上，进行编排、配置、组合，可以快速构建业务应用。

2023-09-04 15:52:34

241

存储网络在数据中心现代化中的作用

电子发烧友网站提供《存储网络在数据中心现代化中的作用.pdf》资料免费下载

2023-09-01 14:43:32

存储体系结构的现代化

电子发烧友网站提供《存储体系结构的现代化.pdf》资料免费下载

2023-08-30 16:58:28

无惧百万级并发，GaussDB(for Cassandra) 让华为 Push 推送服务更快触达

利器。华为云 GaussDB(for Cassandra) 是一款基于计算存储分离架构的分布式数据库，致力于提供稳定可靠、超高并发，兼容 Cassandra 生态、弹性伸缩、一键部署、快速恢复、监控告警的分布式数据库服务，在 Push 业务的高效架构建设中，起到了关键

2023-06-29 16:48:31

148

【节能学院】基于物联网云平台的分布式光伏监控系统的设计与实现

，开发基于云平台的光伏发电远程监控系统。在平台部署过程中，通过合理设计SQLServer数据库，结合本地数据库和云端数据库，实现数据的云端存储、计算和调用。最终通

2023-05-11 10:29:23

176

现代商用FPGA架构的不同关键组件的演变

架构的设计涉及许多不同的设计选择，从高级架构参数到晶体管级实现细节，目标是制造高度可编程的器件，同时最小化可重新配置的面积和性能成本。随着应用需求和工艺威廉希尔官方网站能力的不断发展，FPGA架构也必须适应。在这篇文章中，我们回顾了现代商用FPGA架构的不同关键组件的演变，并阐明了它们的主要设计原则和实现挑战。

2023-01-31 15:32:01

288

LCR HIOKI IM3536

LCR HIOKI IM3536HIOKI这次发售了LCR测试仪IM3536。IM3536具备4Hz~8MHz宽频率范围，实现高速、高精度测量。满足电子元件的研发和生产等多种领域的要求。LCR测试仪

2022-12-05 10:47:09

一种AUTOSAR软件架构中RTE的实现方法

介绍了一种AUTOSAR软件架构中RTE的实现方法。

2022-07-13 16:02:52

分布式云存储基础架构借助x86架构取得进步

　　从昂贵的单片存储阵列到商品服务器，传统存储系统会给云存储基础架构增加显着的成本、管理复杂性和功耗，同时带来大量以备份和恢复为中心的挑战。

2022-06-14 10:27:59

911

zy-im基于Netty的IM服务

./oschina_soft/gitee-zy-im.zip

2022-05-26 14:35:08

智能硬件APP如何更好更快的实现消息推送

在很多种场景下，应用消息推送提醒是很实用的功能。运营人员可以通过APP推送热门内容，系统可以根据用户订阅推送相关资讯，就连我们平时用的微信消息也都属于APP消息推送行列。

2022-05-21 11:39:34

1456

浅谈数据系统架构核心组件及存储组件选型

Lambda架构的核心思想是将不可变的数据以追加的方式并行写到批和流处理系统内，随后将相同的计算逻辑分别在流和批系统中实现，并且在查询阶段合并流和批的计算视图并展示给用户。

2022-05-13 15:53:37

2443

OrioleDB：构建现代云原生存储引擎

它以扩展的形式组成，建立在新的表访问方法框架以及其他表中PG扩展接口之上。通过扩展和增强当前的表访问方法，OrioleDB为未来更强大的存储模型打开了大门，这些模型对云和现代硬件架构进行了优化。目前是标准的PG许可。

2022-04-13 15:45:13

2655

《现代操作系统》03章存储管理（二）

《现代操作系统》03章存储管理（二）0 前文3 虚拟内存3.1 简介3.2 分页3.2.1 page & page frame3.2.2 MMU的工作机制3.3 页表3.4 加速分页过程

2021-12-29 19:46:14

go语言实现的简单im即时通信系统解析

【导读】本文介绍了一个 go 语言实现的简单 im 即时通信系统。简介纯go实现的im即时通讯系统，各层可单独部署，之间通过rpc通讯，支持集群，github地址 https

2021-10-26 09:22:17

3491

go语言实现的简单im即时通信系统

本文介绍了一个 go 语言实现的简单 im 即时通信系统。简介纯go实现的im即时通讯系统，各层可单独部署，之间通过rpc通讯，支持集群，github地址 https

2021-10-20 16:02:22

2809

西部数据：创新存储架构领航开放计算

机会被存储下来，现代企业级存储架构正面临着许多挑战。首先，存储性能亟需大幅提升，以实现更低的延迟、更高的IO性能和更大的带宽；其次，对于企业来说，成本永远是最重要的，也就是要求存储系统的总体拥有成本（TCO）要尽可能的低；最后在

2021-08-13 11:28:24

1143

鸿蒙推送时间华为鸿蒙推送时间

自从华为6月正式发布推送鸿蒙系统2.0，许多用户都对鸿蒙系统感兴趣也想下载，然而不怎么清楚鸿蒙系统详细的推送时间，这篇文将分享鸿蒙系统推送时间的详细信息。

2021-07-08 11:23:48

7191

鸿蒙系统什么时候正式推送

鸿蒙系统即将正式开始进行大规模推送，鸿蒙操作系统开始面向包括手机在内的“1+8+N”全场景规模化推送。

2021-06-02 21:10:20

9385

存储器和总线架构分析：stm32F429-系统架构

1. 存储器和总线架构 1.1 系统架构 I总线：此总线用于将 Cortex™-M4F 内核的指令总线连接到总线矩阵。内核通过此总线获取指令。此总线访问的对象是包含代码的存储器（内部 Flash

2021-02-15 06:16:00

3158

云存储的架构及系统组成

不知不觉中，我们每天都在接触存储，由此可见存储的重要性。随着时代的改变，存储方式也在随之变化。目前，云存储是十分火热的存储方式之一。为增进大家对云存储的了解，本文将对云存储架构以及云存储系统的组成加以介绍。

2021-02-02 10:39:03

5049

云存储架构和云存储系统的组成详细说明

不知不觉中，我们每天都在接触存储，由此可见存储的重要性。随着时代的改变，存储方式也在随之变化。目前，云存储是十分火热的存储方式之一。为增进大家对云存储的了解，本文将对云存储架构以及云存储系统的组成加以介绍。如果你对存储具有兴趣，不妨继续往下阅读哦。

2021-01-03 13:53:00

1387

云存储的架构/系统组成

2020-12-30 15:58:18

2278

存储虚拟化的存储资源架构解析

存储虚拟化是将存储设备抽象为数据存储，虚拟机在数据存储中作为一组文件存储在自己的目录中。数据存储是逻辑容器，类似于文件系统，它将各个存储设备的特性隐藏起来，并提供一个统一的模型来存储虚拟机文件。存储

2020-07-31 14:42:37

2561

存储架构分类的快速区分方法

在linux运维（网络安全运维基础入门）中，存储提供了数据的基本保障，在整个架构中是非常重要的环节。学好存储的前提是先认识存储和存储架构的分类。

2020-05-05 22:28:00

1921

云存储实现前提_云存储架构

本文首先介绍了云存储实现前提，其次阐述了云存储的优势，最后介绍了云存储架构。

2020-04-30 15:09:56

982

微软Windows 10新现代流畅设计图标推送了

早在去年12月，微软就宣布Windows 10设备的新现代流畅设计图标。新图标包括用于邮件和日历，计算器，照片等的图标设计。上周，微软向Windows Insiders用户推送系统级别的流畅设计新图标。

2020-03-01 15:19:11

1458

存储优先架构的未来是什么样的

存储架构包括数据层、计算层和控制层组成，它们以存储调度为核心逻辑形成一套计算架构，数据在存储之间的迁移过程中同时完成计算，计算就那么自然而然随着数据转移同时进行了。

2019-12-05 10:26:41

771

单片机MQTT如何实现推送的简单使用

本文档的主要内容详细介绍的是单片机MQTT如何实现推送的简单使用。

2019-07-19 17:37:00

分布式存储的系统架构

对一个大规模集群的存储系统而言，服务器宕机、交换机失效是常态，架构师必须为这些故障发生时，保证系统依然可用而进行系统设计。

2019-07-12 16:31:53

1813

云计算基础架构是如何实现的

传统网络基础架构向云的迁移是大势所趋，云计算基础架构要实现的是按需分配、自动化、以使用情况付费的模式，这些目标的实现依赖于数据中心、服务器、存储、虚拟化和操作系统等组成部分云化过程中的智能调度和分配。

2019-06-20 16:18:51

1026

如何快速搭建一套区块链社交IM系统开发IM社交系统费用

的区块链威廉希尔官方网站研发公司深圳源中瑞科技有限公司在2018年4月份区块链社交直播聊天IM系统已经成熟测试完毕后也没多大问题，至今为止源中瑞研发的社交IM系统已经是5.0版本，也就是升级了5个版本，更趋向于国际化

2019-01-15 13:39:49

468

如何快速搭建一套区块链社交IM系统开发IM社交系统费用

2019-01-15 13:35:53

511

区块链IM即时通讯直播平台系统开发

区块链IM直播系统开发、多币种钱包开发服务商欢迎咨询周顾问：ruiec997（微）。通讯其实在我们的生活中是一种在不断完善以及创新的沟通方式，传统的通讯通常是网络、电话、写信等等。经过这些眼花缭乱

2018-10-30 17:12:52

729

区块链IM即时通讯系统区块链社交软件实现原理

区块链IM即时通讯系统区块链社交软件实现原理即时通讯（Instant Messenger，简称IM）软件多是基于TCP/IP和UDP进行通讯的，TCP/IP和UDP都是建立在更低层的IP协议上的两种

2018-10-09 14:20:29

351

IBM存储前景展望

BM存储未来如何发展？借着IBM AI架构和高端全闪存 FlashSystem 9100的发布会，IBM让我们看到一个可以帮助客户在未来的3-5迎接挑战的现代基础架构和现代存储架构。我们也了解到IBM存储的最新动态，能清晰的看到，存储在IBM业务中的分量会越来越重。

2018-09-23 16:32:00

3979

Modern架构之开放互联打造现代化主机

的基础资源。这要求企业构建一个现代化的数据存储平台，以保证数据在多云环境中被实时调取、共享及无缝迁移；同时塑造一个面向大数据高效存储、处理的架构，打造绿色的IT系统沿革路径。

2018-06-09 10:45:57

3483

arm架构的芯片memory及智能机存储部件简述

简单对ARM架构和基于ARM架构处理器系统中可能包含多种类型的存储部件，如Flash、SRAM、SDRAM、ROM以及用于提高系统性能的Cache等等。

2018-06-09 00:32:00

5511

java实现IM即时通讯聊天功能代码

从实际工程应用角度出发，以计算机网络原理为指导，结合当前网络中的一些常用威廉希尔官方网站，编程实现基于C/S架构的网络聊天工具是切实可行的。本文为大家介绍java Smack整合Openfire服务器实现IM即时通讯聊天功能代码。

2018-01-24 16:10:28

26497

容器实现持久存储的3个基础类型：块存储、对象存储和文件系统

决定如何为容器实现持久存储的第一步是确定您将使用的存储系统的基础类型。在这方面, 通常有三种主要选项：文件系统存储、块存储和对象存储。

2018-01-24 10:58:23

6083

结合云存储的博客系统架构

为解决新一代博客系统海量信息的存储问题，结合云存储威廉希尔官方网站，提出了一种新的博客系统架构BlogCloud。该架构以分布式存储威廉希尔官方网站为核心，避免了集中式存储的性能瓶颈问题，可扩展性高；采用半分布式P2P网络

2018-01-04 16:51:30

基于位置信息的流式引动应用推送系统

目前与位置相关的移动应用越来越多，传统应用分发模式中，用户需要手动对应用进行搜索、下载、安装以及卸载，不利于提升用户使用应用服务的体验。设计并实现了基于位置信息的流式移动应用推送系统，该系统中服

2017-12-05 16:55:37

基于存储过程的SQL自动评判系统实现

针对数据库能力测评，提出了一种基于存储过程的soL自动评判系统实现方案。该方案以SQL Server中的存储过程为核心，使用基本的soL语句与黑盒测试，实现了数据查询、增加、更新以及删除的自动评判

2017-11-02 16:47:41

浅谈存储架构之组合式存储

组合式存储是第三种存储架构。它充分利用了纵向扩展架构和横向扩展存储的优点。就像纵向扩展架构一样，组合式存储系统可以从单个节点开始。可以在IO性能和容量方面充分利用该节点。但是，与纵向扩展

2017-11-02 11:01:36

1166

3319

Nand+Flash存储管理在DSP系统中的实现

Nand+Flash存储管理在DSP系统中的实现　　Nand Flash作为一种安全、快速的存储体，因其具有体积小、容量大、成本低、掉电数据不丢失等一系列优点，已

2010-04-12 13:42:17

1091

已全部加载完成

搜索历史

现代IM系统中消息推送和存储架构的实现

架构设计

传统架构 vs 现代架构

Timeline模型

消息存储模型

消息同步模型

本文导航

评论