发帖

【优惠升级】华秋PCB首单最高立减100元，SMT免费贴片！！！

[经验]

在arm64和x86服务器上运行的耗时来发现Docker在arm64架构下的性能问题

2022-7-12 15:48:13

4660 ARM Docker 汇编语言

1

背景介绍

经过多年的发展，Moby已经是一个十分成熟的项目，拥有健全的持续集成(CI)系统和数量庞大的测试集。

Moby项目的自动化测试分为三种：单元测试(unit test)、集成测试(integration test)和端到端测试(end-to-end test)。

目前，集成测试又可以分为两类：一类是所谓的legacy integration test，即“老”测试集。这一类测试的原理是构造并运行完整的docker命令，通过检查命令的输出结果是否符合预期来判定测试成功或者失败。另一类是所谓的“新”测试集。这一类测试的原理是通过调用Docker API来运行docker，效果和直接运行docker命令是一样的。基于API的新测试框架是社区的主推方向。目前所有新加入的测试用例都使用API方式，社区已经不再接受使用老框架的测试用例。

Moby社区有志于把所有老的测试用例转到新的测试框架下面，不过现在的进展并不快，因为老测试集里面用例数量庞大。目前，老测试集中的用例数量还远远大于新测试集。

问题

大量的集成测试用例为性能研究提供了方便。

笔者通过比较同一测试集在arm64和x86服务器上运行的耗时来发现Docker在arm64架构下的性能问题。

本文描述的性能测试是分别在一台arm64和一台x86服务器上进行的，两个服务器的CPU单核性能相近。都安装有ubuntu 18.04 server系统，并且都预先安装了docker-ce软件，因为Moby的测试是在container里面进行的。

首先clone源码到本地服务器

运行老的集成测试集：

make test-integration

这一命令会完成3件事：

Moby会首先自动从根目录下的Dockerfile构建一个容器，这一步耗时可能比较长，具体时间视网络带宽而定；
在容器中从源码构建docker程序并安装；
运行集成测试集。

测试的log会打印到文件bundles/test-integration/test.log。在test.log文件中你可以找到每个测试例子的名字、结果，还有最重要的耗时。通过处理test.log文件，可以把所有测试用例和运行时间整理成表格。通过比较相同测试用例在arm64和x86机器上的运行时间，可以发现潜在的性能问题。

下图即是数据表格的一部分。“Test case”竖列是测试用例所在文件和名字，“Qualcomm”列是在arm64机器上的运行时间（单位是秒），“Dell”是在x86机器上的运行时间。（这里直接以机器的生产商命名。）"Diff(s)"列是在arm64和x86机器上运行时间之差，最后一列“Diff(times)”是两个运行的比值，即"在arm64机器上的运行时间/在x86机器上的运行时间"。最后一列是主要的比较目标，为方便检查，笔者给这一列加了颜色（excel功能）：数值越大颜色越红，数值越小颜色越绿。两台用于测试的服务器性能比较接近，所以多数"Diff(times)"列的数据在1.0左右，呈黄颜色。而那些颜色偏红的数据表明，这个测试在arm64上运行的时间比在x86上运行的时间多出很大的比例，可能存在性能问题。

注意，单个测试用例的耗时长短可能存在偶然性，需要反复运行，看平均情况。

经过多次比较，发现Network类的集成测试普遍性能较差。在arm64机器上的运行时间往往是在x86上的2倍以上。看来在arm64架构下，docker的network子命令很可能存在性能问题。

分析

接下来，先要确定性能的瓶颈在哪。通过在network子命令的源代码中打印更多的时间戳，最终把问题定位在GO语言提供的API "exec.Command(, <args...>).CombinedOutput()"上。Docker network子命令通过"exec"来调用外部的“iptables”程序来为容器配置网络数据包处理规则。在调用这个接口的时候，arm64机器总是比x86机器花费更多的时间。在x86机器上，“exec.Command().CombinedOutput()”一般只需要2~~4毫秒就完成，但是在arm64机器上则需要7~~10毫秒。

单独测试iptables命令没有问题，arm64和x86机器上直接在命令行里运行iptables程序的用时相近。所以最终问题指向了GO语言的"exec"API。

在GO的"exec"包里面没有办法直接加打印信息来查看时间，因这它已经是比较底层的包了，而用于打印和获取时间的包所在层次比它略高，如果import的话就会出现"循环引用"的问题。

幸好Go的工具箱里有"tool trace"，

“tool trace”提供了可视化的工具，可以查看所有go-routine上的细节信息，包括时间戳。通过分析“exec.Command().CombinedOutput()”所在的go-routine的时间就可以发现多余的时间花在了哪里。

下图所示是一次“exec.Command().CombinedOutput()”外部命令调用的go-routine分析，可以看到GO语言在从当前进程fork新的进程（用于执行iptables）的时候，会有一个明显的时延，即图中的4ms。

而这个明显的等待时间在x86机器上是不存在的，见下图。

这就是在arm64机器上调用外部命令比在x86机器上慢的原因。

解决

那么造成这个4毫秒时延的原因又是什么呢？

查看GO语言syscall部分源码发现，在做fork系统调用的时候，x86架构存在一些优化，特别是使用"CLONE_VFORK"和 "CLONE_VM" 选项可以明确缩短fork的时间。这个优化在arm64架构下也是支持了，但是还没有加到GO的源码里。

要在GO语言的arm64版本上实现这一优化，既需要修改上图所示代码来针对arm64架构配置"CLONE_VFORK"和 "CLONE_VM" 选项，也需要在RawSyscall6函数的汇编代码中做相应的修改。

加入"CLONE_VFORK"和 "CLONE_VM"优化之后，前述的4ms左右延时消失，整个network类集成测试的时间缩短15%左右。

原作者：赵凤阳

只看该作者 淘帖0 举报

相关推荐

评论

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容图片侵权或者其他问题，请联系本站作侵删。侵权投诉

精选推荐

飞凌嵌入式-ELFBOARD 硬件知识分享-ELF 2电源电路讲解

361 浏览 0 评论
浅谈加密芯片的一种破解方法和对应加密方案改进设计

1378 浏览 0 评论
飞凌嵌入式ElfBoard ELF 1板卡-mfgtools烧录流程介绍之烧写所需镜像

1312 浏览 0 评论
飞凌嵌入式ElfBoard ELF 1板卡-mfgtools烧录流程之烧写方法

743 浏览 0 评论
飞凌嵌入式ElfBoard ELF 1板卡-内核编译之初次编译

1139 浏览 0 评论

快速回复 返回顶部 返回列表

关注微信公众号

电子发烧友网

电子发烧友论坛

社区合作: 刘勇; 联系电话：15994832713; 邮箱地址：liuyong@huaqiu.com

社区管理: elecfans短短; 微信：elecfans_666; 邮箱：users@huaqiu.com

【优惠升级】华秋PCB首单最高立减100元，SMT免费贴片！！！

返回 ARM威廉希尔官方网站论坛

回复

关闭

站长推荐 /7

快速回复 返回顶部 返回列表

- 威廉希尔官方网站社区: HarmonyOS威廉希尔官方网站社区

RISC-V MCU威廉希尔官方网站社区

FPGA开发者威廉希尔官方网站社区

- OpenHarmony开源社区: OpenHarmony开源社区

- 嵌入式论坛: ARM威廉希尔官方网站论坛

STM32/STM8威廉希尔官方网站论坛

嵌入式威廉希尔官方网站论坛

单片机/MCU论坛

RISC-V威廉希尔官方网站论坛

瑞芯微Rockchip开发者社区

FPGA|CPLD|ASIC论坛

DSP论坛

- 电路图及DIY: 电路设计论坛

DIY及创意

电子元器件论坛

专家问答

- 电源威廉希尔官方网站论坛: 电源威廉希尔官方网站论坛

无线充电威廉希尔官方网站

- 综合威廉希尔官方网站与应用: 机器人论坛

USB论坛

电机控制

模拟威廉希尔官方网站

音视频威廉希尔官方网站

综合威廉希尔官方网站交流

上位机软件（C/Python/Java等）

- 无线通信论坛: WIFI威廉希尔官方网站

蓝牙威廉希尔官方网站

天线|RF射频|微波|雷达威廉希尔官方网站

- EDA设计论坛: PCB设计论坛

DigiPCBA论坛

Protel|AD|DXP论坛

PADS威廉希尔官方网站论坛

Allegro论坛

multisim论坛

proteus论坛|仿真论坛

KiCad EDA 中文论坛

DFM|可制造性设计论坛

- 测试测量论坛: LabVIEW论坛

Matlab论坛

测试测量威廉希尔官方网站

传感威廉希尔官方网站

- 招聘/交友/外包/交易/杂谈: 项目外包

供需及二手交易

工程师杂谈|交友

招聘|求职|工程师职场

- 官方社区: 发烧友官方/活动

华秋商城

华秋电路

time

recommend

hot

post

—
—
—

版
块
导
航