0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Elasticsearch写入优化记录,从3000到8000/s

Android编程精选 来源:blog.csdn.net/wmj2004/article/ 作者:blog.csdn.net/wmj2004 2022-04-11 10:55 次阅读

背景

  • 基于elasticsearch-5.6.0

  • 机器配置:3个阿里云ecs节点,16G,4核,机械硬盘

优化前,写入速度平均3000条/s,一遇到压测,写入速度骤降,甚至es直接频率gc、oom等;优化后,写入速度平均8000条/s,遇到压测,能在压测结束后30分钟内消化完数据,各项指标回归正常。

生产配置

这里我先把自己优化的结果贴出来,后面有参数的详解:

elasticsearch.yml中增加如下设置

indices.memory.index_buffer_size:20%
indices.memory.min_index_buffer_size:96mb

#Searchpool
thread_pool.search.size:5
thread_pool.search.queue_size:100
#这个参数慎用!强制修改cpu核数,以突破写线程数限制
#processors:16
#Bulkpool
#thread_pool.bulk.size:16
thread_pool.bulk.queue_size:300
#Indexpool
#thread_pool.index.size:16
thread_pool.index.queue_size:300

indices.fielddata.cache.size:40%

discovery.zen.fd.ping_timeout:120s
discovery.zen.fd.ping_retries:6
discovery.zen.fd.ping_interval:30s

索引优化配置:

PUT/_template/elk
{
"order":6,
"template":"logstash-*",#这里配置模板匹配的Index名称
"settings":{
"number_of_replicas":0,#副本数为0,需要查询性能高可以设置为1
"number_of_shards":6,#分片数为6,副本为1时可以设置成5
"refresh_interval":"30s",
"index.translog.durability":"async",
"index.translog.sync_interval":"30s"

}
}

优化参数详解

精细设置全文域: string类型字段默认会分词,不仅会额外占用资源,而且会影响创建索引的速度。所以,把不需要分词的字段设置为not_analyzed

禁用_all字段: 对于日志和apm数据,目前没有场景会使用到

副本数量设置为0: 因为我们目前日志数据和apm数据在es只保留最近7天的量,全量日志保存在hadoop,可以根据需要通过spark读回到es – 况且副本数量是可以随时修改的,区别分片数量

使用es自动生成id: es对于自动生成的id有优化,避免了版本查找。因为其生成的id是唯一的

设置index.refresh_interval: 索引刷新间隔,默认为1s。因为不需要如此高的实时性,我们修改为30s – 扩展学习:刷新索引到底要做什么事情

设置段合并的线程数量:

curl-XPUT'your-es-host:9200/nginx_log-2018-03-20/_settings'-d'{
"index.merge.scheduler.max_thread_count":1
}'

段合并的计算量庞大,而且还要吃掉大量磁盘I/O。合并在后台定期操作,因为他们可能要很长时间才能完成,尤其是比较大的段

机械磁盘在并发I/O支持方面比较差,所以我们需要降低每个索引并发访问磁盘的线程数。这个设置允许max_thread_count + 2个线程同时进行磁盘操作,也就是设置为1允许三个线程

扩展学习:什么是段(segment)?如何合并段?为什么要合并段?(what、how、why)

1.设置异步刷盘事务日志文件:

"index.translog.durability":"async",
"index.translog.sync_interval":"30s"

对于日志场景,能够接受部分数据丢失。同时有全量可靠日志存储在hadoop,丢失了也可以从hadoop恢复回来

2.elasticsearch.yml中增加如下设置:

indices.memory.index_buffer_size:20%
indices.memory.min_index_buffer_size:96mb

已经索引好的文档会先存放在内存缓存中,等待被写到到段(segment)中。缓存满的时候会触发段刷盘(吃i/o和cpu的操作)。默认最小缓存大小为48m,不太够,最大为堆内存的10%。对于大量写入的场景也显得有点小。

扩展学习:数据写入流程是怎么样的(具体到如何构建索引)?

1.设置index、merge、bulk、search的线程数和队列数。例如以下elasticsearch.yml设置:

#Searchpool
thread_pool.search.size:5
thread_pool.search.queue_size:100
#这个参数慎用!强制修改cpu核数,以突破写线程数限制
#processors:16
#Bulkpool
thread_pool.bulk.size:16
thread_pool.bulk.queue_size:300
#Indexpool
thread_pool.index.size:16
thread_pool.index.queue_size:300

2.设置filedata cache大小,例如以下elasticsearch.yml配置:

indices.fielddata.cache.size:15%

filedata cache的使用场景是一些聚合操作(包括排序),构建filedata cache是个相对昂贵的操作。所以尽量能让他保留在内存中

然后日志场景聚合操作比较少,绝大多数也集中在半夜,所以限制了这个值的大小,默认是不受限制的,很可能占用过多的堆内存

扩展学习:什么是filedata?构建流程是怎样的?为什么要用filedata?(what、how、why)

1.设置节点之间的故障检测配置,例如以下elasticsearch.yml配置:

discovery.zen.fd.ping_timeout:120s
discovery.zen.fd.ping_retries:6
discovery.zen.fd.ping_interval:30s

大数量写入的场景,会占用大量的网络带宽,很可能使节点之间的心跳超时。并且默认的心跳间隔也相对过于频繁(1s检测一次)

此项配置将大大缓解节点间的超时问题

后记

这里仅仅是记录对我们实际写入有提升的一些配置项,没有针对个别配置项做深入研究。

扩展学习后续填坑。基本都遵循(what、how、why)原则去学习。

-End-

审核编辑 :李倩


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7026

    浏览量

    89033
  • Elasticsearch
    +关注

    关注

    0

    文章

    29

    浏览量

    2831

原文标题:Elasticsearch 写入优化记录,从3000到8000/s

文章出处:【微信号:AndroidPush,微信公众号:Android编程精选】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    高频焊接数据记录系统优化与应用研究

    问题,严重影响了焊接质量和生产效率。因此,对高频焊接数据记录系统进行优化与应用研究,不仅能够提升焊接质量,还能为生产管理提供科学依据,具有重要的理论和实践意义。
    的头像 发表于 12-24 14:04 58次阅读
    高频焊接数据<b class='flag-5'>记录</b>系统<b class='flag-5'>优化</b>与应用研究

    RFHDMI:传统接口的现代优化

    射频(RF)、复合视频(RCA)、S-Video和视频色差是几种传统的视频接口。尽管这些接口在一些旧设备或特定应用场景中仍然被使用,但随着数字威廉希尔官方网站 的发展,它们的使用频率已经显著下降。 现代显示设备
    的头像 发表于 12-04 09:12 1126次阅读
    <b class='flag-5'>从</b>RF<b class='flag-5'>到</b>HDMI:传统接口的现代<b class='flag-5'>优化</b>

    RFHDMI:传统接口的现代优化

    应用需求,确保相应的信号线和电源线布置合理。 三、S-Video S-Video(Y/C)接口是一种可以分别传送亮度信息和色度信号的接口。为了在PCB设计中有效实现S-Video接口,需要遵循以下
    发表于 12-03 20:45

    Elasticsearch 再次开源

    Elasticsearch 和 Kibana 又可以被称为开源了。很难表达这句话让我有多高兴。我激动得简直要跳起来了。我们 Elastic 的所有人都是如此。开源是我的 DNA。这也是Elastic的DNA。能够再次将 Elasticsearch 称为开源,我感到非常高兴
    的头像 发表于 11-13 12:14 136次阅读
    <b class='flag-5'>Elasticsearch</b> 再次开源

    大功率电源EMC测试整改:设计测试的全面优化

    深圳南柯电子|大功率电源EMC测试整改:设计测试的全面优化
    的头像 发表于 10-23 14:19 342次阅读
    大功率电源EMC测试整改:<b class='flag-5'>从</b>设计<b class='flag-5'>到</b>测试的全面<b class='flag-5'>优化</b>

    匿名浏览数据安全:代理IP用户心声全记录

    匿名浏览数据安全,代理IP威廉希尔官方网站 在现代网络环境中扮演着重要角色。以下是代理IP用户心声的全记录,涵盖了其应用、优势、挑战及用户心声。
    的头像 发表于 09-30 08:59 202次阅读

    高增益八木天线:设计优化的信号增强

    深圳特信电子|高增益八木天线:设计优化的信号增强
    的头像 发表于 09-23 09:07 550次阅读

    如何向EEPROM写入数字

    向EEPROM(Electrically Erasable Programmable Read-Only Memory,电可擦可编程只读存储器)写入数字是一个相对直接的过程,但涉及多个步骤和细节。以下是一个详细的步骤说明,旨在帮助您理解并成功向EEPROM
    的头像 发表于 09-05 10:56 1063次阅读

    记录到管理:单北斗工作记录仪如何优化工作流程

    在这个快节奏的时代,每一分效率的提升都是企业竞争力的关键。繁琐的手工记录到智能化的数据管理,威廉希尔官方网站 的飞跃正悄然改变着我们的工作方式。顶坚单北斗工作记录仪如何成为优化工作流程的得力助手,
    的头像 发表于 08-30 11:09 281次阅读
    <b class='flag-5'>从</b><b class='flag-5'>记录</b>到管理:单北斗工作<b class='flag-5'>记录</b>仪如何<b class='flag-5'>优化</b>工作流程

    软件系统的数据检索设计

    refresh操作将mem buffer中的数据写入新的segment并写入os cache,然后打开本segment以供
    的头像 发表于 08-22 14:08 264次阅读
    软件系统的数据检索设计

    PLC云端,ZP3000系列网关助力工业数字化转型

    ZP3000系列远程控制网关是一款专为满足现代工业自动化和远程监控需求而设计且功能强大的通讯模块。它的多接口设计和灵活配置能力,使得它能够适应多种复杂的工业通信和监控场景。以下是关于ZP3000系列
    的头像 发表于 07-30 14:23 546次阅读
    <b class='flag-5'>从</b>PLC<b class='flag-5'>到</b>云端,ZP<b class='flag-5'>3000</b>系列网关助力工业数字化转型

    KV-8000/7000/5000/3000/1000系列指令参考手册

    电子发烧友网站提供《KV-8000/7000/5000/3000/1000系列指令参考手册.pdf》资料免费下载
    发表于 06-25 14:15 0次下载

    紫光展锐UNISOC S8000用科技助力步步高学习机S8智慧教育

    近日,步步高推出全新学习机S8,内置紫光展锐芯片平台-UNISOC S8000,依托展锐芯片的强劲性能和步步高多年积累的教育资源优势,步步高学习机S8让青少年能更高效、更精准地掌握知识,养成学习
    的头像 发表于 06-05 18:14 2926次阅读

    怎样才能使用范围(0x8004-0xBFFC)进行I2C写入呢?

    我们怎样才能使用范围(0x8004-0xBFFC)进行 I2C 写入呢? 我们可以直接将写入的数据复制范围 (0x8000-0xBFFC) 吗?或者需要配置其他寄存器?
    发表于 01-23 08:13

    浅谈代码优化与过度设计

    本文记录了作者“代码优化“过度设计”的典型思考过程,这过程中涉及了很多Java的语法糖及设计模式的东西,很典型,能启发思考,遂记录下来
    的头像 发表于 01-19 10:05 549次阅读
    浅谈代码<b class='flag-5'>优化</b>与过度设计