0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看威廉希尔官方网站 视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

HttpClient优化思路

马哥Linux运维 来源:CSDN-仰望星空的尘埃 2023-09-12 11:18 次阅读

HttpClient优化思路:

池化

长连接

httpclient和httpget复用

合理的配置参数(最大并发请求数,各种超时时间,重试次数)

异步

多读源码

1.背景

我们有个业务,会调用其他部门提供的一个基于http的服务,日调用量在千万级别。使用了httpclient来完成业务。之前因为qps上不去,就看了一下业务代码,并做了一些优化,记录在这里。

先对比前后:优化之前,平均执行时间是250ms;

优化之后,平均执行时间是80ms,降低了三分之二的消耗,容器不再动不动就报警线程耗尽了,清爽~

2.分析

项目的原实现比较粗略,就是每次请求时初始化一个httpclient,生成一个httpPost对象,执行,然后从返回结果取出entity,保存成一个字符串,最后显式关闭response和client。

我们一点点分析和优化:

2.1 httpclient反复创建开销

httpclient是一个线程安全的类,没有必要由每个线程在每次使用时创建,全局保留一个即可。

2.2 反复创建tcp连接的开销

tcp的三次握手与四次挥手两大裹脚布过程,对于高频次的请求来说,消耗实在太大。试想如果每次请求我们需要花费5ms用于协商过程,那么对于qps为100的单系统,1秒钟我们就要花500ms用于握手和挥手。又不是高级领导,我们程序员就不要搞这么大做派了,改成keep alive方式以实现连接复用!

2.3 重复缓存entity的开销

原本的逻辑里,使用了如下代码:

HttpEntityentity=httpResponse.getEntity();

Stringresponse=EntityUtils.toString(entity);

这里我们相当于额外复制了一份content到一个字符串里,而原本的httpResponse仍然保留了一份content,需要被consume掉,在高并发且content非常大的情况下,会消耗大量内存。并且,我们需要显式的关闭连接,ugly。

3.实现

按上面的分析,我们主要要做三件事:一是单例的client,二是缓存的保活连接,三是更好的处理返回结果。一就不说了,来说说二。

提到连接缓存,很容易联想到数据库连接池。httpclient4提供了一个PoolingHttpClientConnectionManager 作为连接池。接下来我们通过以下步骤来优化:

3.1 定义一个keep alive strategy

关于keep-alive,本文不展开说明,只提一点,是否使用keep-alive要根据业务情况来定,它并不是灵丹妙药。还有一点,keep-alive和time_wait/close_wait之间也有不少故事。

在本业务场景里,我们相当于有少数固定客户端,长时间极高频次的访问服务器,启用keep-alive非常合适

再多提一嘴,http的keep-alive 和tcp的KEEPALIVE不是一个东西。回到正文,定义一个strategy如下:

ConnectionKeepAliveStrategymyStrategy=newConnectionKeepAliveStrategy(){
@Override
publiclonggetKeepAliveDuration(HttpResponseresponse,HttpContextcontext){
HeaderElementIteratorit=newBasicHeaderElementIterator
(response.headerIterator(HTTP.CONN_KEEP_ALIVE));
while(it.hasNext()){
HeaderElementhe=it.nextElement();
Stringparam=he.getName();
Stringvalue=he.getValue();
if(value!=null&¶m.equalsIgnoreCase
("timeout")){
returnLong.parseLong(value)*1000;
}
}
return60*1000;//如果没有约定,则默认定义时长为60s
}
};

3.2 配置一个PoolingHttpClientConnectionManager

PoolingHttpClientConnectionManagerconnectionManager=newPoolingHttpClientConnectionManager();
connectionManager.setMaxTotal(500);
connectionManager.setDefaultMaxPerRoute(50);//例如默认每路由最高50并发,具体依据业务来定

也可以针对每个路由设置并发数。

3.3 生成httpclient

httpClient=HttpClients.custom()
.setConnectionManager(connectionManager)
.setKeepAliveStrategy(kaStrategy)
.setDefaultRequestConfig(RequestConfig.custom().setStaleConnectionCheckEnabled(true).build())
.build();

注意:使用setStaleConnectionCheckEnabled方法来逐出已被关闭的链接不被推荐。更好的方式是手动启用一个线程,定时运行closeExpiredConnections 和closeIdleConnections方法,如下所示。

publicstaticclassIdleConnectionMonitorThreadextendsThread{

privatefinalHttpClientConnectionManagerconnMgr;
privatevolatilebooleanshutdown;

publicIdleConnectionMonitorThread(HttpClientConnectionManagerconnMgr){
super();
this.connMgr=connMgr;
}

@Override
publicvoidrun(){
try{
while(!shutdown){
synchronized(this){
wait(5000);
//Closeexpiredconnections
connMgr.closeExpiredConnections();
//Optionally,closeconnections
//thathavebeenidlelongerthan30sec
connMgr.closeIdleConnections(30,TimeUnit.SECONDS);
}
}
}catch(InterruptedExceptionex){
//terminate
}
}

publicvoidshutdown(){
shutdown=true;
synchronized(this){
notifyAll();
}
}

}

3.4 使用httpclient执行method时降低开销

这里要注意的是,不要关闭connection。

一种可行的获取内容的方式类似于,把entity里的东西复制一份:

res=EntityUtils.toString(response.getEntity(),"UTF-8");
EntityUtils.consume(response1.getEntity());

但是,更推荐的方式是定义一个ResponseHandler,方便你我他,不再自己catch异常和关闭流。在此我们可以看一下相关的源码:

publicTexecute(finalHttpHosttarget,finalHttpRequestrequest,
finalResponseHandlerresponseHandler,finalHttpContextcontext)
throwsIOException,ClientProtocolException{
Args.notNull(responseHandler,"Responsehandler");

finalHttpResponseresponse=execute(target,request,context);

finalTresult;
try{
result=responseHandler.handleResponse(response);
}catch(finalExceptiont){
finalHttpEntityentity=response.getEntity();
try{
EntityUtils.consume(entity);
}catch(finalExceptiont2){
//Logthisexception.Theoriginalexceptionismore
//importantandwillbethrowntothecaller.
this.log.warn("Errorconsumingcontentafteranexception.",t2);
}
if(tinstanceofRuntimeException){
throw(RuntimeException)t;
}
if(tinstanceofIOException){
throw(IOException)t;
}
thrownewUndeclaredThrowableException(t);
}

//Handlingtheresponsewassuccessful.Ensurethatthecontenthas
//beenfullyconsumed.
finalHttpEntityentity=response.getEntity();
EntityUtils.consume(entity);//看这里看这里
returnresult;
}

可以看到,如果我们使用resultHandler执行execute方法,会最终自动调用consume方法,而这个consume方法如下所示:

publicstaticvoidconsume(finalHttpEntityentity)throwsIOException{
if(entity==null){
return;
}
if(entity.isStreaming()){
finalInputStreaminstream=entity.getContent();
if(instream!=null){
instream.close();
}
}
}

可以看到最终它关闭了输入流。

4.其他

通过以上步骤,基本就完成了一个支持高并发的httpclient的写法,下面是一些额外的配置和提醒:

4.1 httpclient的一些超时配置

CONNECTION_TIMEOUT是连接超时时间,SO_TIMEOUT是socket超时时间,这两者是不同的。连接超时时间是发起请求前的等待时间;socket超时时间是等待数据的超时时间。

HttpParamsparams=newBasicHttpParams();
//设置连接超时时间
IntegerCONNECTION_TIMEOUT=2*1000;//设置请求超时2秒钟根据业务调整
IntegerSO_TIMEOUT=2*1000;//设置等待数据超时时间2秒钟根据业务调整

//定义了当从ClientConnectionManager中检索ManagedClientConnection实例时使用的毫秒级的超时时间
//这个参数期望得到一个java.lang.Long类型的值。如果这个参数没有被设置,默认等于CONNECTION_TIMEOUT,因此一定要设置。
LongCONN_MANAGER_TIMEOUT=500L;//在httpclient4.2.3中我记得它被改成了一个对象导致直接用long会报错,后来又改回来了

params.setIntParameter(CoreConnectionPNames.CONNECTION_TIMEOUT,CONNECTION_TIMEOUT);
params.setIntParameter(CoreConnectionPNames.SO_TIMEOUT,SO_TIMEOUT);
params.setLongParameter(ClientPNames.CONN_MANAGER_TIMEOUT,CONN_MANAGER_TIMEOUT);
//在提交请求之前测试连接是否可用
params.setBooleanParameter(CoreConnectionPNames.STALE_CONNECTION_CHECK,true);

//另外设置http client的重试次数,默认是3次;当前是禁用掉(如果项目量不到,这个默认即可)
httpClient.setHttpRequestRetryHandler(newDefaultHttpRequestRetryHandler(0,false));

4.2 如果配置了nginx的话,nginx也要设置面向两端的keep-alive

现在的业务里,没有nginx的情况反而比较稀少。nginx默认和client端打开长连接而和server端使用短链接。

注意client端的keepalive_timeout和keepalive_requests参数,以及upstream端的keepalive参数设置,这三个参数的意义在此也不再赘述。

以上就是我的全部设置。通过这些设置,成功地将原本每次请求250ms的耗时降低到了80左右,效果显著。

JAR包如下:

 

org.apache.httpcomponents
httpclient
4.5.6

代码如下:

//Basic认证
privatestaticfinalCredentialsProvidercredsProvider=newBasicCredentialsProvider();
//httpClient
privatestaticfinalCloseableHttpClienthttpclient;
//httpGet方法
privatestaticfinalHttpGethttpget;
//
privatestaticfinalRequestConfigreqestConfig;
//响应处理器
privatestaticfinalResponseHandlerresponseHandler;
//jackson解析工具
privatestaticfinalObjectMappermapper=newObjectMapper();
static{
System.setProperty("http.maxConnections","50");
System.setProperty("http.keepAlive","true");
//设置basic校验
credsProvider.setCredentials(
newAuthScope(AuthScope.ANY_HOST,AuthScope.ANY_PORT,AuthScope.ANY_REALM),
newUsernamePasswordCredentials("",""));
//创建http客户端
httpclient=HttpClients.custom()
.useSystemProperties()
.setRetryHandler(newDefaultHttpRequestRetryHandler(3,true))
.setDefaultCredentialsProvider(credsProvider)
.build();
//初始化httpGet
httpget=newHttpGet();
//初始化HTTP请求配置
reqestConfig=RequestConfig.custom()
.setContentCompressionEnabled(true)
.setSocketTimeout(100)
.setAuthenticationEnabled(true)
.setConnectionRequestTimeout(100)
.setConnectTimeout(100).build();
httpget.setConfig(reqestConfig);
//初始化response解析器
responseHandler=newBasicResponseHandler();
}
/*
*功能:返回响应
*@authorzhangdaquan
*@param[url]
*@returnorg.apache.http.client.methods.CloseableHttpResponse
*@exception
*/
publicstaticStringgetResponse(Stringurl)throwsIOException{
HttpGetget=newHttpGet(url);
Stringresponse=httpclient.execute(get,responseHandler);
returnresponse;
}

/*
*功能:发送http请求,并用net.sf.json工具解析
*@authorzhangdaquan
*@param[url]
*@returnorg.json.JSONObject
*@exception
*/
publicstaticJSONObjectgetUrl(Stringurl)throwsException{
try{
httpget.setURI(URI.create(url));
Stringresponse=httpclient.execute(httpget,responseHandler);
JSONObjectjson=JSONObject.fromObject(response);
returnjson;
}catch(IOExceptione){
e.printStackTrace();
}
returnnull;
}
/*
*功能:发送http请求,并用jackson工具解析
*@authorzhangdaquan
*@param[url]
*@returncom.fasterxml.jackson.databind.JsonNode
*@exception
*/
publicstaticJsonNodegetUrl2(Stringurl){
try{
httpget.setURI(URI.create(url));
Stringresponse=httpclient.execute(httpget,responseHandler);
JsonNodenode=mapper.readTree(response);
returnnode;
}catch(IOExceptione){
e.printStackTrace();
}
returnnull;
}
/*
*功能:发送http请求,并用fastjson工具解析
*@authorzhangdaquan
*@param[url]
*@returncom.fasterxml.jackson.databind.JsonNode
*@exception
*/
publicstaticcom.alibaba.fastjson.JSONObjectgetUrl3(Stringurl){
try{
httpget.setURI(URI.create(url));
Stringresponse=httpclient.execute(httpget,responseHandler);
com.alibaba.fastjson.JSONObjectjsonObject=com.alibaba.fastjson.JSONObject.parseObject(response);
returnjsonObject;
}catch(IOExceptione){
e.printStackTrace();
}
returnnull;
}

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • HTTP
    +关注

    关注

    0

    文章

    505

    浏览量

    31212
  • 源码
    +关注

    关注

    8

    文章

    640

    浏览量

    29198
  • 代码
    +关注

    关注

    30

    文章

    4786

    浏览量

    68565
  • httpclient
    +关注

    关注

    0

    文章

    3

    浏览量

    1870

原文标题:高并发场景下的 HttpClient 优化方案,QPS 大大提升!

文章出处:【微信号:magedu-Linux,微信公众号:马哥Linux运维】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【平头哥RVB2601开发板试用体验】基于 HTTPClient 的云语音识别 1

    前言本系列共有三篇文章,目的是在 RVB2601 上实现基于 HTTPClient 组件的云语音识别。文章连接与主要内容如下:文章1:设计思路HTTPClient 组件测试文章2
    发表于 02-28 14:31

    【平头哥RVB2601开发板试用体验】基于 HTTPClient 的云语音识别 2

    本帖最后由 hazhuzhu 于 2022-2-28 20:05 编辑 前言在文章1中我们计划用 HTTPClient 组件帮助我们与服务器通信,上传录音文件并接收识别结果,最终实现云语音识别
    发表于 02-28 14:50

    如何去实现基于HTTPClient云语音识别的POST请求功能呢

    如何去实现基于HTTPClient云语音识别的POST请求功能呢?有哪些步骤呢?
    发表于 03-08 08:12

    在RVB2601上怎样去实现基于HTTPClient组件的云语音识别呢

    在RVB2601上怎样去实现基于HTTPClient组件的云语音识别呢?有哪些实现步骤?
    发表于 03-08 07:01

    下载大文件使用HTTPClient和WiFiClient崩溃了怎么解决?

    100,000 字节的更大文件时,我遇到了崩溃。崩溃似乎发生在 GET 调用之后的一小段时间。如果我在 GET 之后注释掉所有访问 HTTPClient 对象的调用,我就不会崩溃。如果我只注释掉
    发表于 02-27 06:40

    AT+HTTPCLIENT有没有办法打断命令?

    版本: v2.2.0.0 ESP32-WROVER_AT_Bin_V2.2.0.0 问题描述: 1) AT+HTTPCLIENT命令看上去没有办法中止 有没有办法打断这样的命令? 2
    发表于 04-24 08:09

    GPRS优化思路总结报告

    GPRS优化思路总结报告:一、概述 2二、无线优化思路 2三、(E)GPRS网络资源容量分析优化 53.1、
    发表于 07-27 21:29 26次下载

    GPRS优化思路总结报告_李青春

    (E)GPRS 优化思路通信网络优化,GSM上网,PDCH,EDGEGPRS.
    发表于 01-14 15:21 4次下载

    win10 uwp httpClient 登陆CSDN

    我们可以使用下面代码让 HttpClient 使用 Cookie ,有了这个才可以保存登陆,不然登陆成功下次访问网页还是没登陆。 CookieContainer cookies = new
    发表于 11-29 09:45 1840次阅读

    VoLTE优化思路干货资料下载

    电子发烧友网为你提供VoLTE优化思路干货资料下载的电子资料下载,更有其他相关的电路图、源代码、课件教程、中文资料、英文资料、参考设计、用户指南、解决方案等资料,希望可以帮助到广大的电子工程师们。
    发表于 04-23 08:42 9次下载
    VoLTE<b class='flag-5'>优化</b><b class='flag-5'>思路</b>干货资料下载

    日常网络优化思路资料下载

    电子发烧友网为你提供日常网络优化思路资料下载的电子资料下载,更有其他相关的电路图、源代码、课件教程、中文资料、英文资料、参考设计、用户指南、解决方案等资料,希望可以帮助到广大的电子工程师们。
    发表于 04-25 08:41 2次下载
    日常网络<b class='flag-5'>优化</b><b class='flag-5'>思路</b>资料下载

    【GCC编译优化系列】实战分析C代码遇到的编译问题及解决思路

    【GCC编译优化系列】实战分析C工程代码可能遇到的编译问题及其解决思路
    的头像 发表于 07-10 23:15 1423次阅读
    【GCC编译<b class='flag-5'>优化</b>系列】实战分析C代码遇到的编译问题及解决<b class='flag-5'>思路</b>

    Web前端性能优化思路

    本文旨在整理常见Web前端性能优化思路,可供前端开发参考。因为力求精简,限于篇幅,所以并未详述具体实施方案。 基于现代Web前端框架的应用,其原理是通过浏览器向服务器发送网络请求,获取必要
    的头像 发表于 10-18 14:21 974次阅读
    Web前端性能<b class='flag-5'>优化</b><b class='flag-5'>思路</b>

    关于手动伺服优化调整思路分享

    常规的伺服优化调整一般需要用到SERVO GUIDE 软件,而对于一些不是很懂该软件操作的客户或者在现场无法进行在线联网调整的情况下,手动调整就显得比较关键实用,在此提供手动伺服优化调整思路
    发表于 01-29 12:18 2760次阅读

    如何对GPU中的矩阵乘法(GEMM)进行优化

    本篇文章是GEMM优化的第一个部分,在这篇文章中,只说优化思路和分析。
    的头像 发表于 05-25 09:03 2822次阅读
    如何对GPU中的矩阵乘法(GEMM)进行<b class='flag-5'>优化</b>