使用 PHP Curl 库持久/保持 HTTP？

发布于 2024-07-24 03:07:19 字数 620 浏览 15 评论 0原文

我正在使用一个简单的 PHP 库通过 HTTP 将文档添加到 SOLR 索引。

当前涉及 3 个服务器：

运行索引作业的 PHP 框
保存正在索引的数据的数据库框
solr 框。

在 80 个文档/秒（100 万个文档中）的情况下，我注意到 PHP 和 solr 盒子上的网络接口的中断率异常高（2000 个/秒；更重要的是，图表几乎相同 - 当中断PHP 框上的速率达到峰值，Solr 框上的速率也达到峰值），但数据库框上的速率要低得多（300/秒）。我想这只是因为我打开并重用了与数据库服务器的单个连接，但由于 Solr 客户端库的编写方式，每个 Solr 请求当前都通过 cURL 打开一个新的 HTTP 连接。

所以，我的问题是：

可以使用 cURL 打开 keepalive 会话吗？
重用连接需要什么？ -- 就像重用 cURL 句柄资源一样简单吗？
我需要设置任何特殊的 cURL 选项吗？（例如强制 HTTP 1.1？）
cURL keepalive 连接是否有任何问题？该脚本一次运行几个小时；我能够使用单个连接，还是需要定期重新连接？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

牵你手 2024-07-31 03:07:19

cURL PHP 文档 (curl_setopt) 说：

CURLOPT_FORBID_REUSE - TRUE 强制
要显式关闭的连接
当它完成处理时，并且
不能集中再利用。

所以：

是的，实际上它应该默认重用连接，只要你重用 cURL 句柄。
默认情况下，cURL 自行处理持久连接；如果您需要一些特殊的标头，请检查 CURLOPT_HTTPHEADER，
服务器可能会发送保持活动超时（默认 Apache 安装时，为 15 秒或 100 个请求，以先到者为准） - 但发生这种情况时，cURL 只会打开另一个连接。

回复收藏 0 原文

寄居人 2024-07-31 03:07:19

默认情况下，Curl 发送 keep-alive 标头，但是：

使用不带任何参数的 curl_init() 创建上下文。
将上下文存储在它将生存的范围内（不是本地变量）
使用 CURLOPT_URL 选项将 url 传递到上下文
使用 curl_exec() 执行请求
不要使用 curl_close() 关闭连接

非常基本的示例：

function get($url) {
    global $context;
    curl_setopt($context, CURLOPT_URL, $url);
    return curl_exec($context);
}

$context = curl_init();
//multiple calls to get() here
curl_close($context);

Curl sends the keep-alive header by default, but:

create a context using curl_init() without any parameters.
store the context in a scope where it will survive (not a local var)
use CURLOPT_URL option to pass the url to the context
execute the request using curl_exec()
don't close the connection with curl_close()

very basic example:

function get($url) {
    global $context;
    curl_setopt($context, CURLOPT_URL, $url);
    return curl_exec($context);
}

$context = curl_init();
//multiple calls to get() here
curl_close($context);

回复收藏 0 原文

鼻尖触碰 2024-07-31 03:07:19

在您访问的服务器上，必须启用保持活动状态，并且最大保持活动请求数应该合理。对于 Apache，请参阅 apache 文档。
您必须重新使用相同的 cURL 上下文。

配置 cURL 上下文时，在标头中启用保持活动状态并超时：

curl_setopt($curlHandle, CURLOPT_HTTPHEADER, array( 
      '连接：保持活动'， 
      “保持活动：300” 
  ））；

On the server you are accessing keep-alive must be enabled and maximum keep-alive requests should be reasonable. In the case of Apache, refer to the apache docs.
You have to be re-using the same cURL context.

When configuring the cURL context, enable keep-alive with timeout in the header:

curl_setopt($curlHandle, CURLOPT_HTTPHEADER, array(
    'Connection: Keep-Alive',
    'Keep-Alive: 300'
));

回复收藏 0 原文

苏别ゝ 2024-07-31 03:07:19

如果您不关心请求的响应，则可以异步执行它们，但您会面临 SOLR 索引超载的风险。但我对此表示怀疑，SOLR 的速度相当快。

异步 PHP 调用？

回复收藏 0 原文

~没有更多了~

关于作者

情何以堪。

暂无简介

文章

24 人气

关注发私信

友情链接

文江博客

使用 PHP Curl 库持久/保持 HTTP？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

千笙结

天生の放荡

夢野间

qq_fNfccJ

池予

三生一梦

友情链接

使用 PHP Curl 库持久/保持 HTTP？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

千笙结

天生の放荡

夢野间

qq_fNfccJ

池予

三生一梦

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。