在kubernetes中Helm部署Dockerfile镜像中的PHP-fpm Cannot resolve host

发布于 2022-09-12 13:48:58 字数 2380 浏览 26 评论 0

应用说明:
PHP: php-fpm7.4 、 php-fpm7.4.13
Traefik(用于Kubernetes的ACME和ingress-route)
Helm v3进行服务自动化部署

用于测试的代码

$domain = 'www.mywebsite.com';
echo 'gethostbynamel(): '; var_dump(gethostbynamel($domain)); #false
echo 'checkdnsrr(): ';     var_dump(checkdnsrr($domain, 'A')); #false
echo 'dns_get_record(): '; var_dump(dns_get_record($domain)); #empty

问题描述:

因为发现代码中需要上传到OSS的地方出现了 “Cannot resolve host”报错(来源于curl()函数)。

此问题仅出现在Kubernetes(1.18,使用的是腾讯TKE服务进行集群管理) 由Helm(v3)部署Dockerfile镜像后出现。

这份Dockerfile在本地(我的电脑)通过 docker build & docker run以及某一台独立的服务器上通过docker-compose 基于该Dockerfile进行 build .都是没有问题的。

Dockerfile大致样貌,使用supervisor以root运行)管理容器内的Nginx、php-fpm启动。 这份Dockerfile是正常且持续工作了1年的。。。

FROM php:7.4-fpm-alpine
ENV TZ=Asia/Shanghai

RUN sed -i 's/dl-cdn.alpinelinux.org/mirrors.aliyun.com/g' /etc/apk/repositories
# Install dev dependencies
RUN apk add ... #此处省略一堆安装依赖的部分

COPY src /var/www
WORKDIR /var/www
RUN chown -R www-data:www-data /var/www/ 
    && chmod +x /usr/local/bin/start
RUN chmod -R 777 storage && chmod -R 755 public
RUN composer install --optimize-autoloader --no-dev
ADD src/.env.example .env
RUN php artisan jwt:secret && php artisan storage:link && php artisan key:generate
CMD ["/usr/local/bin/start"]

先决排查:
kube-dns pods、endpoints、开启日志无异常...正常
使用bosybox:1.28.3(讲究)进行DNS解析测试...正常
程序pod中/etc/resolv.conf 的nameserver和搜索域可用,FQDN服务解析正常(nslookup) .... 正常
程序pod下shell执行 curl 到 api.weixin.qq.com和www.baidu.com ...正常
程序pod下使用php -a和 php artisan tinker执行curl 到 api.weixin.qq.com ...正常

程序pod下kill php-fpm,然后启动php-fpm ... 无效
将程序代码中使用CURL的部分增加关闭DNS缓存 curl_setopt($ch,CURLOPT_DNS_USE_GLOBAL_CACHE,false)... 无效
修改/etc/resolv.conf为644..无效
程序pod中/etc/resolv.conf增加其他DNS(阿里云内网DNS、114和8那种,每次只加2条,不超3条nameserver),然后重启php-fpm ... 无效


总结:

  1. php-cli一切正常,可以解析,仅php-fpm无法解析域名, IP可以。感觉php-fpm对/etc/resolv.conf没感觉。。。
  2. kube-dns正常,kube-proxy正常。
  3. 在/etc/hosts中增加所要用的OSS服务的解析(比如 公网IP bucket-name.oss.aliyun.com),php-fpm才可以工作。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

暗喜 2022-09-19 13:48:58

问题找到了……

问题其实应该属于:非root用户无法访问/etc/resolv.conf文件,此限制超出了Linux的用户管理体系所能覆盖的范围),其他文件均可正常访问。
具体一点来说,新增一个叫test1的用户,它可以访问到/etc/issue (所属root:root 644),以及/etc/hosts(所属root:root 644),但是唯独无法访问/etc/resolv.conf。即使该文件被修改为test1:test1 755权限,test1用户也无法访问它。只有root用户可以。

服务部署在腾讯TKE上(此部分由TKE自己的CNI接管),使用腾讯CFS(一个NAS)做为docker运行存储目录,/etc/resolv.conf的确被TKE接管了,但由于CFS与TKE之间的权限有些问题(腾讯方面表述需要内部消化),所以出现了只有root权限才能访问。

如果说没有用NFS做为docker运行存储目录,这个问题将不会发生。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文