搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏山河已无恙
DNS：DNS问题故障排查的一些笔记
服务器返回的两种不同的响应状态码，它们分别表示以下情况： SERVFAIL表示DNS服务器无法处理该查询请求，通常是由于服务器故障、网络问题或其他错误导致的。查询通过 dig +trace 命令可以跟踪 DNS 解析过程 ┌──[hp@hp-ProLiant-SL270s-Gen8-SE]-[~] └─$dig +trace liruilongs.github.io PQxqrG5/DAsu9RBIZN4Ol4lzzGkMBzyDxsC0lI+l8HDz5qTocF2tx8+F CYOeqJ235GhJI6cqMs0qFSMd9yHKupIllXOvrIBTgcJ/ a8hoyXxoWyQL iwFJ8lj3+Wc3VSdHGvkqWYMZ52Ny9orne3zqTOzpGV1xtyxAiw+a9h92 hufkRTmoki6jMdiIFlVhQIHzqtc4MY/ YGikk+waO8SYkaBCCNiFjRwXRmjJWGhfk7g1iTAPUz3a8WHtZ/MJSjMc uQPhpbfl7h2Bq0//Gcl657brOnAGL4/pa8Bo0gyWhDLQDPGQe
3.6K20编辑于 2023-08-21
来自专栏开源部署
DNS中的Generating etcrndc.key:故障
1.在启动DNS时出现Generating /etc/rndc.key:卡在这里了 [root@RedHat named]# /etc/init.d/named restart Stopping named
91010编辑于 2022-06-29
来自专栏运维随笔
dns故障引发https访问异常缓慢问题
故障现象： http://访问正常 https://访问异常卡顿发现服务器上无法正常查询dns请求 image.png 后面经过修改DNS，恢复了正常的DNS查询后，即恢复正常！因为请求的网站都是内部网站，域名已经在hosts里面指定，所以DNS异常也没影响网站的访问。经过分析：故障应该是因为DNS查询故障导致SSL证书查询异常导致。
2K60编辑于 2022-02-14
来自专栏linux教程
CentOS 8 清除 DNS 缓存
其最为明显的作用就是加快 DNS 解析速度，在接口调用频繁的内网环境建议开启。这里利用 nscd 的 hosts 缓存服务来实现清除 CentOS 8 Linux 下的 DNS 缓存。启动nscd 服务后，清缓存开启 nscd 的 hosts 缓存服务后，每次内部接口请求不会都发起 dns 解析请求，而是直接命中 nscd 缓存散列表，从而获取对应服务器 ip 地址，这样可以在大量内部接口请求时减少接口的响应时间
4.2K10编辑于 2023-04-26
来自专栏陆耀伟的专栏
DNS故障对TDW影响评估及改进方案探索
评估步骤先对 TDW 各个模块单独进行 DNS 故障模拟并评估，然后对整个 TDW 进行 DNS 故障模拟并评估。具体 DNS 故障模拟情况如下：（详细内容略去） Datanode 出现单点 DNS 故障。 Namenode 节点出现 DNS 故障。 Secondary Namenode 出现 DNS 故障。整个 HDFS 集群出现 DNS 故障。 JobTracker 出现单点 DNS 故障。 TaskTracker 出现单点 DNS 故障。整个计算引擎出现 DNS 故障。 Hive 服务器出现 DNS 故障。 PLClient 出现 DNS 故障。 DFSClient 出现 DNS 故障。整个 TDW 出现 DNS 故障、也就是存储引擎、查询引擎、计算引擎都出现 DNS 故障。
2.7K00发布于 2016-09-27
来自专栏张师傅的博客
一次完整的 DNS 访问故障分析实录
最近我们边缘集群服务遇到了一个 DNS 访问故障问题，现象是在边缘服务器上无法访问 DNS 服务器(10.7.0.1)，发出去的 DNS 请求包没有收到任何回应。由于这是第一次遇到这种问题，因此我记录了详细的故障排查过程，让我们一起来看看是如何一步步逼近真相，找到问题根源的。起初我们怀疑是 DNS 服务本身出了问题。但检查发现 10.7.0.1 上 53 端口处于正常监听状态：本机执行 DNS 查询也一切正常。这样就可以排除 DNS 服务异常的可能性了。最后，我们下线了这台虚拟机，彻底修复了故障，至此破案。小结这次故障排查过程还是比较顺利的，虽然中间编译 tcpdump 工具花了点时间。期间用到的一些小技巧包括: 编译静态链接的 tcpdump 方便在受限环境排查留意 ARP 表中记录的状态适当运用「社会工程学」，发动集体回忆希望通过分享这个案例，能给你一些故障排查思路上的启发
51310编辑于 2024-06-19
来自专栏大数据成长之路
HDFS中namenode故障恢复(8)
value>file:///export/servers/Hadoop-2.6.0-cdh5.14.0/HadoopDatas/dfs/nn/snn/edits</value> </property> 故障恢复步骤 start-all.sh 4.浏览器页面正常访问 http://xxxx:50070/explorer.html#/【xxxx为namenode所在节点的ip】发现一切正常,说明故障恢复成功
61510发布于 2021-01-22
来自专栏院长运维开发
K8S内核故障
k8s已经无法管理node节点，node节点pod节点全挂了 ?
2.2K20发布于 2020-06-16
来自专栏Tensorbytes
聊聊k8s和dns
/SXj/NSz1V36uv4lWa3FuVZN+a/U2N/PP8KtvWi5cy66jG4mvb G53lPkvpGw3TOGG52KBS9rSys3DoadUtfFjXwVR+/xYUEQ== dns9 做DNS pod DNS 策略配置 k8s 提供了 pod 级别的DNS策略，dnsPolicy主要影响pod中的/etc/resolv.conf，dnsPolicy总提供了四种 DNS 配置方式： ClusterFirst 模式，使用集群的dns配置，k8s的默认设置，ClusterFirst会用k8s集群提供的dns服务器来解析，由 kubelet 的 –cluster-dns 参数提供集群中 dns 服务器的ip地址， ClusterFirstWithHostNet模式，是使用 hostNetwork 模型下启用集群dns服务，需配合hostNetwork: true使用 None模式，不加载k8s的dns配置，一般None 服务设置dnsConfig，这里其实是将 k8s 的默认配置抄了过来，将 nameservers 改为我们自建的dns服务器地址。
1.3K10发布于 2021-10-28
来自专栏Tensorbytes
聊聊k8s和dns
/SXj/NSz1V36uv4lWa3FuVZN+a/U2N/PP8KtvWi5cy66jG4mvb G53lPkvpGw3TOGG52KBS9rSys3DoadUtfFjXwVR+/xYUEQ== dns9 做DNS pod DNS 策略配置 k8s 提供了 pod 级别的DNS策略，dnsPolicy主要影响pod中的/etc/resolv.conf，dnsPolicy总提供了四种 DNS 配置方式： ClusterFirst 模式，使用集群的dns配置，k8s的默认设置，ClusterFirst会用k8s集群提供的dns服务器来解析，由 kubelet 的 –cluster-dns 参数提供集群中 dns 服务器的ip地址， ClusterFirstWithHostNet模式，是使用 hostNetwork 模型下启用集群dns服务，需配合hostNetwork: true使用 None模式，不加载k8s的dns配置，一般None 服务设置dnsConfig，这里其实是将 k8s 的默认配置抄了过来，将 nameservers 改为我们自建的dns服务器地址。
1.5K10发布于 2021-04-30
来自专栏herman的专栏
DNS应从何谈起篇一---从Facebook的故障谈起
导语涉及DNS相关的概念词汇非常多，很多技术从业人员朗朗上口的比如于域名劫持，又或者运营商劫持，国内哪里哪里部署了根镜像，域名注册，域名备案，域名解析异常，DNS 放大攻击，随机子域名攻击，DNS故障了，DNS又故障了等等等等。思来想去，随着Facebook 六小时断网故障的发生，我想先从故障开始，通过多起故障了解DNS分层访问体系，待对DNS分层体系有了了解后，我们在一点点去填充里面的知识点； image.png 本篇文章的主角是图一的故障二：20210405联通大网Tencent Auth 域名解析超时---见内部分享故障三：域名解析异常导致腾讯新闻列表1小时打开失败---见内部分享这里还有很多权威DNS的故障，比如2016 日，Akamai DNS故障，导致Fnac、Amazon云服务等2w多个大型网站瘫痪；我们通过故障一Facebook的故障，看出AuthDNS对网络的依赖和DNS解析服务对业务的影响，我们通过故障二联通解析异常得出
4.4K40编辑于 2021-12-28
来自专栏张师傅的博客
一次有趣的 DNS 导致 Node 服务故障问题分析实录
DNS 问题分析于是转向抓取 DNS 的包，很快得到失望的结果，seewo-xxx.uc-all 域名的 DNS 的请求也没有发起。通过这个图可以看到 libuv 对于网络事件的处理和文件 IO、DNS 的处理是不一样。DNS 的处理使用的是线程池，具体的逻辑后面会介绍。 0x7fd510ff9700 (LWP 37)): #0 0x00007fd51a6fbc3d in poll () from /lib64/libc.so.6 #1 0x00007fd5105e8f62 _r () from /lib64/libnss_dns.so.2 #5 0x00007fd51a6ee1c4 in gaih_inet.constprop.8 () from /lib64/libc.so /deps/uv/src/unix/getaddrinfo.c:106 #8 0x000000000139bc14 in worker (arg=0x0) at ..
1.1K30编辑于 2022-12-05
来自专栏云计算与大数据
k8s pod dns 问题记录
默认pod生成的dns 解析配置文件是如下: ? 由于pod 使用的是，alpine:latest 采用 apk add --update tcpdump 安装抓包查看dns 解析过程，抓取所有网络包： tcpdump -nnvXSs 0 -i any ，按照nameserver在本文中的次序进行，当第一个dns没有反应时，才查询第二个 domain #定义本地域名声明主机的域名。很多程序用到它，如邮件体系；当为沒有域名的主机进行DNS查询时，也要用到。如果沒有域名，主机名将被使用，删除所有在第一个点( . )前面的內容。由上分析可见，如果search列表较长并且查询了不存在的域名的话，网络上的dns查询报文量会急剧增加，并且可能引发dos攻击。
2.7K60发布于 2018-10-18
来自专栏爱生活爱编程
通过Wireshark和arthas排查由DNS引发的Ignite生产故障案例
通过Wireshark和arthas排查由DNS引发的Ignite生产故障案例故障背景故障分析第一次定位问题跨架构假设生产重现故障 Wireshark抓包分析客户端10秒超时源码跟踪结合日志查看服务端卡点生产环境情况：分为A、B两中心 A中心 x86架构主机8台，为ignite服务节点 B中心 power架构主机8台，为ignite服务节点 Ignite版本为1.10，jdk为1.8 问题反馈 2、网络问题导致故障，怀疑是跨中心，跨了网段导致故障第一次定位问题跨架构假设针对第一点的假设，通过并行环境模拟，模拟不出故障，因此只能到生产环境重现故障，再做下一步定位。，也就是DNS解析，获取到IP，然后连接；之前生产环境为什么没发现问题，是因为dns没有开启，本次由于其他业务上线，开启dns 相关配置如下：原来没开启DNS： cat /etc/nsswitch.conf hosts: files 本次上线，维护在files后加上dns就会开启DNS，导致问题产生 hosts: files dns 15秒配置如下：位于/etc/resolv.conf options
3.4K20编辑于 2021-12-08
来自专栏腾讯云 DNSPod 团队
DNS故障：26日上午网易等多家网站无法访问“剖析”
3月26日上午，DNSPod技术人员发现，目前北京联通递归DNS 202.106.46.151/202.106.0.20/210.51.176.71等多个IP出现时断时续的故障，经测试使用这些递归DNS 网络上搜索DNS故障，众多网友反馈，包括CCTV、凤凰网、网易等多家知名网站出现大规模访问故障。故障原因猜测 DNSPod技术人员表示，出现问题的原因是在域名请求对应的IP地址过程中，递归DNS处在一个桥梁的过程中，当递归出现故障，请求将无法顺利完成，因此出现网站无法打开现象。详情如下图显示：故障如何应对？作为普通用户，如何应对这次故障呢？ DNSPod安全专家表示，可以通过自行修改DNS服务器地址为114.114.114.114(这是国内第一个、全球第三个开放的DNS服务地址,又称114DNS)或者8.8.8.8(是Google提供的免费
2.5K20编辑于 2023-05-07
来自专栏Tensorbytes
k8s故障问题收集帖
] Error adding local-path-storage_local-path-provisioner-ccbdd96dc-cbthj/ 0d2b1cd6de25ac114e2075f70f8ac25ef72b299048e728038086f3e7324f400a failed: rpc error: code = Unknown desc = failed to set up sandbox container “0d2b1cd6de25ac114e2075f70f8ac25ef72b299048e728038086f3e7324f400a
2.4K20发布于 2020-02-11
来自专栏希里安
k8s故障排查常用方法
-- SRETALK 9月14日 k8s更新了1.28.2版本，这更新速度杠杠的，你们还在用什么版本，停留在1.18-1.20的小伙伴举个手 --k8s k8s故障排查常用方式在Kubernetes中排查故障是一个常见但有时复杂的任务以下是常用的方式和方法，可以帮排查Kubernetes中的故障：查看Pod状态和事件：使用 kubectl get pods 命令来获取Pod的状态。升级和维护：确保Kubernetes集群和应用程序组件处于最新版本，因为某些故障可能已在较新的版本中修复。在排查故障时，重要的是有系统地方法来分析问题，从Pod级别到节点级别，甚至到集群级别。同时，建议使用自动化工具来监视和报警，在故障发生时快速采取措施，以减少影响。
68740编辑于 2023-10-30
来自专栏Liusy01
k8s之DNS服务器搭建
答案是可以的，这就是k8s集群范围内的DNS服务来完成服务名到ClusterIP的解析，接下来就一起看一下如何搭建DNS服务器。搭建DNS服务器简介 k8s提供的DNS服务是skydns，由四个组件组成 etcd：DNS信息存储 kube2sky：监控k8s中Service资源的变化，根据Service的名称的IP地址信息生成 : "true" spec: replicas: 1 selector: k8s-app: kube-dns version: v8 template: metadata : labels: k8s-app: kube-dns version: v8 kubernetes.io/cluster-service: 结尾经由上一节，k8s的DNS服务已经搭建起来了，以后就可以愉快的使用服务名进行访问了，你学废了吗？
87210发布于 2020-11-03
来自专栏容器计算
k8s集群外部域名dns解析问题
Overview 业务在某个k8s集群，访问集群外部域名，去拉取模型到本地超时失败原因分析查看了 coredns 的监控和日志，均没有发现异常，通过 ping harbor.xxx.com 分析回包非常慢，而且频繁超时，于是抓包，发现 harbor.xxx.com 添加了 search 域，因为本身域名只有三位，k8s 的 DNS 的 ndots 默认是5位，所以肯定会添加 search 域去解析域名的
2.3K41编辑于 2022-05-10
来自专栏IT运维技术圈
经典故障分析报告之-内核参数导致k8s节点故障
运行环境信息：Kubernetes + docker，应用程序：Java 问题描述 1、首先从 Kubernetes 事件中心告警信息如下，该告警集群常规告警事件（其实从下面这些常规告警信息是无法判断是什么故障问题 14:22:06 PROD-BE-K8S-WN8 kubelet[3124]: runtime.startTemplateThread() Dec 22 14:22:06 PROD-BE-K8S-WN8 (*mTreap).end+78> 0000000000000000 二、故障分析根据以上的故障问题初步分析，第一反应是 ulimi -u 值太小，已经被 hit（触及到，突破该参数的上限），于是查看各用户的 * soft nproc 65536 root soft nproc unlimited 查看节点运行的进程：从监控信息可以看到在故障最高使用分析过程 1、从以上监控信息分析，故障时间区间，系统运行的线程略高 31616，但是该值却没有超过当前用户的 ulimit -u 的值，初步排除该线索。
1.5K40编辑于 2023-02-02

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

DNS：DNS问题故障排查的一些笔记

DNS中的Generating etcrndc.key:故障

dns故障引发https访问异常缓慢问题

CentOS 8 清除 DNS 缓存

DNS故障对TDW影响评估及改进方案探索

一次完整的 DNS 访问故障分析实录

HDFS中namenode故障恢复(8)

K8S内核故障

聊聊k8s和dns

聊聊k8s和dns

DNS应从何谈起篇一---从Facebook的故障谈起

一次有趣的 DNS 导致 Node 服务故障问题分析实录

k8s pod dns 问题记录

通过Wireshark和arthas排查由DNS引发的Ignite生产故障案例

DNS故障：26日上午网易等多家网站无法访问“剖析”

k8s故障问题收集帖

k8s故障排查常用方法

k8s之DNS服务器搭建

k8s集群外部域名dns解析问题

经典故障分析报告之-内核参数导致k8s节点故障

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐