首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏山河已无恙

    DNSDNS问题故障排查的一些笔记

    所有其它的路都是不完整的,是人的逃避方式,是对大众理想的懦弱回归,是随波逐流,是对内心的恐惧 ——赫尔曼·黑塞《德米安》 ---- 2排故DNS问题 名称解析遇到问题时,考虑从以下几点来解决: 客户端上 解析顺序 DNS是系统最常用的名称解析方法, 但DNS不是系统解析主机名和IP地址的唯一方法。 服务器返回的两种不同的响应状态码,它们分别表示以下情况: SERVFAIL表示DNS服务器无法处理该查询请求,通常是由于服务器故障、网络问题或其他错误导致的。 . 3600 IN NS dns2.p05.nsone.net. github.io. 3600 IN NS NnnWLDfRYPSCJjQwlDeYLqxLbwcIZVKFYAI2bGcMp5gwF+3N8GKobO0J fufmVtT2feylQnFVC414+dRVmfswmycKiVqYz+R5evDJVvlba47Nw2jk

    3.6K20编辑于 2023-08-21
  • 来自专栏开源部署

    DNS中的Generating etcrndc.key:故障

    1.在启动DNS时出现Generating /etc/rndc.key:卡在这里了 [root@RedHat named]# /etc/init.d/named restart Stopping named

    91010编辑于 2022-06-29
  • 来自专栏运维随笔

    dns故障引发https访问异常缓慢问题

    故障现象: http://访问正常 https://访问异常卡顿 发现服务器上无法正常查询dns请求 image.png 后面经过修改DNS,恢复了正常的DNS查询后,即恢复正常! 因为请求的网站都是内部网站,域名已经在hosts里面指定,所以DNS异常也没影响网站的访问。 经过分析:故障应该是因为DNS查询故障导致SSL证书查询异常导致。

    2K60编辑于 2022-02-14
  • 来自专栏Khan安全团队

    DNS C2

    设置 使用以下步骤为 DNS C2(和 DNS Canaries)配置域,只要您正确设置记录,您就可以使用任何您希望的 DNS 提供商。我建议为每条记录设置约 5 分钟的 TTL。 您现在可以1.example.com用作您的 DNS C2 域,例如generate --dns 1.example.com.(发出 DNS 命令时始终使用 FQDN)。 设计目标 当前 DNS C2 的实现主要是为“速度”(就 DNS 隧道而言)而不是隐身而设计的;它并不打算在使用 DNS 来传输数据时变得微妙。 这并不是说 DNS C2 没有用或会立即被检测到,因为通常没有人看到。 DNS C2 通过填充子域中的数据来工作,然后将对该子域的查询发送到权威名称服务器。

    1.4K00编辑于 2022-01-16
  • 来自专栏陆耀伟的专栏

    DNS故障对TDW影响评估及改进方案探索

    2. TDW 的架构图 绿线表示需要利用DNS解析,在下面的评估步骤依次断开对应节点的绿线,也就是对应节点不能访问DNS服务器来模拟DNS故障2. 整个 HDFS 集群出现 DNS 故障。 JobTracker 出现单点 DNS 故障。 TaskTracker 出现单点 DNS 故障。 整个计算引擎出现 DNS 故障。 Hive 服务器出现 DNS 故障。 PLClient 出现 DNS 故障。 DFSClient 出现 DNS 故障。 另外,根据 DNS 故障影响的情况,我们提出了以下的 DNS 改进方案 1.常规情况是使用 DNS 服务器进行解析; 2.当 DNS 服务器出现故障,使用 hosts 文件进行解析。

    2.7K00发布于 2016-09-27
  • 来自专栏张师傅的博客

    一次完整的 DNS 访问故障分析实录

    最近我们边缘集群服务遇到了一个 DNS 访问故障问题,现象是在边缘服务器上无法访问 DNS 服务器(10.7.0.1), 发出去的 DNS 请求包没有收到任何回应。 由于这是第一次遇到这种问题,因此我记录了详细的故障排查过程,让我们一起来看看是如何一步步逼近真相,找到问题根源的。 首先简单介绍一下我们的部署架构,这个 DNS 服务器(10.7.0.1)主要用来为我们的存储节点提供负载均衡服务。我们有 4 台存储服务器, 总容量达 2PB。 最后, 我们下线了这台虚拟机, 彻底修复了故障,至此破案。 小结 这次故障排查过程还是比较顺利的, 虽然中间编译 tcpdump 工具花了点时间。 期间用到的一些小技巧包括: 编译静态链接的 tcpdump 方便在受限环境排查 留意 ARP 表中记录的状态 适当运用「社会工程学」, 发动集体回忆 希望通过分享这个案例, 能给你一些故障排查思路上的启发

    51310编辑于 2024-06-19
  • 来自专栏herman的专栏

    DNS应从何谈起篇一---从Facebook的故障谈起

    导语 涉及DNS相关的概念词汇非常多,很多技术从业人员朗朗上口的比如于域名劫持,又或者运营商劫持,国内哪里哪里部署了根镜像,域名注册,域名备案,域名解析异常,DNS 放大攻击,随机子域名攻击,DNS故障了 ,DNS故障了等等等等。 思来想去,随着Facebook 六小时断网故障的发生,我想先从故障开始,通过多起故障了解DNS分层访问体系,待对DNS分层体系有了了解后,我们在一点点去填充里面的知识点; image.png 本篇文章的主角是图一的 故障二:20210405联通大网Tencent Auth 域名解析超时---见内部分享 故障三:域名解析异常导致腾讯新闻列表1小时打开失败---见内部分享 这里还有很多权威DNS故障,比如2016 日,Akamai DNS故障,导致Fnac、Amazon云服务等2w多个大型网站瘫痪;我们通过故障一Facebook的故障,看出AuthDNS对网络的依赖和DNS解析服务对业务的影响,我们通过故障二联通解析异常得出

    4.4K40编辑于 2021-12-28
  • 来自专栏python基础文章

    Windows server——部署DNS服务(2

    ---- (2)安装DNS服务器角色 项目例子:某公司新组建了一个内部局域网,需要一台DNS服务器为内部用户提供域名解析服务,如何搭建该DNS服务器? ---- 2.新建区域 安装完DNS服务器角色后,接下来需要新建区域。 ---- (1)打开DNS管理器控制台. (2)在DNS管理器控制台中,右击服务器名称,在弹出的快捷菜单中选择“新建区域”.在“欢 迎使用新建区域向导”对话框中,单击“下一步”按钮。 DNS上常用的资源记录及说明如表2-3所示。 (2)创建资源记录  1)创建主机记录 假设有一台计算机的FODN为www.wangluodou.com.IP地址是192.168.1.12。 2)创建别名记录 新建别名记录的方法如下 (1)在“DNS管理器”窗口中展开节点树,右击“正向查找区域”下的“wangluodou.com”,在弹出的快 捷菜单中选择“新建别名”  (2)在“新建资源记录

    5.4K50编辑于 2023-10-15
  • 来自专栏kayden

    内网隧道之dns2tcp

    ---- 内网隧道之dns2tcp 前言 本文研究DNS隧道的一个工具,dns2tcp github:https://github.com/alex-sector/dns2tcp 一、概述 1、简介 最后更新于 采用直连,但速度不是特别乐观,优势在于kali直接集成了这个工具,部分linux发行版也都可以直接通过包工具下载,相对方便 利用合法DNS服务器实现DNS隧道 C/S(dns2tcpc 2、原理 DNS原理见:一文搞明白DNS与域名解析 本工具就是将数据放在TXT记录里base64加密后传输,DNS数据包通过权威DNS服务器提供的NS记录和A记录到服务端的DNS服务器,完成流量代理 (1 | 2 |3 ) (1)服务端 修改/etc/dns2tcpd.conf配置文件 建立隧道dns2tcpd -F -d 1 -f /etc/dns2tcpd.conf (2)客户端 测试是否可连 :dns2tcpc -z xxx.xx.xxx 建立隧道使用ssh服务:dns2tcpc -c -k password -d 1 -l 7002 -r ssh -z xxx.xx.xxx 然后将对应服务扔进本地设定的端口

    2.5K30编辑于 2022-09-29
  • 来自专栏张师傅的博客

    一次有趣的 DNS 导致 Node 服务故障问题分析实录

    DNS 问题分析 于是转向抓取 DNS 的包,很快得到失望的结果,seewo-xxx.uc-all 域名的 DNS 的请求也没有发起。 static unsigned int slow_work_thread_threshold(void) { return (nthreads + 1) / 2; // (4+1)/2=2 } 当 0x00007fd5105e8f62 in __res_context_send () from /lib64/libresolv.so.2 #2 0x00007fd5105e6394 in __ /lib64/libresolv.so.2 #4 0x00007fd5181ecf09 in _nss_dns_gethostbyname4_r () from /lib64/libnss_dns.so 那是不是这个域名的请求,一直没有正确结果的返回,导致占满了 SlowIO 的 2 个线程呢?

    1.1K30编辑于 2022-12-05
  • 来自专栏爱生活爱编程

    通过Wireshark和arthas排查由DNS引发的Ignite生产故障案例

    通过Wireshark和arthas排查由DNS引发的Ignite生产故障案例 故障背景 故障分析 第一次定位问题 跨架构假设 生产重现故障 Wireshark抓包分析 客户端10秒超时源码跟踪 结合日志查看服务端卡点 故障分析 由于开发人员log4j2日志配置不对,导致生产上没有看到错误日志 目前从维护人员得到的信息来看,猜测可能有2个原因导致故障: 1、跨架构导致故障,因为客户端x86架构,服务端power架构 2、网络问题导致故障,怀疑是跨中心,跨了网段导致故障 第一次定位问题 跨架构假设 针对第一点的假设,通过并行环境模拟,模拟不出故障,因此只能到生产环境重现故障,再做下一步定位。 生产重现故障 修改log4j2日志,得到报错信息(以下是后续本地环境模拟的,报错内容和生产一致): 服务端节点错误: [2021-11-25T18:13:28,887][ERROR][tcp-disco-sock-reader timeout:5 attempts:3 rotate 超时时间5秒,重试次数为3 总结:这次引起bug的原因有2个,一是power服务端节点遗漏配置x86客户端的hostname,二是维护开启DNS

    3.4K20编辑于 2021-12-08
  • 来自专栏腾讯云 DNSPod 团队

    DNS故障:26日上午网易等多家网站无法访问“剖析”

    3月26日上午,DNSPod技术人员发现,目前北京联通递归DNS 202.106.46.151/202.106.0.20/210.51.176.71等多个IP出现时断时续的故障,经测试使用这些递归DNS 网络上搜索DNS故障,众多网友反馈,包括CCTV、凤凰网、网易等多家知名网站出现大规模访问故障故障原因猜测 DNSPod技术人员表示,出现问题的原因是在域名请求对应的IP地址过程中,递归DNS处在一个桥梁的过程中,当递归出现故障,请求将无法顺利完成,因此出现网站无法打开现象。 详情如下图显示: 故障如何应对? 作为普通用户,如何应对这次故障呢? 2、找到更改适配器设置按钮,出现本地连接,点击属性,更改网络连接的TCP/IP V4属性即可。

    2.5K20编辑于 2023-05-07
  • 来自专栏PostgreSQL研究与原理解析

    PG复制和自动故障转移--2

    PostgreSQL 复制和故障转移设置 该设置由两台通过 LAN 连接的 CentOS 7 机器组成,其中安装了 PostgreSQL 版本 10.7。 postgres=# select * from abc; a | b ---+------- 1 | One 2 | Two 3 | Three (3 rows) PostgreSQL 手动故障转移步骤是什么 使用 EDB Postgres Failover Manager (EFM) 可以轻松设置自动故障转移。 PostgreSQL 的 repmgr 另一个开源工具是 repmgr(复制管理器),它还管理 PostgreSQL 集群的复制和故障转移。 正确配置后,repmgr 可以检测主服务器何时发生故障并执行自动故障转移: https://www.enterprisedb.com/postgres-tutorials/how-implement-repmgr-postgresql-automatic-failover

    98010编辑于 2022-04-28
  • 来自专栏云头条

    Akamai DNS 全球性故障:众多知名网站和在线服务随之瘫痪!

    该公司在Edge DNS服务事件通告中表示:“我们已意识到Edge DNS服务出现了问题。” “我们正在积极调查问题。如果您因该问题而有疑问或受到影响,请联系Akamai技术支持部门。” 据Akamai声称,Edge DNS是其基于云的权威DNS解决方案,旨在提供24/7全天候不间断的DNS可用性,并提高DNS响应能力。 Akamai表示,故障不是网络攻击造成的。 Akamai现在披露,这次全球性故障的原因是“软件配置更新触发了DNS系统中的一个bug。” “今天15点46分,软件配置更新触发了DNS系统中的bug,该系统负责将浏览器引导到各个网站。这导致了故障,从而影响了一些客户网站的可用性。” “故障持续长达一个小时。 我们正在审核软件更新流程,以防将来出现故障。”

    83910编辑于 2022-03-18
  • 来自专栏Linux、云计算技术交流

    第六章 DNS服务(2

    第六章 DNS服务(2) 6.5 DNS轮询 DNS服务器的区域文件中也支持同一域名对应多个ip,则在解析时,客户端可获得不同排序的多个ip,从而在DNS上实现对服务器其的负载均衡功能,被称为轮询功能 forwarder{ ip1; ip2; }; ---也可以设置多个DNS服务器,有主有备 systemctl restart named ---启动服务 systemctl enable named 既然建立辅助DNS的目的是当主DNS不可用时,辅助DNS可完成区域解析。 no; 写入: allow-transfer{ 192.168.10.2; }; ---指定允许给谁做区域复制的传输 systemctl restart named 2、辅助DNS 2)主DNS发生数据变化后,必须手动提升serial序列号(即serial数字+1即可)后,主辅更新时才会更新到辅DNS上。

    3.6K20发布于 2019-07-04
  • 来自专栏后端开发

    一次 default deny 把 DNS、metrics 统统挡掉的真实故障复盘

    文章根据我在公司实际运维时处理过的一个真实故障写作,给出可复现实验、真实报错与日志、定位路径、可运行的修复策略,以及上线时容易遗漏的策略清单。 阿里云 ACK 的 DNS 故障文档则系统性地罗列了常见客户端报错与可能的网络策略成因,包括 curl: (6) Could not resolve host、dial tcp: lookup ...: name: default-deny-all namespace: prodspec: podSelector: {} policyTypes: ['Ingress','Egress']---# 2) kubernetes.default.svc.cluster.local || true'kubectl -n prod exec -it netshoot -- sh -c 'curl -sS https://www.google.com || true'# 2) ACK DNS 故障页(系统性罗列 curl、dig、Go 客户端错误示例与成因,包括 i/o timeout、no such host。

    44410编辑于 2025-09-30
  • 来自专栏腾讯云 DNSPod 团队

    首席架构师深度解读:从 Facebook 故障DNS 控制面异常处理

    控制面故障影响范围分类 按照影响 DNS 节点范围和处理方式来区分控制面故障的类型,主要就是两种类型,部分节点受影响和全部节点受影响。 01.部分节点受影响 这里可能有多种原因,最常见的如 DNS 节点与控制中心之间的网络异常,或者部分控制中心从节点故障,只影响少部分边缘的 DNS 节点的控制面数据同步,那么这时候故障 DNS 节点自救做自我剔除 02.全部节点受影响 这里最大的可能原因是控制中心节点故障,如控制中心主节点宕机,或者网络故障导致所有从节点数据同步落后,此时如果故障 DNS 节点还进行自我剔除,所有 DNS 节点“集体自杀”了,后果严重 故障 DNS 节点能做的是告警、尝试切换寻找正常的控制节点等操作,很多时候故障节点已经可以自动恢复,比如单独某个控制从节点故障自动切换即可恢复。 控制面故障处理: 接下来就需要对控制面故障DNS 节点进行处理,此处可以有多种处理方式,自动或手动,DNSPod 目前主要还是手动处理,主要由以下几个原因: 目前外部的监控节点对 DNS 服务器做的是完全黑盒拨测

    1.7K20编辑于 2023-04-17
  • 来自专栏世民谈云计算

    理解OpenShift(2):网络之 DNS(域名服务)

    1.2 Pod 所在宿主机上的 DNS 配置及服务 1.2.1 resolv.conf 文件 [root@node2 cloud-user]# cat /etc/resolv.conf # nameserver 其中有两个配置文件(具体含义请查阅有关文档): [root@node2 dnsmasq.d]# cat origin-dns.conf no-resolv domain-needed no-negcache =lo # End of config 文件 origin-upstream-dns.conf 中定义了上游(upstream) DNS 名字服务器: [root@node2 dnsmasq.d]# cat 2. DNS 查询流程 2.1 pod 内的应用通过域名访问外网服务器的DNS查询流程 流程示意图如最上面图中的 1 和 2.1 部分所示。 而这个 FQDN 被直接做DNS查询,结果查询失败,未能获取IP地址: [root@node2 cloud-user]# nsenter -t 4216 -n ping mybank.dev.svc.ping

    3.5K10发布于 2019-06-28
  • 来自专栏hotarugaliの技术分享

    DNS污染和DNS劫持

    DNS 污染 DNS 污染又称 DNS 缓存投毒,通过制造一些虚假的域名服务器数据包,将域名指向不正确的 IP 地址。 解决办法 绕过被污染的非权威 DNS 服务器,直接访问干净的公共 DNS 服务器。 在本机直接绑定 hosts,绕过 DNS 解析过程。 (该方法也可以绕过 IP 黑名单机制) 2. DNS 劫持 DNS 劫持指 DNS 服务器被控制,用户查询 DNS 时,服务器直接返回它想让你看到的结果(转到劫持者指定的网站)。 附录 公共 DNS 公共 DNS 是一种面向大众的免费的 DNS 互联网基础服务,更换主机 DNS 服务器地址为公共 DNS 后,可以在一定程度加速域名解析、防止 DNS 劫持、加强上网安全,还可以屏蔽大多数运营商的广告 常用公共 DNS 服务器地址如下: 名称 DNS 服务器 IP 地址 OpenerDNS 42.120.21.30 阿里 AliDNS 223.5.5.5223.6.6.6 V2EX DNS 199.91.73.222178.79.131.110

    16.4K21编辑于 2022-02-28
  • 来自专栏程序员

    DNS

    DNS服务器解析域名的过程如下所示: ? 本地DNS服务器:严格来讲,它不属于DNS体系。事实上,每台主机都需要配置一个本地DNS服务器才能正常上网。 当主机发出DNS请求的时候,该请求被本地DNS服务器处理。本地DNS服务器实际上作为一个转发功能存在。 DNS递归查询 DNS递归查询是将域名解析的负担交给被查询的DNS服务器来完成的。 在这个过程中,DNS服务器只告诉你该去哪个IP地址继续查询。这就大大降低了DNS服务器的负担。 ? 实际上,我们每次的DNS查询并不一定都是权威DNS服务器处理的,大多数可能是本地DNS服务器处理的。 DNS的安全问题 DNS负责全球的域名解析服务,这非常重要,因此,DNS的安全也是非常重要的。 DNS病毒 一般影响我们个人用户的DNS攻击有篡改host文件,DNS污染,DNS劫持。

    12.2K21发布于 2019-05-25
领券