
本文约 1700+ 字,阅读约需 8 分钟
你将学到:

在前几篇文章中,我们已经完成了:
看起来已经很完整了,对吧?
👉 但有一个问题逐渐浮现:
❗ 整个环境是跑在 Workstation 里的
简单说一句个人感受:
Workstation 更适合快速验证,在走向“更稳定可用”的路上,可能会遇到一些限制
常见情况:
👉 这让我开始思考:
学到的是“实验技巧”,还是更接近“实际落地”的能力?

这一步是我个人认知的一个提升👇
很多人(包括以前的我)会以为 vCenter 只是“高级版 Workstation”
实际上它可以被理解为:
一套面向企业级虚拟化资源调度的管理平台

👉 这一点我个人比较在意:
很多企业的 K8s 运行在虚拟化平台(VMware / OpenStack)上,提前接触这些,对后续理解生产环境会有帮助
一开始我也想过:
❌ “是不是要重装一套?”
👉 后来我的做法是:
❗ 不直接重装,而是借助这次机会做一次“架构层面的调整”
Workstation(快速验证) → vCenter(更接近准生产形态)
不是简单复制,而是重新梳理架构👇
我使用的配置参考:
Master:
- 2C / 4G
Node:
- 4C / 8G(根据实际情况可调整)
磁盘:
- 系统盘 + 独立数据盘(为 Longhorn 做准备)
在本公众号内回复【安装脚本】获取一键安装脚本。
原因:

👉 这一步对我来说不是“重复操作”,而是:
在更接近生产的环境里,重新理解每个组件的作用和配置方式
这部分可能对同样在尝试迁移的朋友有些参考价值👇
现象:
Prometheus 无数据 / Grafana No Data
可能原因:
虚拟机时间不一致
解决方法:
timedatectl set-ntp true
👉 如果 Longhorn 和系统盘共用同一块磁盘:
可能会出现:
👉 个人建议:
为 Node 节点单独添加期望数量的数据盘,让存储与系统分离
可能原因:
👉 排查方式:
curl 节点IP:NodePort
根据返回结果逐步定位网络链路
👉 Grafana / Prometheus 在数据量上来后对资源有一定要求
个人建议:
根据实际监控规模,适当预留内存资源(例如整个集群不低于 8G 作为起步参考)
有些人可能会觉得:
“换个平台,有必要这么折腾吗?”
但对我个人而言,这次调整带来的变化是👇
👉 特别是当你已经做到:
❗ 下一步自然会想到:
我们下一篇计划做👇
内容包括:
👉 目标:
“系统出现异常 → 能通过告警及时感知”
Workstation 是很好的起点,vCenter 让我离“可落地”更近了一步

目前已完成:
👉 下一步:
告警系统,向更完整的可观测性再迈一步