RKE2离线安装K8S集群

目录

 

架构概览

技术栈

  • Kubernetes 发行版: RKE2 v1.31.4
  • 容器运行时: containerd (RKE2 内置)
  • 网络插件: Cilium CNI (启用 kube-proxy 替换)
  • Ingress 控制器: Nginx Ingress
  • 管理平台: Rancher 2.12.2
  • 证书管理: cert-manager v1.18.2

 

集群架构

 

环境准备

硬件要求

Server 节点 (Master)

资源 最低配置 推荐配置
CPU 2 核 4 核
内存 4 GB 8 GB
磁盘 50 GB 100 GB
网络 1 Gbps 10 Gbps

 

Agent 节点 (Worker)

资源 最低配置 推荐配置
CPU 2 核 8 核
内存 4 GB 16 GB
磁盘 50 GB 200 GB
网络 1 Gbps 10 Gbps

 

操作系统要求

  • 支持的系统: RHEL/CentOS 7/8/9, Ubuntu 20.04/22.04
  • 内核版本: >= 4.18
  • SELinux: Permissive 或 Disabled
  • 防火墙: 配置或禁用

 

节点规划示例

角色 主机名 IP 地址 说明
Server k8s-server-1 192.168.1.10 Master 节点
Agent k8s-node-1 192.168.1.11 Worker 节点 1
Agent k8s-node-2 192.168.1.12 Worker 节点 2 (可选)

 

网络规划

 

必需端口

Server 节点

端口 协议 用途
6443 TCP Kubernetes API
9345 TCP RKE2 Agent 通信
2379-2380 TCP etcd (Server 间)
10250 TCP kubelet
80, 443 TCP Ingress

 

Agent 节点

端口 协议 用途
10250 TCP kubelet
30000-32767 TCP NodePort 服务

 

安装 RKE2 集群

第一步:准备离线安装文件

在有网络的环境中下载以下文件:

将所有文件传输到离线环境的 /data/rke2-artifacts/ 目录。

 

第二步:安装 Server 节点

1. 创建目录结构

 

2. 复制镜像文件

 

3. 安装 RKE2

 

4. 创建配置文件

 

5. 配置镜像仓库(如使用私有仓库)

 

6. 配置 Nginx Ingress

 

7. 启动 RKE2

 

8. 配置 kubectl

 

9. 验证 Server 节点

 

10. 获取 Agent 加入 Token

 

第三步:安装 Agent 节点

1. 准备 Agent 节点

 

2. 安装 RKE2 Agent

 

3. 创建配置文件

 

4. 配置镜像仓库(同 Server 节点)

 

5. 启动 Agent

 

6. 验证节点加入

在 Server 节点上执行:

 

第四步:等待集群完全就绪

 

安装 Rancher

第一步:安装 Helm

 

第二步:安装 cert-manager

 

第三步:安装 Rancher

 

第四步:配置 Ingress

 

验证和访问

配置 DNS 或 Hosts

在客户端机器的 /etc/hosts 文件中添加:

 

访问 Rancher

在浏览器中打开:

初始登录:

  • 用户名:admin
  • 密码:admin(首次登录需要修改)

 

验证集群状态

登录 Rancher 后,检查:

  1. 集群状态:应显示为 Active
  2. 节点列表:所有节点应为 Active 状态
  3. 系统组件:所有组件应为 Healthy

 

常见问题

1. Pod 无法启动 – 镜像拉取失败

问题ImagePullBackOff 错误

解决方案

 

2. Agent 节点无法加入

问题:Agent 无法连接到 Server

排查步骤

 

3. Rancher 无法访问

问题:浏览器无法访问 Rancher

排查步骤

 

4. Cilium 网络问题

问题:Pod 之间无法通信

解决方案

 

最佳实践

1. 高可用部署

生产环境建议:

  • Server 节点:至少 3 个(奇数)
  • Agent 节点:至少 2 个
  • 负载均衡:为 Server 节点配置 LB

 

2. 数据备份

定期备份关键数据:

 

3. 监控告警

建议安装:

  • Prometheus:监控指标收集
  • Grafana:可视化展示
  • AlertManager:告警通知

 

4. 日志管理

配置日志轮转:

 

5. 安全加固

  • 定期更新系统和组件
  • 使用强密码和密钥认证
  • 启用 RBAC 和网络策略
  • 配置审计日志

 

6. 资源隔离

使用 Longhorn 时,避免在 Master 节点运行:

 

总结

本文介绍了 RKE2 和 Rancher 的完整离线安装流程,主要步骤包括:

  1. ✅ 准备离线安装文件
  2. ✅ 安装 RKE2 Server 节点
  3. ✅ 添加 RKE2 Agent 节点
  4. ✅ 等待集群就绪
  5. ✅ 安装 Helm 和 cert-manager
  6. ✅ 安装 Rancher 管理平台
  7. ✅ 验证和访问

通过本指南,您应该能够在离线环境中成功部署一个生产级别的 Kubernetes 集群和 Rancher 管理平台。

 

参考资源

 

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注