在 Linux 上安装 Kube AI Hub
本章演示如何使用 KubeKey 在不同环境的 Linux 上预配置生产就绪的 Kubernetes 和 Kube AI Hub 集群。 您还可以使用 KubeKey 轻松扩展和缩小集群,并根据需要设置各种存储类。
简介
概述
浏览本章的概述,包括安装准备,安装工具和方法以及存储设置。
KubeKey
了解 KubeKey 概念以及 KubeKey 如何帮您创建、扩缩和升级 Kubernetes 集群。
多节点安装
了解在多节点集群上安装 Kube AI Hub 和 Kubernetes 的一般步骤。
离线安装
了解如何在离线环境下安装 Kube AI Hub 和 Kubernetes。
端口要求
了解 Kube AI Hub 中不同服务的特定端口要求。
Kubernetes 集群配置
在集群的配置文件中设置 Kubernetes 自定义配置。
时间同步
在安装 Kubernetes 前统一所有节点时区并配置时间同步服务,避免集群运行时出现节点间时钟偏移导致 ServiceAccount token 401、证书验证失败等问题。
安装显卡驱动
在 Linux 上为 Kube AI Hub 集群 GPU/NPU 节点安装显卡驱动与容器 runtime 的概述与指引。
英伟达 (NVIDIA)
在 Linux GPU 节点上安装 NVIDIA 显卡驱动、NVIDIA Container Toolkit 及容器 runtime 配置。
华为昇腾 (Ascend)
在 Linux NPU 节点上安装华为昇腾驱动、固件及 Ascend Docker Runtime。
高可用配置
使用 KubeKey 内置 HAproxy 创建高可用集群
如何使用 KubeKey 内置的 HAproxy 安装一个高可用的 Kube AI Hub 与 Kubernetes 集群。
使用负载均衡器创建高可用集群
如何配置一个高可用 Kubernetes 集群。
使用 Keepalived 和 HAproxy 创建高可用集群
如何使用 Keepalived 和 HAproxy 配置高可用 Kubernetes 集群。
持久化存储配置
安装持久化存储
理解持久化存储。
安装 QingCloud CSI
使用 KubeKey 搭建 Kube AI Hub 集群并配置 QingCloud CSI 存储。
安装 NFS Client
使用 KubeKey 搭建 Kube AI Hub 集群并配置 NFS 存储。
安装 GlusterFS
使用 KubeKey 搭建 Kube AI Hub 集群并配置 GlusterFS 存储。
安装 Ceph
如何创建一个使用 Ceph 提供存储服务的 Kube AI Hub 集群。
在公共云上安装
Kube AI Hub 在华为云 ECS 高可用实例
了解如何在华为云虚拟机上创建高可用的 Kube AI Hub 集群。
Kube AI Hub 在阿里云 ECS 高可用实例
了解如何在阿里云虚拟机上创建高可用的 Kube AI Hub 集群。
在 Azure VM 实例上部署 Kube AI Hub
了解如何在 Azure 虚拟机上创建高可用 Kube AI Hub 集群。
在青云QingCloud 主机上部署 Kube AI Hub
了解如何在青云QingCloud 平台上创建高可用 Kube AI Hub 集群。
在 Hostinger VPS 上安装使用 Kube AI Hub
了解如何使用 Kube AI Hub VPS 模板。
在本地环境中安装
在 VMware vSphere 安装 Kube AI Hub
了解如何在 VMware vSphere 上创建高可用 Kube AI Hub 集群。
在裸机上安装 Kube AI Hub
了解如何在裸机上部署一个单 master 的多节点 Kube AI Hub 集群。
部署 K3s 和 Kube AI Hub
了解如何使用 KubeKey 安装 K3s 和 Kube AI Hub。
添加或删除节点
添加新节点
添加更多节点以扩展集群。
删除节点
停止调度节点,或者删除节点以缩小集群规模。
添加边缘节点
将边缘节点添加到集群。
卸载 Kube AI Hub 和 Kubernetes
从机器上移除 Kube AI Hub 和 Kubernetes。