update deploy

This commit is contained in:
pengluan 2022-05-18 20:40:26 +08:00
parent 0c8fb976bf
commit 7154031051
3 changed files with 43 additions and 6 deletions

View File

@ -9,6 +9,44 @@
- 3、基础能力(tf/pytorch/mxnet/valcano/ray等分布式nni/katib超参搜索)
- 4、平台web部分(oa/权限/项目组、在线构建镜像、在线开发、pipeline拖拉拽、超参搜索、推理服务管理等)
# 组件说明
| 命名空间 | 组件名 | 组件说明 |
| :-----| :---- | :---- |
| infra | kubeflow-dashboard | cube-studio平台的web前后端 |
| infra | kubeflow-dashboard-init | cube-studio平台初始化任务用来创建数据库初始化表和记录 |
| infra | kubeflow-dashboard-schedule | 用来调度cube-studio系统自带的调度任务比如定时清理 |
| infra | kubeflow-dashboard-worker | 用来执行cube-studio系统自带的调度任务比如定时清理 |
| infra | kubeflow-watch | 用来监控cube-studio平台中的任务发起通知和信息更新 |
| infra | mysql | 平台元数据的存储 |
| infra | redis | 平台缓存,和异步任务对接 |
| kube-system | kubernetes-dashboard-cluster | k8s中pod的管理界面 |
| kube-system | dashboard-cluster-metrics-scraper | k8s中pod的管理界面上的pod资源使用情况的插件 |
| kube-system | nvidia-device-plugin-daemonset | k8s中使用机器gpu驱动和设备的插件 |
| kube-system | kube-batch | 批调度插件在同时调度多个pod时必须要同时满足所有pod资源需求才进行调度的组件 |
| kube-system | metrics-server | 集群资源使用情况的指标采集用来在hpa时使用 |
| kube-system | kubeflow-prometheus-adapter | 用来将prometheus采集的指标转化为可以用来控制hpa的指标 |
| kubeflow | frameworkcontroller | nni超参搜索需要的分布式组件 |
| kubeflow | metadata-* 和 ml-pipeline-* | pipeline跟踪调试组件 |
| kubeflow | minio | 对象存储 |
| kubeflow | mpi-operator | mpi分布式训练 |
| kubeflow | mxnet-operator | mxnet分布式训练 |
| kubeflow | pytorch-operator | pytorch分布式训练 |
| kubeflow | tf-job-operator | tf分布式训练 |
| kubeflow | workflow-controller | argo 云原生调度 |
| istio-system | istio-ingressgateway | 入口网关,用来代理所有外部访问 |
| istio-system | cluster-local-gateway | 入口网关,用来代理所有内部访问 |
| istio-system | 其他 | istio基础组件 |
| monitoring | dcgm-exporter | gpu机器资源监控 |
| monitoring | node-exporter | cpu机器资源监控 |
| monitoring | prometheus-k8s | 监控数据存储服务 |
| monitoring | grafana | 监控数据可视化 |
| volcano-system | 全部 | volcano分布式和批调度 |
| jupyter | docker-* | 用户创建的在线构建镜像的pod |
| jupyter | 其他 | 用户创建的在线notebook |
| service | 全部 | 用户创建的内部服务和推理服务 |
| pipeline | 全部 | 用户创建的pipeline任务 |
# 平台部署流程
@ -36,4 +74,3 @@
参考install/docker/README.md

View File

@ -6,10 +6,10 @@
# 单机测试
在单机上将k8s的kubeconfig文件保存为
cube-studio/install/kubernetes/config
cube-studio/install/kubernetes/config下面的命令换成自己的机器ip
```
cd cube-studio/install/kubernetes/
sh start.sh
sh start.sh xx.xx.xx.xx
```
[单机部署参考视频](https://www.bilibili.com/video/BV18r4y147oj/)

View File

@ -160,11 +160,11 @@ kubectl apply -f virtual.yaml
# 配置入口
ip=`ifconfig eth1 | grep 'inet '| awk '{print $2}' | head -n 1`
kubectl patch svc istio-ingressgateway -n istio-system -p '{"spec":{"externalIPs":["'"${ip}"'"]}}'
#ip=`ifconfig eth1 | grep 'inet '| awk '{print $2}' | head -n 1`
kubectl patch svc istio-ingressgateway -n istio-system -p '{"spec":{"externalIPs":["'"$1"'"]}}'
# 本地电脑手动host
echo "打开网址http://xx.xx.xx.xx"
echo "打开网址http://$1"