Commit Graph

933 Commits

Author SHA1 Message Date
data-infra
9d4c474623 修正sso登录 2023-12-16 20:59:49 +08:00
data-infra
8b654c058e 修正部署中gpu占用问题 2023-12-16 20:48:34 +08:00
data-infra
4f3d28e5af 更新中英文 2023-12-16 20:48:06 +08:00
data-infra
525816f33e 去除非必要模板参数说明 2023-12-16 20:47:24 +08:00
data-infra
340e19b911 更新部署文档说明 2023-12-16 20:47:04 +08:00
data-infra
21d699dff5 升级nni镜像到cubda 11.8 2023-12-16 20:46:23 +08:00
data-infra
3e16f633b8 修正vgpu设备显示 2023-12-11 20:36:02 +08:00
data-infra
bb3f234574 支持中英文国际化,接口监控 2023-12-11 13:26:00 +08:00
data-infra
71ba9296de 支持中英文国际化 2023-12-11 13:25:07 +08:00
data-infra
37c0d9ad70 支持中英文国际化 2023-12-11 13:23:35 +08:00
data-infra
3abd7c17ec 总体资源界面变更 2023-12-11 13:20:43 +08:00
data-infra
ad883a5312 支持rdma 2023-12-11 13:18:43 +08:00
data-infra
d76158203b worker日志logging打印 2023-12-11 13:18:24 +08:00
data-infra
cb95b9520d 支持国家化 2023-12-11 13:17:26 +08:00
data-infra
f9579fb855 去除非必要翻译文件 2023-12-11 13:16:54 +08:00
data-infra
d6c0dbe4c2 增加国际化能力和rdma 2023-12-11 13:16:33 +08:00
data-infra
fdd2739c66 初始化脚本目录变更 2023-12-11 10:00:49 +08:00
data-infra
1047044b21 数据库结构添加注释描述 2023-12-11 10:00:26 +08:00
data-infra
fdd5afd848 添加初始化示例 2023-12-11 09:59:38 +08:00
data-infra
899bd41538 添加测试示例 2023-12-11 09:59:16 +08:00
data-infra
1e370ddd8b 丰富原有部分模板的可接收参数,去除不使用的模板 2023-12-11 09:58:45 +08:00
data-infra
55fe077689 去除framworker依赖 2023-12-10 20:01:38 +08:00
data-infra
147130afc2 新增数据库结构 2023-12-10 19:56:14 +08:00
data-infra
803e9b06ae 新增rdma和国际化 2023-12-10 19:55:49 +08:00
data-infra
20dafda519 修正部署脚本 2023-12-10 19:53:44 +08:00
data-infra
2a9d6fe976 修正rancher部署 2023-12-10 19:52:59 +08:00
data-infra
b8ca0f90cf 修正gpu利用率和占用率监控 2023-12-10 19:52:46 +08:00
data-infra
e438dc681d 去除非必要的部署限制 2023-12-10 19:52:01 +08:00
data-infra
c67717cc12 修改部署istio ingressgateway部署方式为nodeport 2023-12-10 19:51:05 +08:00
data-infra
c1578dd5c7 完善gpu部署监控采集和gpu机器部署流程 2023-12-10 19:50:35 +08:00
data-infra
5fa24a9baa 去除framework依赖 2023-12-10 19:49:39 +08:00
data-infra
dbd217eae0 去除config文件中非必要描述 2023-12-10 19:49:27 +08:00
data-infra
075477414f 全面升级基础环境python包版本 2023-12-10 19:49:10 +08:00
data-infra
8861208aab 丰富初始化部署脚本 2023-12-10 19:48:37 +08:00
data-infra
c2e13da815 去除多余ubuntu gpu镜像 2023-12-10 19:47:21 +08:00
data-infra
b74175b559 去除多余jupyter镜像 2023-12-10 19:47:10 +08:00
data-infra
11c1249611 删除没必要文档 2023-12-10 19:45:51 +08:00
data-infra
71d6ffc3ed 修正aihub图片 2023-12-10 19:45:41 +08:00
栾鹏
b9495fcb34
Update README_CN.md 2023-11-12 08:52:55 +08:00
栾鹏
cbeb7e126f
Update readme.md 2023-11-12 08:34:11 +08:00
栾鹏
fc19827978
Update NFS离线部署.md 2023-11-12 08:33:15 +08:00
栾鹏
b9a1caeafa
Create install_docker.md 2023-11-12 08:27:09 +08:00
chendile
f9615372ea 去除非必要pv 2023-10-16 14:19:33 +08:00
chendile
7709687524 覆盖基础类上传下载函数 2023-10-16 10:48:17 +08:00
chendile
e7c278938b 修正编码问题 2023-09-22 14:28:34 +08:00
chendile
c23d0ad354 修正飞浆多机多卡训练 2023-09-19 13:44:45 +08:00
chendile
ffbf9027c4 修正飞浆多机多卡训练 2023-09-19 13:24:50 +08:00
chendile
d5bc83751b 修正8s 日志打印级别 2023-09-19 10:32:25 +08:00
chendile
e55b3a0b10 修正错别字错误 2023-09-19 10:28:45 +08:00
chendile
97e3831517 修正命名错误 2023-09-19 10:27:42 +08:00