change CONTRIBUTING

This commit is contained in:
pengluan 2023-04-06 22:39:43 +08:00
parent 0d4dae903a
commit 1ebc8f5d32

View File

@ -1,6 +1,5 @@
![image](https://user-images.githubusercontent.com/20157705/204804498-57b85892-88db-4edb-b595-3655e462f042.png) ![image](https://user-images.githubusercontent.com/20157705/204804498-57b85892-88db-4edb-b595-3655e462f042.png)
# 思维导图: # 思维导图:
[思维导图地址](https://gitmind.cn/app/docs/ma28m6np) [思维导图地址](https://gitmind.cn/app/docs/ma28m6np)
@ -9,167 +8,144 @@
登录授权: 登录授权:
- 多种登录方式的示例,~~账号密码github~~ 微信登录AUTH_OID(支持)AUTH_LDAP(支持)AUTH_REMOTE_USER(支持)缺少示例 - 多种登录方式的示例,
- [x] 账号密码,
- [x] github
- [x] 微信登录,
- [x] AUTH_OID(支持)
- [x] AUTH_LDAP(支持)
- [x] AUTH_REMOTE_USER(支持)
- ~~多租户rbac权限管理项目管理~~ - 多租户
- [x] rbac权限管理
- [x] 项目管理
数据平台: 数据平台:
- 数据接入模块支持http/cos/..等离线接口支持kafka/pulsar..等实时接口支持源或者目的hiveckdruid等模块缺少 - 离线元数据: 通过统一sql多模引擎实现离线元数据同步实时元数据查询sql操作ddl操作等
- 离线元数据: - [x] 支持仅管理离线元数据
- ~~支持仅管理离线元数据~~ - [ ] 定时脚本将远程数据库元数据同步到离线元数据内(比如离线同步hive元数据到元数据模块),支持离线元数据模块操作ddl远程数据库(比如增减hive列)
- 定时脚本将远程数据库元数据同步到离线元数据内(比如离线同步hive元数据到元数据模块),支持离线元数据模块操作ddl远程数据库(比如增减hive列) - [x] 实时查询远程元数据并支持实时ddl远程数据库。
- 实时查询远程元数据并支持实时ddl远程数据库。 - [ ] 离线/实时管理元数据支持hive/clickhouse/mysql/pg/druid等数据库类型
- 离线/实时管理支持hive/clickhouse/mysql/pg/druid等数据库类型
- 血缘关系: - 血缘关系:
- 支持表+任务+看板+字段+指标+特征,之间的血缘链路关联,支持离线导入血缘链路管理,前端进行可视化展示 - [ ] 支持表+任务+看板+字段+指标+特征,之间的血缘链路关联,支持离线导入血缘链路管理,前端进行可视化展示
- ~~指标管理~~ - 指标管理
- ~~维表管理: 支持mysql/postgresql作为维表数据库~~ - [x] 指标元数据管理
- sql查询引擎 - 维表管理:
- 支持ck hiveimpalaprestodruid等统一查询引擎 - [x] 支持mysql/postgresql作为维表数据库
- ~~支持多任务查询记录统一sql解析拦截异步查询提供标准sql查询基础类~~ - sql查询引擎 通过统一sql多模引擎实现离线元数据同步实时元数据查询sql操作ddl操作等
- 数据ETL - [x] 支持ck hiveimpalaprestodruid等统一查询引擎
- ~~提供标准 任务编排,任务管理模块,任务实例,任务成功率~~ - [x] 支持多任务查询记录统一sql解析拦截异步查询提供标准sql查询基础类
- 支持airflowdsaz调度器 - 数据ETL 通过pipeline编排能力统一对接
- [x] 提供标准 任务编排,任务管理模块,任务实例,任务成功率
- [ ] 支持airflowdsaz调度器
- 推送: - 推送:
- 封装推送功能模块:支持邮件,企业微信,钉钉等推送方式 - [ ] 封装推送功能模块:支持邮件,企业微信,钉钉等推送方式
- 支持文本图片html等推送模式 - [ ] 支持文本图片html等推送模式
AI平台 AI平台
- notebook - notebook
- ~~支持基础vscode/jupyter开发环境支持ssh等功能~~ - [x] 支持基础vscode/jupyter开发环境支持ssh等功能
- ~~大数据版本,数据挖掘版本,深度学习版本~~ - [x] 大数据版本,数据挖掘版本,深度学习版本
- 添加使用示例比如sparksql/impala/presto/clickhouse/mysql/postgresql等分析建模示例 - [ ] 添加使用示例比如sparksql/impala/presto/clickhouse/mysql/postgresql等分析建模示例
- 添加flink实时分析示例 - [ ] 添加flink实时分析示例
- 添加百G大数据单机数据分析能力Arrow、vaex、duckdb等数据分析能力 - [ ] 添加百G大数据单机数据分析能力Arrow、vaex、duckdb等数据分析能力
- 镜像仓库管理: - 镜像仓库管理:
- ~~仓库管理~~ - [x] 仓库管理
- ~~镜像管理~~ - [x] 镜像管理
- ~~镜像调试~~ - [x] 镜像调试
- 任务模板: - 任务模板:
- 添加数据处理模板(导入导出sqoopspark等任务类型) - [ ] 添加数据处理模板(导入导出sqoopspark等任务类型)
- 添加特征处理模板(归一化,转换,...) - [ ] 添加特征处理模板(归一化,转换,...)
- 添加模型处理模板(模型压缩,模型转换..) - [ ] 添加模型处理模板(模型压缩,模型转换..)
- ~~添加分布式训练模板~~ - [x] 添加分布式训练模板~~
- ~~任务流编排~~ - 任务流编排
- 任务流调试 - [x] 单任务调试
- 去除对kubernetes dashboard的依赖提供服务支持pod搜索日志的查看删除执行命令界面 - [x] pipeline调试
- kubeflow-pipeline依赖去除去除依赖组件metadata-envoy-deployment/metadata-grpc-deployment/metadata-writer/ml-pipeline/ml-pipeline-persistenceagent/ml-pipeline-ui/ml-pipeline-viewer-crd/ml-pipeline-visualizationserver/kfp sdk - [x] 任务可视化
- 支持任务结果可视化 - [x] 定时调度
- automl - 任务流调试:
- ~~nni超参搜索~~ - [x] 去除对kubernetes dashboard的依赖提供服务支持pod搜索日志的查看删除执行命令界面
- ray超参搜索 - [x] kubeflow-pipeline依赖去除
- 特征选择 - [x] 支持任务结果可视化
- 框架选择 - automl
- 模型压缩 - [x] nni超参搜索
- [ ] ray超参搜索
- [ ] 特征选择
- [ ] 框架选择
- [ ] 模型压缩
- 特征平台 - 特征平台
- 数据集 - 数据集
- 数据集存储中心 - [x] 数据集存储中心
- ~~数据集管理,版本管理等~~ - [x] 数据集管理,版本管理等
- sdk中支持数据自动导入 - [x] sdk中支持数据自动导入
- 支持数据集上传 - [x] 支持数据集上传
- 标注平台集成label studio与其他模块数据打通 - 标注平台集成label studio与其他模块数据打通
- ~~模型管理~~ - 模型管理
- 服务管理 - [x] 模型注册模板
- ~~内部服务~~ - [x] 模型下载模板
- ~~推理服务~~ - [x] 模型可视化
- 添加triton标准镜像 - 服务管理:
- 视频推流sidecar - [x] 内部服务
- [x] 推理服务
- [x] 添加triton标准镜像
- [ ] 视频推流sidecar
基础架构能力: 基础架构能力:
- 分布式存储方案: - 分布式存储方案:
- 完善juicefs分布式存储方案 - [x] 完善juicefs分布式存储方案
- 体质sidecar分布式存储挂载而不是单机挂载 - [ ] 体质sidecar分布式存储挂载而不是单机挂载
- 支持alluxio分布式加速 - [x] 支持alluxio分布式加速
- 添加边缘集群部署脚本 - 添加边缘集群部署脚本
- 添加super edge部署cube studio方案 - [ ] 添加super edge部署cube studio方案
- 添加kube edge部署cube studio方案 - [ ] 添加kube edge部署cube studio方案
- 私有仓库部署方案: - 私有仓库部署方案:
- docker-compose部署harbor方案 - [x] docker-compose部署harbor方案
- k8s部署harbor方案
web框架 web框架
- 支持通用pipeline编排合并frontend/vison/visonPlus代码 - [ ] 支持通用pipeline编排合并frontend/vison/visonPlus代码
- 通用血缘支持任务流调试界面去除kfp依赖 - [x] 通用血缘支持任务流调试界面去除kfp依赖~~
- 中英文支持 - [ ] 中英文支持
- 通用可视化模板 - [x] 通用可视化模板~~
# AIHub应用市场 # AIHub应用市场
sdk sdk
- 前后端 - 前后端 aihub前后端应用
- 适配pc端/手机端) - [ ] 适配pc端/手机端
- 登录, - [ ] 登录,
- 微信打开限制, - [ ] 微信打开限制,
- 广告sdk - [ ] 广告sdk
- 功能弹窗, - [ ] 功能弹窗,
- 大视频文件在线播放, - [ ] 大视频文件在线播放,
- 支持视频流, - [ ] 支持视频流,
- 分享到朋友圈, - [ ] 分享到朋友圈,
- 访问统计, - [ ] 访问统计,
- 热度排行, - [ ] 热度排行,
- 智能推荐 - [ ] 智能推荐
- pip包 - pip包
- ~~标准化镜像构建标准~~ - [x] 标准化镜像构建标准
- ~~支持生成web服务微信端服务~~ - [x] 支持生成web服务微信端服务
- 支持转训练注册为job 模板 - [x] 支持转训练注册为job 模板
- 支持转推理api批处理弹性离线推理 - [x] 支持转推理api批处理弹性离线推理
- 支持数据数据集上传和自动加载,与数据集平台对接,外部数据集转内部数据集 - [x] 支持数据数据集上传和自动加载,与数据集平台对接,外部数据集转内部数据集
算法模型 算法模型 (自研模型+魔塔模型+hugging模型
- 传统机器学习jupyter形式 - 传统机器学习jupyter形式
- ~~基础技能pandasmatplotlibpyecharts~~ - [x] 基础技能pandasmatplotlibpyecharts
- ~~关联挖掘关联分析Apriori、FP-growth~~ - [x] 关联挖掘关联分析Apriori、FP-growth
- ~~分类决策树ID3、C4.5、CART、K最近邻算法(KNN)、kd树、极大似然估计、EM算法、文档分类器朴素贝叶斯分类器费舍尔分类器、线性函数、线性回归、正则化、逻辑分类/逻辑回归/一般线性回归、支持向量机SVM、核方法、集成学习Bagging、Boosting、RF、AdaBoost、GBDT、xgboost、GBDT算法、XGBOOST算法、CTR/CVR中的FM、FFM算法、LightGBM算法~~ - [x] 分类决策树ID3、C4.5、CART、K最近邻算法(KNN)、kd树、极大似然估计、EM算法、文档分类器朴素贝叶斯分类器费舍尔分类器、线性函数、线性回归、正则化、逻辑分类/逻辑回归/一般线性回归、支持向量机SVM、核方法、集成学习Bagging、Boosting、RF、AdaBoost、GBDT、xgboost、GBDT算法、XGBOOST算法、CTR/CVR中的FM、FFM算法、LightGBM算法
- ~~聚类层次聚类、BIRCH聚类、k均值聚类、k中心点聚类、DBSCAN密度聚类~~ - [x] 聚类层次聚类、BIRCH聚类、k均值聚类、k中心点聚类、DBSCAN密度聚类
- ~~图论最小生成树MST的Prim算法和Kruskal算法~~ - [x] 图论最小生成树MST的Prim算法和Kruskal算法
- 搜索引擎: - [ ] 搜索引擎:
- 深度学习模型: - 深度学习模型:
- 机器视觉 - 大模型数据人
- ~~deoldify~~
- ~~humanseg~~
- ~~stable-diffusion~~
- ~~stable-diffusion 9国语言版本~~
- ~~stable-diffusion 动漫版本~~
- ~~yolov3~~
- ~~yolov5~~
- ~~animegan~~
- ~~panoptic~~
- mnist
- ~~ddddocr~~
- ~~gfpgan~~
- ~~paddleocr~~
- ~~speaker-diarization~~
- paddledetection
- parlai
- pix2pix
- vehicle
- 其他都可以加
- 其他都可以加
- 其他都可以加
- 听觉
- wenet
- ~~paddlespeech-asr~~
- ~~paddlespeech-tts~~
- ~~paddlespeech-cls~~
- 其他都可以加
- 其他都可以加
- 其他都可以加
-
- 自然语言
- ner
- opus-mt-en-zh
- opus-mt-zh-en
- whisper-large
- wav2vec2-large-xlsr-53-chinese-zh-cn
- lang-id-voxlingua107-ecapa
# 社区运营: # 社区运营: