This commit is contained in:
cdllp2 2022-09-13 20:03:02 +08:00
commit 42f6a1d087

View File

@ -3,7 +3,9 @@
# 第一阶段发展目标:
1、算法视觉、文本、语音、搜广推、金融 开源 算法的集成,能更方便的体验使用开源算法。包括算法任务模板(job-template),算法全自动建模流程(pipeline),算法推理服务(service)
1、算法传统机器学习、视觉、文本、语音、搜广推、金融 开源 算法的集成,能更方便的体验使用开源算法。包括算法任务模板(job-template),算法全自动建模流程(pipeline),算法推理服务(service)。
- 1.1、notebook集成pandas、matplotlib、pyecharts、xx
2、平台开发数据管理的集成(数据标注/特征平台),平台公有化/私有化saas版数据闭环(离线/实时训练闭环)
@ -36,7 +38,24 @@
# 汇总社区需求
算法:
aihub
- 大数据功能(jupyter形式):
- hadoop基础客户端能力环境sqoophbasehdfs
- 查询能力sparksql查询 impala查询presto查询clickhouse查询mysql查询postgresql查询
- 分析能力flink实时numpy、pandas、百G大数据单机数据分析能力Arrow、vaex、dask等
- 可视化的能力
- 传统机器学习jupyter形式
- 基础技能pandasmatplotlibpyecharts
- 关联挖掘关联分析Apriori、FP-growth
- 分类决策树ID3、C4.5、CART、K最近邻算法(KNN)、kd树、极大似然估计、EM算法、文档分类器朴素贝叶斯分类器费舍尔分类器、线性函数、线性回归、正则化、逻辑分类/逻辑回归/一般线性回归、支持向量机SVM、核方法、集成学习Bagging、Boosting、RF、AdaBoost、GBDT、xgboost、GBDT算法、XGBOOST算法、CTR/CVR中的FM、FFM算法、LightGBM算法
- 聚类层次聚类、BIRCH聚类、k均值聚类、k中心点聚类、DBSCAN密度聚类
- 图论最小生成树MST的Prim算法和Kruskal算法
- 搜索引擎:
- 视觉yolo相关模型、darknet相关模型、PaddleSeg 图像分割orc相关模型等训练和推理支持