SQLFlow 模型列表
SQLFlow 模型库(Model Zoo) 中提供了很多算法、模型,您可以根据要解决问题的不同,选择其中一个在现有的数据集上进行尝试,
同时每个模型我们也提供了相应的业务案例供您参考。
选择模型
- 探索数据规律,适用于发现数据集中数据集上发现一些规律特征,解决 “数据中有什么” 的问题。
- 数值预测,适用于数据中已有一些关联关系,根据这些关系在一个新的数据集上预测,解决 “有多少” 的问题。
- 分类预测,数据集中存在两个或多个类别,推测新的数据是属于哪一类,解决“是或否“(二分类), “A 或 B 还是 C”(多分类)的问题。
探索数据规律
- Deep Embedding Clustering 无监督聚类算法,
将拥有相似特点的数据,划分到同一个组中 。
数值预测
- DNNRegression 基于神经网络
的回归模型,可以预测单一数值。
- RNNBasedTimeSeriesModel 基于过去一段时间的数据,预测未来一段时间内的趋势,用来预测一组基于时间序列的数值。
- XGBoost Regression 基于树模型的的回归模型。
分类预测
- DNNClassifier 基于神经网络的模型,
可以用来做二分类或多分类的预测。
- XGBoost Binary Classification 基于树模型的二分类模型。
- XGBoost Multiple Classification 基于树模型的多分类模型。
模型 |
训练速度 |
图形化模型解释 |
是否支持大规模数据集 |
DNNClassifier |
慢 |
支持 |
支持 |
XGBoost Binary Classification |
快 |
支持 |
支持 |
XGBoost Multiple Classification |
快 |
支持 |
支持 |