支持关系型数据库、文件(txt/CSV/Excel/JSON…)、分布式和记平台框架(HDFS/HBASE/HIVE…)以及通过集成第三方数据读取方法支持诸如时间序列、web数据、图数据等多种类型的数据源,方便企业各类数据的接入,为数据分析提供丰富的数据源
提供丰富的数据探查与图形化展示功能,包括数据取值分布、集中趋势度量、离散程度度量、偏态峰态度量、空值探查等。通过参数化配置支持数据分区,如训练集校验集划分,统计抽样等。提供数据项的各种预处理功能,如行过滤、行转化、列过滤、列转化、数据聚合和分组、数据分箱、shuffle、sorter、标准化、子集匹配、表维度提取、表规格提取、表转置等。通过接入其他语言(Python/R/JAVA…)代码模块支持用户自定义的各种数据预处理功能
提供各种数据统计分析功能,包括基本数据统计、相关性分析、方差分析、相似度统计、参数估计、假设检验、主成分及因子分析、时间序列分析等。提供各种统计图表的数据可视化及配色定义等自定义功能,包括高亮表、箱型图、柱状图、折线图、饼图、散点图、提升图等,支持通过接入第三方图形化插件扩展数据可视化图表类别
提供各种数据挖掘功能。包括:回归分析,如线性回归、对率回归、多元回归、逐步回归、岭回归、Lasso回归等。分类,如贝叶斯分类、决策树分类、SVM分类、RF分类、GBDT、AdaBoost、Bagging分类、线性判别分类、K近邻分类、XGBoost等。聚类,如K-Means、DBSCAN、层次聚类等。频繁模式挖掘,如Apriori、FPGrowth等。推荐,如协同过滤、序列分析等
通过定义人工神经网络结构提供各种深度学习功能。包括:CNN、DNN、RNN、LSTM等
通过模型评估工具,用户可以对开发的数据分析模型的模型效果进行衡量。评估功能包括:交叉验证、ROC曲线、熵值计分器、数值计分器、浓缩绘图仪等。支持接入第三方代码模块扩展模型评估方法
提供丰富的数据分析结果输出功能,支持平台分析结果输出到目标对象,如文件、数据库、分布式和记平台框架等。提供模型导出功能,支持平台构建的数据分析流程或模型能够通过第三方语言(Python/R/JAVA…)等调用。提供数据分析处理流程的流程控制工具,包括自动化执行、循环、开关、错误处理等,方便用户开发的数据分析模型部署应用到实际生产场景中
平台提供与其他平台、框架的集成接口,方便集成其他平台、语言及框架。具体包括:分析处理平台集成,如weka、MATLAB、SAS、SPSS等。语言集成,如R、Python、JAVA等。分布式和记平台框架集成,如Hadoop、spark、kerberos等。机器学习深度学习框架集成,如SK-Learn、TensorFlow等
不论是导入数据、构建数据仓库,还是制作各类分析展现、数据挖掘等,设计过程完全可视化。遵循便捷易用的设计理念,所有操作无需定义复杂公式,仅需拖拉拽即可快速完成设计,零门槛、上手快。内置上百种可视化元素和统计图,通过设计与搭配,可衍生出成千上万种可视化效果。同时还支持动态炫酷的大屏分析,独特的3D全景视角,自由快捷制作各类交互式常规屏和大屏报表,将创意变成现实
平台支持数据库数据源、文本数据源等多种数据源的接入,仅需简单的拖拽操作便可快速设计复杂格式的报表,报表支持饼图、折线图等多种图形展示并提供报表预览功能,支持报表导出PDF、EXCEL、WORD等格式
行政执法案件主要以罚款等方式进行行政处罚,处罚决定当事人拒不执行时需要进行强制执行。通过数据分析手段分析何种案件当事人较为配合能够执行处罚决定,何种案件容易导致当事人拒不执行处罚决定需要被强制执行
强制执行处罚决定的行政执法案件,一方面有可能是由于当事人的原因导致,可以进一步寻找“老赖”当事人或其特征;另一方面有可能是由于案件执法原因导致,如处罚决定不合理,当事人对处罚决定不满等,可以进一步进行行政执法监督分析;此外,在执法过程中,可以通过模型进行处罚决定执行情况预测,为处罚裁量提供参考依据
行政管理部门的管理职权及其对应的案件根据业务特点可能呈现一些特征规律,如季节性因素等。通过数据分析找出案件发生数量的规律并能够对未来案件可能发生的数量进行预测
行政执法案件的来源除了群众举报外,主要依靠管理部门的例行检查发现。较为准确的预测未来案件可能发生的数量,能够为制订更为合理的检查计划,更合理的配置检查力量提供参考依据
对低保家庭是否能够生活自理进行统计分析。低保家庭是否能够生活自理统计分析一方面能够为民政业务办理及管理提供当前低保家庭生活自理状况的宏观情况;另一方面能够为进一步的数据分析,如退保情况和生活自理情况关联分析提供依据