数据分析开发系统DaStudio

简介

       畅联DaStudio是面向工程数据分析人员的全流程数据建模分析平台,聚焦工业领域,对接海量工业数据源,快速构建数据模型和数据对象,支持拖放式、零代码、敏捷式的算法模型开发,提供海量数据预处理、机器学习和人工智能建模分析以及模型在线部署能力,帮助工程技术人员快速从繁杂的数据中,通过智能的分析建模,挖掘数据的价值。


数据分析模型并发系统特点


主要功能

数据集管理

       可以对接文件、Hive, HBase, PG, MySQL、MongoDB等多种数据源,并支持将多种数据源绑定为一个数据集进行后续的分析工作。

数据模型/数据对象管理

       可以将物理世界中的设备,流程抽象成一个数据模型,每个数据模型可以实例化成多个数据对象,定义好的数据对象可以直接作为组件在分析工程中使用。

分析组件

       数据预处理(去重,过滤缺失值,自定义过滤,插值,类型转换,时间戳类型转换,特征分桶,重命名,自动分箱,标准化,归一化,PCA等)

       特征工程(时域频域变换、小波变化、ButterWorth滤波等)

       机器学习算法(KMeans,BisectingKMeans,GaussianMixture, 线性回归,决策树回归,GBT回归,SVM分类,决策树分类等)

       建模(训练模型,交叉验证,应用模型)。

分析工作流

       用户可以使用拖拽式、可视化对选择的组件进行连接以构建自己的分析流。

       分析工作流可以按步骤运行,执行结果会保存到对应的每个组件实例里,并提供可视化的执行结果。建模组件支持网格参数最优模型选择。

实时在线模型部署和分析

       分析完成的模型,可以通过在线部署,对接到实时的数据源上,并构建分析任务,实现实时的分析。

模型目录

       用户上传和发布并分享的算法模型组件,可以在模型目录里被其他用户订阅并使用,可直接使用在分析工程中,能够与其他组件进行连接。