数据分析开发系统DaStudio
简介
畅联DaStudio是面向工程数据分析人员的全流程数据建模分析平台,聚焦工业领域,对接海量工业数据源,快速构建数据模型和数据对象,支持拖放式、零代码、敏捷式的算法模型开发,提供海量数据预处理、机器学习和人工智能建模分析以及模型在线部署能力,帮助工程技术人员快速从繁杂的数据中,通过智能的分析建模,挖掘数据的价值。
数据分析模型并发系统特点
主要功能
数据集管理
可以对接文件、Hive, HBase, PG, MySQL、MongoDB等多种数据源,并支持将多种数据源绑定为一个数据集进行后续的分析工作。
数据模型/数据对象管理
可以将物理世界中的设备,流程抽象成一个数据模型,每个数据模型可以实例化成多个数据对象,定义好的数据对象可以直接作为组件在分析工程中使用。
分析组件
数据预处理(去重,过滤缺失值,自定义过滤,插值,类型转换,时间戳类型转换,特征分桶,重命名,自动分箱,标准化,归一化,PCA等)
特征工程(时域频域变换、小波变化、ButterWorth滤波等)
机器学习算法(KMeans,BisectingKMeans,GaussianMixture, 线性回归,决策树回归,GBT回归,SVM分类,决策树分类等)
建模(训练模型,交叉验证,应用模型)。
分析工作流
用户可以使用拖拽式、可视化对选择的组件进行连接以构建自己的分析流。
分析工作流可以按步骤运行,执行结果会保存到对应的每个组件实例里,并提供可视化的执行结果。建模组件支持网格参数最优模型选择。
实时在线模型部署和分析
分析完成的模型,可以通过在线部署,对接到实时的数据源上,并构建分析任务,实现实时的分析。
模型目录
用户上传和发布并分享的算法模型组件,可以在模型目录里被其他用户订阅并使用,可直接使用在分析工程中,能够与其他组件进行连接。