DTEmpower——インテリジェントデータモデリングソフトウェア


ソフトウェア紹介


産業機械の設計製造を行う企業は、製品に関する大量のデータを保有しているため、どのようにして知識をマイニングしていくかがこれからの課題/関心となってきます。

しかし、データモデリングやAIといった専門性の高い業務には一定の閾値が存在しており、情報の薄いデータ群や入出力が不均衡となるケースはけっして珍しくありません。

このような背景から、FsTechは産業機械の設計開発のニーズに合わせた一連のデータモデリングソフトウェアDTEmpowerを開発しました。


DTEmpowerは、データクリーニング、特徴生成、感度分析、モデルトレーニングなど、データモデリングのあらゆる側面に関する多数のアルゴリズムをユーザーに提供します。

研究開発による独自データモデリングテクノロジーとドラッグ&ドロップによるプロセス構築環境により、データモデリングの経験がない状況でも保有データの有効活用を実現します。


『データモデリングの閾値を下げ、モデルの知識/特性を強化する。』


DTEmpowerは、産業機械に関するデータモデリングからモデル管理までのひとつのソリューションとして、データの価値を最大限引き上げることで、ユーザーの業務を支援し続けます。


機能


1.高度なアルゴリズムツールボックス

DTEmpowerのコア機能は、豊富かつ高度なアルゴリズムツールボックスに基づいています。

データクリーニング、特徴生成、感度分析、回帰モデルトレーニング、時系列モデル予測など、データモデリングのあらゆる面を考慮した豊富なアルゴリズムコントロールをサポートしています。


宣传手册-图1.png

図1 アルゴリズムツールボックス


2.ゼロコーディングモデリング

グラフィカルなプロセス構築機能が備わっているため、 すべてのデータやモデル操作はツールボックス内のモジュールを操作するだけです。

コーディング能力やアルゴリズムの詳細をすべて理解する必要はなく、各プロセスのノードをドラッグして接続するだけで、複雑なデータモデリングプロセスの構築することができます。


宣传手册-图2.png

図2 データモデリングプロセスの構築


3.表形式データの前処理

あらゆるデータは表形式でサポートされ、まとめられたデータの前処理をソフトウェア上で行うことができます。

ショートカット操作だけでなく、データの可視化、検証とバッチ処理、データファイルのスプライシングなど、分析に必要となる各種機能も備えています。

前処理を行ったデータセットをモデリングプロセスに直接インポートすることで、後工程にあるモデルトレーニングやその他の操作を簡単に完了させることが可能です。


宣传手册-图3.png

図3 表形式でのデータ管理


4.データクリーニングアルゴリズム

データセットに存在する異常点は最終的なモデル品質に大きく影響するため、クリーニング作業は非常に重要となります。

産業設計のデータセット特性を考慮して、FsTechはインテリジェントなデータクリーニングアルゴリズムAIODを開発しました。

これにより、数十のデータクリーニングアルゴリズムが管理および制御され、データセット内に潜む異常点をワンクリックで捉えることができます。


宣传手册-图4.png

図4 AIODに基づく異常点の識別


5.小規模データセット向けのAIAgentトレーニング

産業設計データ特有の「小規模データセット」と「不均一なデータ分布」を考慮した、トレーニングアルゴリズムAIAgentを搭載しています。

統合アルゴリズム、階層分類、ハイパーパラメータ最適化などの技術を使用して、トレーニングプロセスに介入することなく、ワンクリックで最適なモデルを取得することが可能となります。


宣传手册-图5.png

図5 船舶の波浪抵抗データセットに対するAIAgentと他アルゴリズムの比較


6.メカニズムモデルの融合

モデルの精度と説明可能性を向上させるために、メカニズムモデルをトレーニングプロセスに組み込むことが可能です。

同時に、提供された数式モデルとデータセットによってトレーニングされたモデルを結合し、単一のDTモデルとしてエクスポートできるモデル集約機能を提供することで、データマイニングとデータ分析の融合を実現します。


宣传手册-图6.png

図6 データマイニングとメカニズムモデルの統合


7.産業設計に焦点を当てた - インテリジェント最適化

DTモデルの典型的なアプリケーションシナリオは、製品設計や機械操作などの多くの最適化問題を想定しています。

最適化設計プラットフォームAIPODと組み合わせることで、DTモデルをワンクリックでインポートし、最適化問題に対応することができます。


宣传手册-图7.png

図7 DTモデルのインポートと最適化


8.運用・保守に焦点を当てた - インテリジェントディスク監視

搭載されるデータモデリング機能に基づいた、ディスク監視拡張ツールボックスは、時系列における早期警告アルゴリズムを提供します。

これにより、初期段階の異常な警告をクリアするために、パラメータの健全性を評価するモデル予測値の相対偏差、パラメータの変動と傾向、予測から、判断ロジックを簡単に設定することができます。


宣传手册-图8.png

図8 ディスク監視による異常の特定


事例紹介


1.データクリーニングとAIAgentトレーニング

Styblinski-Tang関数に基づくシミュレーションデータセットを使用して、DTEmpowerのモデルトレーニングアルゴリズムAIAgentの効果を検証しました。

データモデリングの目的は、x(x1~x5)からyまでの予測モデルを取得することです。


Styblinski-Tang関数

产公式1.png


AIAgentの優位性を確認するため、同時に新規プロジェクトを作成し、統合学習アルゴリズムのAdaboostノードを使用した検証も実施しました。

AIAgentによってトレーニングされたモデルの応答曲面は、基本的に理論値に適合しており、精度についてもAdaBoostアルゴリズムよりもはるかに高いことが確認できます。


宣传手册-图9a.png

宣传手册-图9b.png

                    (a)AIAgent テスト精度:99.99%                        (b)Adaboost テスト精度:79.9%

図9 各アルゴリズムによる応答曲面


2.データ前処理と可視化

適切なデータセットを準備することはモデリングにおいて重要な作業であるため、搭載されたデータ前処理および可視化ツールを使用します。

ここで使用した2種類のデータソースからのサンプルが、同一散布図にプロットされて2色に分類表示されます。

ほとんどのサンプルポイントは、通常の動作に対応する同じ曲線上に分布していますが、異常点を持つデータセットでは一部のサンプルポイントは曲線から大きく外れており、何らかの異常がある可能性を可視的に確認することができます。


宣传手册-图10.png

図10 集計モデルの応答曲面


3.パラメータのタイミング予測

時系列予測問題は、過去のデータに基づいて将来の変化を予測する問題です。

この場合、下水処理システムのパラメータ予測を例にすると、DTEmpowerが、強い外部干渉/時変/結合および非線形で複雑な動的生化学プロセスモデルに直面し、大量の測定データに基づいたデータ駆動型システムを構築することになります。 

外部特徴を合理的に選択し、MDI/PCAなどの特徴エンジニアリング手法を導入することで、入力情報の充実度向上だけでなく、モデル予測精度の向上、入力が多すぎることによる問題の軽減に繋がります。

データ特性とモデルトレーニングの問題を解決し、最終的に予測モデルのR2インデックスが0.68から0.94に改善されました。


宣传手册-图11.png

図11 レイヤーごとのデータモデリングレベル向上