概要
Oracle Data Mining(ODM)は、Oracle Advanced AnalyticsDatabaseOptionのコンポーネントです。 ODMには、データベースに埋め込まれた一連の高度なデータマイニングアルゴリズムが含まれており、データに対して高度な分析を実行できます。
Oracle Data Minerは、OracleSQLのグラフィカル開発環境であるOracleSQLDeveloperの拡張機能です。 Oracle Data Minerは、Oracle Databaseに組み込まれているデータマイニングテクノロジを使用して、データマイニング操作をカプセル化するワークフローを作成、実行、および管理します。 ODMのアーキテクチャを図1に示します。
図1:ビッグデータ向けのOracleデータマイニングアーキテクチャ
アルゴリズムはSQL関数として実装され、Oracleデータベースの長所を活用します。 SQLデータマイニング関数は、トランザクションデータ、集計、非構造化データ、つまりCLOBデータタイプ(Oracle Textを使用)および空間データをマイニングできます。
各データマイニング関数は、モデル化して解決できる問題のクラスを指定します。データマイニング機能は、一般に、監視付きと監視なしの2つのカテゴリに分類されます。
教師なし学習と教師なし学習の概念は、人工知能のサブエリアと呼ばれている機械学習の科学に由来しています。
教師あり学習は、直接学習とも呼ばれます。学習プロセスは、既知の依存属性またはターゲットによって指示されます。指示されたデータマイニングは、一連の独立した属性または予測子の関数としてターゲットの動作を説明しようとします。
教師なし学習は無向です。従属属性と独立属性の区別はありません。モデルを構築する際のアルゴリズムを導くための既知の結果はありません。教師なし学習は、説明の目的で使用できます。
Oracle Data Mining Supervised Algorithms
アルゴリズム(簡単な説明) |
---|
特定の結果を予測するために最も一般的に使用される手法。たとえば、がん腫瘍細胞の識別、感情分析、薬物分類、スパム検出。 |
天文データ分析、消費者行動、収益性、その他のビジネス要因に関する洞察の生成、生物学的システムのパラメーター間の因果関係の計算など、継続的な数値結果を予測するための手法。 |
Oracle Data Mining Unsupervised Algorithms
クラスタリングは、データベースのレコードをサブセットまたはクラスターに分割するために使用されます。クラスター内の要素は、一連の共通のプロパティを共有します。例としては、新しい顧客セグメントの検索や映画のおすすめなどがあります。 | K-Means-テキストマイニング、階層的クラスタリング、距離ベースをサポートします。 直交分割クラスタリング-階層的クラスタリング、密度ベース。 期待値の最大化-混合データ(密および疎)データマイニングの問題でうまく機能するクラスタリング手法。 |
異常検出は、データセットの通常の動作から逸脱したデータポイント、イベント、および/または観測を識別します。一般的な例としては、銀行詐欺、構造上の欠陥、医学的問題、テキストの誤りなどがあります | |
マーケットバスケット分析、クロスセル、根本原因分析に使用される、頻繁に共起するアイテムに関連するルールを検索します。製品のバンドルや欠陥分析に役立ちます。 | Apriori-データベースに情報を収集するためにツリーをハッシュしました |
Oracleデータマイニングオプションの有効化
12cリリース2以降、 Oracle Advanced Analytics オプションには、データマイニングとOracleR機能が含まれます。
Oracle Advanced Analyticsオプションは、OracleDatabaseEnterpriseEditionのインストール時にデフォルトで有効になっています。データベースオプションを有効または無効にする場合は、コマンドラインユーティリティ choptを使用できます。 。
chopt [ enable | disable ] oaaを無効にします
Oracle Advanced Analyticsオプションを有効にするには:
ODMスキーマの表スペースの作成
すべてのユーザーは、作業を行うために永続的なテーブルスペースと一時的なテーブルスペースを必要とします。データベース内に、すべてのデータマイニングオブジェクトを作成できる個別の領域があると非常に便利です。
usr_dm_01 スキーマには、すべてのデータマイニング作業が含まれます。
ODMリポジトリの作成
Oracle Data MiningRepositoryを作成する必要があります データベース内。 SQLDeveloperのDataMinerNavigatorに移動します。
[表示]->[データマイニング]->[データマイニング接続]を選択します:
既存の[接続]タブの横に新しいタブが開きます:
usr_dm_01を追加するには このリストへのスキーマ、緑色のプラスウィンドウをクリックして OK
リポジトリが存在しない場合は、リポジトリをインストールするかどうかを尋ねるメッセージが表示されます。 はいをクリックします ボタンをクリックしてインストールを続行します。
SYSパスワードを入力する必要があります
リポジトリのインストール設定
データマイニングリポジトリのインストールの進行状況ウィンドウ
タスクは正常に完了しました
ログファイル
Oracleデータマイニングコンポーネント
ワークフローを使用すると、データに対して必要なすべての処理を実行する一連のノードを構築できます。
予測分析用に開発されたワークフローの例
ODMデータディクショナリビュー
マイニングモデルに関する情報は、データディクショナリから取得できます。
データマイニングデータディクショナリビューは次のように要約されます。
注: * ALL _、USER _、DBA_、CDB_に置き換えることができます
* _ MINING_MODELS :作成されたマイニングモデルに関する情報。
* _ MINING_MODEL_ATTRIBUTES :OracleDataMiningモデルの作成に使用された属性の詳細が含まれています。
* _ MINING_MODEL_SETTINGS :アクセスできるマイニングモデルの設定に関する情報を返します。
参考資料
Oracle Data Miningユーザーズ・ガイド。 https://docs.oracle.com/en/database/oracle/oracle-database/19/dmprg/lot.html
で入手できます。Oracle Data Mining –スケーラブルなデータベース内予測分析。 https://www.oracle.com/database/technologies/advanced-analytics/odm.html
で入手できます。OracleDataMinerシステムの概要。 https://docs.oracle.com/database/sql-developer-17.4/DMRIG/oracle-data-miner-overview.htm#DMRIG124
で入手できます。