sql >> データベース >  >> RDS >> Oracle

Oracle Data Mining(ODM)–インストールとセットアップ

    概要

    Oracle Data Mining(ODM)は、Oracle Advanced AnalyticsDatabaseOptionのコンポーネントです。 ODMには、データベースに埋め込まれた一連の高度なデータマイニングアルゴリズムが含まれており、データに対して高度な分析を実行できます。

    Oracle Data Minerは、OracleSQLのグラフィカル開発環境であるOracleSQLDeveloperの拡張機能です。 Oracle Data Minerは、Oracle Databaseに組み込まれているデータマイニングテクノロジを使用して、データマイニング操作をカプセル化するワークフローを作成、実行、および管理します。 ODMのアーキテクチャを図1に示します。

    図1:ビッグデータ向けのOracleデータマイニングアーキテクチャ

    アルゴリズムはSQL関数として実装され、Oracleデータベースの長所を活用します。 SQLデータマイニング関数は、トランザクションデータ、集計、非構造化データ、つまりCLOBデータタイプ(Oracle Textを使用)および空間データをマイニングできます。

    各データマイニング関数は、モデル化して解決できる問題のクラスを指定します。データマイニング機能は、一般に、監視付きと監視なしの2つのカテゴリに分類されます。

    教師なし学習と教師なし学習の概念は、人工知能のサブエリアと呼ばれている機械学習の科学に由来しています。

    教師あり学習は、直接学習とも呼ばれます。学習プロセスは、既知の依存属性またはターゲットによって指示されます。指示されたデータマイニングは、一連の独立した属性または予測子の関数としてターゲットの動作を説明しようとします。

    教師なし学習は無向です。従属属性と独立属性の区別はありません。モデルを構築する際のアルゴリズムを導くための既知の結果はありません。教師なし学習は、説明の目的で使用できます。

    Oracle Data Mining Supervised Algorithms

    テクニック 適用性 分類
    一般化線形モデルロジスティック回帰-高性能でスケーラブルな並列化された実装でOracleデータベース内で利用できる古典的な統計手法(すべてのOAA MLアルゴリズムに適用)。テキストとトランザクションデータをサポートします(ほぼすべてのOAA MLアルゴリズムに適用されます)

    Naive Bayes-高速、シンプル、一般的に適用可能。

    サポートベクターマシン-機械学習アルゴリズム、テキストをサポート幅広いデータ。

    デシジョンツリー-解釈可能性のための一般的なMLアルゴリズム。人間が読める「ルール」を提供します。
    回帰
    一般化線形モデル重回帰-従来の統計手法ですが、パフォーマンスが高く、スケーラブルで、並列化された実装としてOracleデータベース内で利用できるようになりました。リッジ回帰、特徴作成、特徴選択をサポートします。テキストとトランザクションデータをサポートします。

    サポートベクターマシン-機械学習アルゴリズム。テキストとワイドデータをサポートします。
    属性の重要性
    ターゲット属性との関係の強さに応じて属性をランク付けします。ユースケースには、オファーに応答する顧客に最も関連する要因、健康な患者に最も関連する要因を見つけることが含まれます。 最小記述長-各属性をターゲットクラスの単純な予測モデルと見なし、相対的な影響を提供します。
    アルゴリズム(簡単な説明)
    特定の結果を予測するために最も一般的に使用される手法。たとえば、がん腫瘍細胞の識別、感情分析、薬物分類、スパム検出。
    天文データ分析、消費者行動、収益性、その他のビジネス要因に関する洞察の生成、生物学的システムのパラメーター間の因果関係の計算など、継続的な数値結果を予測するための手法。

    Oracle Data Mining Unsupervised Algorithms

    テクニック 適用性 アルゴリズム クラスタリング
    異常検出
    ワンクラスサポートベクターマシン-タグなしデータをトレーニングし、テストポイントがトレーニングデータの分布に属しているかどうかを判断しようとします。 特徴選択と抽出
    既存の属性の線形結合として新しい属性を生成します。テキストデータ、潜在意味解析(LSA)、データ圧縮、データ分解と投影、およびパターン認識に適用できます。 非負行列因子分解-元のデータを新しい属性セットにマッピングします

    主成分分析(PCA)-すべてを表す新しい少数の複合属性を作成します属性。

    特異ベクトル分解-幅広いアプリケーションを持つ確立された特徴抽出方法。
    関連付け
    クラスタリングは、データベースのレコードをサブセットまたはクラスターに分割するために使用されます。クラスター内の要素は、一連の共通のプロパティを共有します。例としては、新しい顧客セグメントの検索や映画のおすすめなどがあります。 K-Means-テキストマイニング、階層的クラスタリング、距離ベースをサポートします。

    直交分割クラスタリング-階層的クラスタリング、密度ベース。

    期待値の最大化-混合データ(密および疎)データマイニングの問題でうまく機能するクラスタリング手法。
    異常検出は、データセットの通常の動作から逸脱したデータポイント、イベント、および/または観測を識別します。一般的な例としては、銀行詐欺、構造上の欠陥、医学的問題、テキストの誤りなどがあります
    マーケットバスケット分析、クロスセル、根本原因分析に使用される、頻繁に共起するアイテムに関連するルールを検索します。製品のバンドルや欠陥分析に役立ちます。 Apriori-データベースに情報を収集するためにツリーをハッシュしました

    Oracleデータマイニングオプションの有効化

    12cリリース2以降、 Oracle Advanced Analytics オプションには、データマイニングとOracleR機能が含まれます。

    Oracle Advanced Analyticsオプションは、OracleDatabaseEnterpriseEditionのインストール時にデフォルトで有効になっています。データベースオプションを有効または無効にする場合は、コマンドラインユーティリティ choptを使用できます。 。

    chopt [ enable | disable ] oaa
    を無効にします

    Oracle Advanced Analyticsオプションを有効にするには:

    ODMスキーマの表スペースの作成

    すべてのユーザーは、作業を行うために永続的なテーブルスペースと一時的なテーブルスペースを必要とします。データベース内に、すべてのデータマイニングオブジェクトを作成できる個別の領域があると非常に便利です。

    usr_dm_01 スキーマには、すべてのデータマイニング作業が含まれます。

    ODMリポジトリの作成

    Oracle Data MiningRepositoryを作成する必要があります データベース内。 SQLDeveloperのDataMinerNavigatorに移動します。

    [表示]->[データマイニング]->[データマイニング接続]を選択します:

    既存の[接続]タブの横に新しいタブが開きます:

    usr_dm_01を追加するには このリストへのスキーマ、緑色のプラスウィンドウをクリックして OK

    リポジトリが存在しない場合は、リポジトリをインストールするかどうかを尋ねるメッセージが表示されます。 はいをクリックします ボタンをクリックしてインストールを続行します。

    SYSパスワードを入力する必要があります

    リポジトリのインストール設定

    データマイニングリポジトリのインストールの進行状況ウィンドウ

    タスクは正常に完了しました

    ログファイル

    Oracleデータマイニングコンポーネント

    ワークフローを使用すると、データに対して必要なすべての処理を実行する一連のノードを構築できます。

    予測分析用に開発されたワークフローの例

    ODMデータディクショナリビュー

    マイニングモデルに関する情報は、データディクショナリから取得できます。

    データマイニングデータディクショナリビューは次のように要約されます。

    注: * ALL _、USER _、DBA_、CDB_に置き換えることができます

    * _ MINING_MODELS :作成されたマイニングモデルに関する情報。

    * _ MINING_MODEL_ATTRIBUTES :OracleDataMiningモデルの作成に使用された属性の詳細が含まれています。

    * _ MINING_MODEL_SETTINGS :アクセスできるマイニングモデルの設定に関する情報を返します。

    参考資料

    Oracle Data Miningユーザーズ・ガイド。 https://docs.oracle.com/en/database/oracle/oracle-database/19/dmprg/lot.html

    で入手できます。

    Oracle Data Mining –スケーラブルなデータベース内予測分析。 https://www.oracle.com/database/technologies/advanced-analytics/odm.html

    で入手できます。

    OracleDataMinerシステムの概要。 https://docs.oracle.com/database/sql-developer-17.4/DMRIG/oracle-data-miner-overview.htm#DMRIG124

    で入手できます。
    1. Laravelからストアドプロシージャを実行する方法

    2. MySQLでスペースを含む列名を選択する方法

    3. SQLトレースと拡張イベントの「オブザーバーオーバーヘッド」の測定

    4. hibernateでネイティブSQLを実行する