非構造化コンテンツ：AIと機械学習のための未開発の燃料源

Alex Welsh 、Ephesoft、アナリティクスプラクティス担当バイスプレジデント

旅行Webサイトのレビューと情報の10〜20％にしかアクセスできない場合、休暇に行く場所を選択しますか？そうすれば、おそらく忘れられない旅になるでしょうが、理由のためにあなたは気に入らないかもしれません。それでも、製造業から保険会社、ヘルスケアから銀行業に至るまで、政府機関や企業はこれとまったく同じ方針で意思決定を行っています。そして、彼らは何年もそうしています。彼らは、非構造化データを無視しながら、構造化データから取得できる簡単な情報を検討します。デロイトは、グローバルに生成されたコンテンツの80〜90％を占める可能性があると考えており、非構造化データを未開拓の価値の途方もない源にしています。

幸いなことに、AI（人工知能）と機械学習の進歩により、ビデオやオーディオファイル、電子メール、ログ、ソーシャルメディアの投稿、さらには通知から取得した大量の非構造化データをふるいにかけ、意味を見つけることが可能になり、手頃な価格になりました。モノのインターネット（IoT）デバイスから。このすべてのデータは、手動で集中的に実行され、多くの場合非常に反復的なタスクを自動化するために使用される場合など、大きなメリットをもたらす可能性があります。たとえば、1つのタスクは、危険信号に注意することです。何かが間違っていることを示す可能性のある特定の基準または動作は、迅速に実行する必要があります。さまざまな業界の事例をいくつか見てみましょう。

表面的には問題ないように見えるが調査に値する保険金請求や、情報を隠している可能性のある求職者はどうでしょうか。旅の一部で冷蔵されていない可能性のある非常に傷みやすい医薬品の出荷、または国の法律に違反している、または他社との既存の契約に違反している可能性のある契約についてはどうでしょうか。重要なことは、赤い旗は、チェックしないままにすると大きな損害を引き起こす可能性のある問題を示しているということです。

人工知能はデータを大量に消費します

AIと機械学習は、どのようにしてより効率的で効果的なデータ分析を可能にしますか？データをフィードすることで。機械学習モデルに良いトランザクションと悪いトランザクションの例を示すことで、2つのタイプを区別する方法を学びます。また、機械学習モデルが処理するデータが多いほど、それらのレッスンが強化され、精度が向上します。

そのため、AIと機械学習は大きな進歩を遂げていますが、企業やその他の組織は追いつく必要があります。このように考えてください。データは燃料のようなものです。賢明な決定を下すために私たちの思考を強化するためにそれが必要です。しかし、私たちはすべての簡単なもの、すてきできれいなパッケージで届く構造化されたデータをマイニングしました。しかし、ここで燃料の例えが崩れます。1ガロンのガソリンでさらに20〜30マイル走行できますが、入力するデータが多いほど、さらに20〜30マイルだけでなく、はるかに優れた正確な決定を下すことができます。 -奇数マイルの価値があり、さらに高速化できます。

それでも、私たちのデータの膨大な部分である非構造化データは、費用がかかりすぎてアクセスや処理が難しすぎたため、活用されていませんでした。また、非構造化データを収集して分析するための新しいテクノロジーが利用可能になるにつれて、それはもはや当てはまりませんが、ビジネスや他の組織の多くの人々はこれらの進歩を見落としています。

スマートマネーの場所

International Data Corporation（IDC）は、構造化データと非構造化データの両方、つまりすべての関連データを分析し、実用的な情報を提供する組織は、2020年までに、そのようなデータ分析を実行しない競合他社よりも4300億ドルの生産性向上を達成すると予測しています。そして、これを理解している企業は2020年まで待っていません。ドイツに拠点を置く多国籍保険会社の幹部は、非構造化データを最大のリスクと呼んでいます。彼らは関係する数字を理解しており、回避できたはずの債務にさらされる保険契約を作成することで、不意を突かれないように取り組んでいます。

ビッグデータ、AI、機械学習を組み合わせることで、さらに複雑な課題に関連する情報の処理が容易になります。たとえば、銀行やその他の組織は、これまで処理されていない非構造化データをマイニングすることで、詐欺、脱税、マネーロンダリングなどのスキームをより正確かつ迅速に検出できます。これにより、詐欺や悪用のケースをキャッチしてシャットダウンできるだけでなく、構造化データのみに依存している場合に発生する可能性のある多くの誤検知を回避できます。国や企業間の契約や複数のデータソースを含む貿易金融契約も、意図的かどうかにかかわらず、詐欺や不当が存在するかどうかを判断するために精査することができます。

さらに、AIと機械学習は、自動化されたKnow Your Customer（KYC）手順を通じて、銀行やその他の種類の企業がクライアントのIDをより適切に識別および検証するのに役立ちます。このような手順は、マネーロンダリング活動に故意または不注意で使用されるのを防ぐのに役立つだけでなく、贈収賄やその他の形態の汚職の発生を防ぐのにも役立ちます。 KYCの手順により、企業は顧客の金融取引やニーズをよりよく理解できるようになるだけでなく、リスクをより慎重に管理できるようになります。その他の利点としては、新規顧客のオンボーディング時に収益を上げるまでの時間を短縮できること、KYCを別のコストではなく、利益の源泉にすることが挙げられます。

AIと機械学習は競争力を高めることができます

AIと機械学習によって得られるすべてのメリットと、構造化データと非構造化データの処理に使用されるテクノロジーの進歩により、より多くの企業や組織が、利用可能な最大の情報源である独自の非構造化データを活用する時が来ました。

作者について

アレックスウェルッシュ Ephesoftのグローバルアナリティクスプラクティスをリードしています。彼は経験豊富なセールスディレクター、プロジェクトマネージャー、起業家であり、革新的な費用対効果の高いテクノロジーソリューションで顧客のミッションクリティカルな問題を解決することに情熱を注いでいます。