Oracle×AI Trials #06: Oracle AI Data Platformを使ってみました~機能紹介編~

はじめに

みなさん、こんにちは。
AI検証チームの宮井です。

今回はOracleが新たに提供を開始した「AI Data Platform」を使ってみました。
2回に分けてご紹介したいと思いますので、今回はサービスの作成と主な機能の紹介になります。

Oracle AI Data Platform (AIDP)とは

Oracle AI Data Platform (AIDP)は、クラウド上でデータの一元管理から分析、AI活用までをスムーズに行えるサービスです。
簡単に言うと、企業が持つ大量のデータを効率よく管理し、そのデータをもとにAIを活用した分析や予測を行うための環境を提供するものです。

AIを活用するにも、元となるデータが散らばっていると、なかなか活用が進まないということもあるかと思います。
そのための基盤となるサービスですね。

AIDPはOracle Cloud Infrastructure (OCI)のサービスになりますので、OCIの契約がある方は利用可能です。

Oracle AI Data Platformとは?

AIDPは、Oracle Cloud Infrastructure(OCI)上で提供されるAI・データ管理、分析向けの統合プラットフォームです。

複数のデータソースを一元管理し、ノートブックを使ったデータ分析やAI開発を効率化できるようです。
Oracle社のマニュアルの翻訳ですが、以下のような特徴が書かれています。

 

  • データの検出とガバナンスの合理化
    AI Data Platform は、構造化データと非構造化データの検索可能性とガバナンスを強化する一元化されたメタデータ リポジトリ (マスター カタログ) を提供します。
  • 安全なデータコラボレーションの有効化
    AI Data Platform は、RBAC ベースのアクセス制御を通じて、厳格なセキュリティ ポリシーを維持しながら、さまざまなチームが共有データセットで作業できるようにします。
  • データの準備と処理を高速化
    組み込みのノートブックとワークフロー オーケストレーションにより、ユーザーはデータを効率的にクリーニング、変換、強化できます。
  • 高度な分析と AI/ML のサポート
    AI Data Platform は Apache Spark と統合されているため、データ サイエンティストやアナリストは、データ レイク内で複雑な計算とモデル トレーニングを直接実行できます。
  • データソース間のシームレスな統合を確保
    AI Data Platformは、Autonomous Database (ADB)、オブジェクト・ストレージ(OS)およびサードパーティ・データ・ソースからの外部カタログをサポートし、ユーザーが重複することなくデータを問い合わせおよび分析できるようにします。
以下がマニュアルになります。

AI Data Platformの作成

AIDPは、日本リージョンだと東京/大阪ともに使用できるようでした。
まずはOracle Cloudのコンソール画面からAIDPのサービスを作成してみましょう。

Oracle Cloudのコンソール画面の「アナリティクスとAI」から「AIデータ・プラットフォーム」を選択します。

AI Data Platformを作成します。

AI Data Platform名とWorkspace名に任意の名前を指定します。

次にアクセスレベルを設定しますが、推奨されている「Standard」を選択すると、テナンシーレベルで広くアクセス権が適用されます。
より細かく設定したい場合は「Advance」を選ぶことで、コンパートメント単位で権限を調整できるようです。

選択すると、必要ポリシーが表示されますが、[Add] をするとすべて自動的に追加してくれます。
そのまま作成し、数分待つとサービスが作成され、サービス名をクリックすると管理画面に移動します。

これでAI Data Platformの環境が整います。

Master Catalogでデータソースを一元管理

次に主だった機能を紹介したいと思います。
Master Catalogは、データソースを管理するための機能です。
内部にテーブルを作成することもできる他、Oracle Autonomous Database(ADB)やオブジェクトストレージなどの外部のデータソースも含めて一元管理できます。

実際にADBを登録してみると、既存のテーブル情報がすぐに参照できるようになりました。一部文字化けしておりますが、、

オブジェクトストレージも追加可能で、アップ済みのファイルをダウンロードしたり、新規でアップロードが簡単に行えます。

ノートブックの作成と活用

データ分析やAI開発の中心となるのが「ノートブック」です。PythonもしくはSQLを使ってデータを操作・分析できます。

ノートブックを使う前に、Computeリソースとして「Cluster」を作成し、アタッチする必要があります。
Apache Sparkをベースとしており、ノートブックではPySparkコマンドでクエリやデータ加工ができます。
外部のデータベースや取り込んだCSVなども同じようにSQLでデータが確認できています。

ジョブ登録とスケジューリングで自動化

ノートブックで作成した処理はワークフローからジョブとして登録でき、定期的に自動実行することも可能です。
これにより、日次のデータ更新処理や定期レポートの作成など、繰り返し行う作業を自動化できます。
手動での実行ミスを防ぎ、運用の効率化に大きく貢献します。

データガバナンス

ロールベースのアクセス制御により、セキュアなデータ共有が可能です。
一次元的に管理するうえで必要になってくる権限制御も対応可能です。
また、監査ログによる記録も標準で搭載されています。

まとめ

いかがでしたでしょうか?
今回はOracle AI Data Platformの機能の一部をご紹介しました。
次回はノートブックを使ったデータの検索や加工についてご紹介したいと思います。

AIを活用するうえでデータを一元的に見られる基盤を作ることは重要なことだと思います。
興味がある方はぜひ一度触ってみてください。

最後になりますが、弊社にはOracleに詳しいエンジニアが多数在籍しております。何かご不明なことやご興味を持たれたことがございましたら、お気軽にお問い合わせください。

Oracleの課題、専門家が解決します


Oracle導入を相談する

豊富な実績で最適な解決策をご提供

投稿者プロフィール

宮井 聡
宮井 聡
Oracle Database、Oracle Cloud、生成AIに関するエンジニア兼プリセールスなどを担当しています。
社内のOCI検証チームのとりまとめやAI検証チームの技術リーダーをしています。
資格はOracle Cloud Infrastructure Architect Professional 2023等を取得しています。