生成AIエージェントでのナレッジ・ベースの作成

生成AIエージェント・サービスにナレッジ・ベースを作成します。

「ナレッジ・ベース」リスト・ページで、「ナレッジ・ベースの作成」を選択します。
リスト・ページの検索に関するヘルプが必要な場合は、ナレッジ・ベースのリストを参照してください。
次の情報を入力します。
- 名前: 文字またはアンダースコアで始まり、文字、数字、ハイフンまたはアンダースコアが続く名前。長さは1から255文字です。
- コンパートメント: ナレッジ・ベースを格納するコンパートメント
- 説明: 説明(オプション
「データ・ストア・タイプ」で、次のいずれかのオプションを選択します:
- Object storage. See Data requirements for Object Storage.
- OCI OpenSearch:
  それぞれ512個未満のトークンを持つファイルにドキュメントをチャンク化し、続行する前にOpenSearchでそれらのドキュメントを取り込んで索引付けしておく必要があります。OpenSearchを使用したRAGツールOCI検索の生成AIエージェントのガイドラインを参照してください。
- Oracle AIベクトル検索:
  このオプションは、Oracle Database 23aiのデータ用です。必要な設定については、生成AIエージェント用のRAGツールのOracle Databaseガイドラインを参照してください。
「オブジェクト・ストレージ」を選択した場合は、次のアクションを実行します:
1. 「データ・ソース」で、「データ・ソースの指定」を選択し、データ・ソースの名前と説明(オプション)を入力します。
2. ナレッジ・ベースのデータを含むバケットを選択します。バケットが別のコンパートメントにある場合は、コンパートメントを変更します。
  バケット内のファイルが生成AIエージェントの要件を満たしていることを確認するには、オブジェクト・ストレージのデータ要件を参照してください。
3. バケットの内容がリストされたら、次のいずれかのアクションを実行して、使用するファイルを選択します:
  - バケット内のすべてのアイテムを含めるには、「バケット内のすべてのアイテムを選択」を選択します。
  - 含めるファイルとフォルダを選択します。
  - 「オブジェクト接頭辞を手動で追加」を展開して、含めるファイルおよびフォルダの接頭辞を入力します。
4. (オプション)「タグ付けオプションの表示」を選択し、データ・ソースに1つ以上のタグを追加します。リソースを作成する権限がある場合は、そのタグを更新する権限があります。ヘルプが必要な場合は、タグおよびタグ・ネームスペースの概念を参照してください。
5. 「作成」を選択します。
6. (オプション)「上のデータ・ソースの取込みジョブを自動的に開始します」を選択します。
  このオプションを選択しない場合は、後でエージェントが使用できるようにデータを取り込む必要があります。
ノート

ナレッジ・ベースごとに設定できるデータ・ソースは1つのみです。生成AIエージェントの制限事項を参照してください。
データ・ソース・タイプに「OCI OpenSearch」を選択した場合は、次の情報を入力します。ガイドラインは、生成AIエージェントのOpenSearchガイドラインを使用したRAGツールOCI検索を参照してください。
- OpenSearchクラスタ: ナレッジ・ベースのデータを含むクラスタを選択します。クラスタが別のコンパートメントにある場合は、コンパートメントを変更します。
- OpenSearch index: OpenSearch索引の詳細を入力します。OpenSearchを使用したRAGツールOCI検索の生成AIエージェントのガイドラインを参照してください。
- シークレット詳細: 次のいずれかのオプションを選択します:
  - 基本認証シークレット: このオプションでは、OpenSearchを使用してOCI検索のVaultシークレットを選択します。
  - IDCSシークレット: このオプションでは、エージェントに使用するIDCS機密アプリケーションに次の情報を入力します:
    - アイデンティティ・ドメイン: クラスタへのアクセスに使用するアイデンティティ・ドメインを選択します。アイデンティティ・ドメインが別のコンパートメントにある場合は、コンパートメントを変更します。
    - クライアントID: OpenSearchクラスタのIDCSクライアント・アプリケーションのIDを入力します。
    - クライアント・シークレット・ボールト: クライアント・シークレットを含むボールトを選択します。シークレットが別のコンパートメントにある場合は、コンパートメントを変更します。
    - スコープURL: アイデンティティ・ドメインのリソース・サーバー・アプリケーションのAPIエンドポイントであり、エージェント・スコープを含むURLを入力します。たとえば、genaiagentスコープの場合、URLはhttps://*.agent.aiservice.us-chicago-1.oci.oraclecloud.com/genaiagentです。
  OpenSearchクラスタについて学習するには、OpenSearchクラスタの詳細ページを参照してください。
データ・ソース・タイプに「Oracle AI Vector Search」を選択した場合は、データベース・ツール接続を選択し、「接続のテスト」を選択して、データベースへの接続が成功したことを確認します。成功すると、データベース名とバージョンが表示されます。次に、データベース・ツール接続のベクトル検索関数を入力します。

ノート

このステップの値を入力するには、生成AIエージェント用のRAGツールのOracle Databaseガイドラインを参照してください。
(オプション)「タグ付けオプションの表示」を選択し、ナレッジ・ベースに1つ以上のタグを追加します。リソースを作成する権限がある場合は、そのタグを更新する権限があります。ヘルプが必要な場合は、タグおよびタグ・ネームスペースの概念を参照してください。
「作成」を選択します。

ナレッジ・ベースの作成には時間がかかります。ナレッジ・ベースの作成後、オブジェクト・ストレージ・データ・ソースのデータを収集していない場合は、生成AIエージェントへのデータ・ソース・データの取込みのステップに従います。

ノート

オブジェクト・ストレージ・データ・ソースのデータ取込みジョブを実行した後、ステータスおよびステータス・ログをレビューして、更新されたすべてのファイルが正常に取り込まれたことを確認します。

取込みジョブ・ステータスの意味および失敗の問題が発生した場合に実行するアクションについては、データ・ソース・データの取込み、ステップ6を参照してください。

取込みジョブが失敗した場合(たとえば、ファイルが大きすぎたため)は、問題に対処してジョブを再起動します。

以前に実行した取込みジョブを再起動すると、パイプラインは、以前に正常に取り込まれたファイルを検出してスキップします。パイプラインは、以前に失敗し、その後更新されたファイルのみを収集します。たとえば、取り込むファイルが20個あり、最初のジョブ実行で失敗したファイルが2個あります。ジョブを再起動すると、パイプラインは18個のファイルがすでに正常に取り込まれたことを認識し、無視します。以前に失敗し、その後更新された2つのファイルのみが収集されます。

Oracle Cloud Infrastructureドキュメント

生成AIエージェントでのナレッジ・ベースの作成