生成AIエージェントのRAGツール・オブジェクト・ストレージ・ガイドライン
次の項を参照して、生成AIエージェントのRAGツール用のオブジェクト・ストレージ・データを準備します。
一般的なガイドライン
オブジェクト・ストレージにアップロードする前に、生成AIエージェント・データ・ソースのデータを準備するには、次のガイドラインに従います:
- データ・ソース: 生成AIエージェントのデータは、ファイルとしてオブジェクト・ストレージ・バケットにアップロードする必要があります。
- バケット数: データ・ソースごとに許可されるバケットは1つのみです。
- サポートされているファイル・タイプ:
PDF
およびtxt
ファイルのみがサポートされます。 - ファイル・サイズ制限: 各ファイルは100MB以下にする必要があります。
- PDFコンテンツ:
PDF
ファイルには、イメージ、チャートおよび参照表を含めることができますが、これらは8MBを超えないようにする必要があります。 - チャートの準備: ラベル付き軸の2次元であるかぎり、チャートに特別な準備は必要ありません。モデルは、明示的な説明なしにチャートに関する質問に答えることができます。
- 表の準備: 複数の行および列を含む参照表を使用します。たとえば、エージェントは「制限」ページで表を読み取ることができます。
- URL:
PDF
ドキュメントに存在するすべてのハイパーリンクが抽出され、チャット・レスポンスにハイパーリンクとして表示されます。 - データの準備ができていません: データがまだ使用できない場合は、データ・ソースの空のフォルダを作成し、後で移入します。このようにして、フォルダの移入後にデータをソースに取り込むことができます。
続行する前に、次のオブジェクト・ストレージ権限を設定してください。
- オブジェクト・ストレージ・ファイルへのユーザー・アクセス
- 長時間実行ジョブのオブジェクト・ストレージ・ファイルへのデータ取込みジョブ・アクセス
権限については、アクセスの取得を参照してください。
表の強化の理解
RAGツールの機能である強化された表理解は、PDF表データに埋め込まれた回答を使用して問合せに対するレスポンスの精度を向上させることを目的としています。これらのテーブルが処理され、含まれている情報に合わせて、より正確で関連性の高い応答が生成されます。一般に、RAGツールはテーブルを読み取ることができます。RAGツールで、表の理解を深めて表を読み取るには、表に次の機能があることを確認します。
- 表のすべてのセルは、最初の行のヘッダー名を含め、他のセルから表示可能な行またはオブジェクトの境界で区切られます。
- 最初の列を含むすべての列にヘッダー名があります。
- 各表には、複数の列と複数の行があり、ヘッダー名を含む行は除外されます。
Count of tables that support enhanced table understanding in following PDFs:
- enhanced_table_test_data/2025_Report1.pdf has 4 tables processed successfully
- enhanced_table_test_data/2025_Report2.pdf has 3 tables processed successfully
- enhanced_table_test_data/2025_Report3.pdf has 3 tables processed successfully
メタデータ・フィルタリングによるレスポンスの拡張
事前定義されたメタデータを使用して、チャット中にフィルタを適用します。フィルタが適用されると、チャット・セッションでのエージェントの検索は、メタデータに関連付けられているデータファイルに制限され、モデルがコンテンツ・スコープに関連する回答を生成し、エージェントのレスポンスの正確性と関連性を高めるのに役立ちます。
次のステップでは、メタデータ・フィルタリング機能の使用方法の概要を説明します。ワークフローの概要を理解したら、概要ステップの後の項でユースケースの詳細を確認します。
- テキスト・エディタで、メタデータ・スキーマを作成します。このスキーマは、使用可能にするフィルタに必要です。JSON形式でスキーマを記述します。ファイルに
_metadata_schema.json
という名前を付けます。例:
{ "metadataSchema": [ { "name": "publication_year", "type": "integer" }, { "name": "title", "type": "string" } ] }
- ステップ1で作成した
_metadata_schema.json
ファイルを、ナレッジ・ベースのデータファイルを含むオブジェクト・ストレージ・バケットのルート・レベルにアップロードします。 - JSONファイルを作成して、データ・ファイルを事前定義済のメタデータに関連付け、メタデータ値を指定します。
例:
{ "metadataAttributes": { "publication_year": 2020 } }
1つ以上のデータファイルまたはバケット内のすべてのファイルをメタデータに関連付けることができます。選択したオプションに使用するJSONファイル名の表記規則の詳細は、メタデータ・フィルタ・オプション(ファイル名および場所)を参照してください。
- ステップ3で作成したJSONファイルを、ナレッジ・ベースのデータファイルを含むオブジェクト・ストレージ・バケットにアップロードします。各オプションについて、ファイルを階層の正しい場所に保存してください。
- ナレッジ・ベースを作成します。データ・ストア・タイプとして「オブジェクト・ストレージ」を選択し、取込みジョブを自動的に開始するオプションを選択します。
データファイルが収集されると、生成AIエージェントは、チャットで選択できるメタデータ名と値のリストを作成します。収集したメタデータ名および値を表示するには、生成AIエージェントでのナレッジ・ベースの詳細の取得を参照してください。
- ステップ5で作成したナレッジ・ベースを選択して、RAGツールを使用してエージェントを作成します。エージェントで、エンドポイントを自動的に作成するオプションを選択します。ヘルプが必要な場合は、エージェントの作成およびRAGツールの作成を参照してください。
- チャット・ウィンドウで、1つ以上の事前定義済メタデータ・フィルタを追加し、適用する値を選択します。チャットでのメタデータ・フィルタの使用を参照してください。
ユースケース用のメタデータJSONファイルの準備、およびチャット・セッションでのメタデータ・フィルタの追加および適用方法についてさらに学習するには、次の項を参照してください。
最適な次の方法を1つ以上選択します。
Method | ファイル名と保存先 | 使用方法 |
---|---|---|
ファイル名を指定せずに、バケット内のすべてのファイルのメタデータを含めます。 | オブジェクト・ストレージのルート・レベルで_common.metadata.json ファイルを作成します。 |
このファイルは、バケット内のすべてのファイルに共通するメタデータに使用します。この方法は、オブジェクト間でのメタデータの重複入力を回避するのに役立ちます。 |
1つのファイルで、バケット内の各ファイルのメタデータ・エントリを作成し、ファイル名を含めます。 | オブジェクト・ストレージのルート・レベルで_all.metadata.json ファイルを作成します。 |
多数のファイルがあり、すべてのファイル名を含む1つのファイルを作成すると、ファイルごとに1つのメタデータ・ファイルを作成するよりも便利です。 |
バケット内の各ファイルのメタデータ・ファイルを作成します。 | ファイル・レベルで、ファイルごとに<file-name>.metadata.json ファイルを作成します。
|
この方法は、メタデータがファイルごとに異なり、メタデータ・ファイルを作成するファイルが多くない場合、またはメタデータ・ファイルの作成を自動化する場合に使用します。 |
オブジェクト・ストレージ・メタデータ・ヘッダーを各ファイルに追加します。 | 各ファイルのオブジェクト・ストレージ・メタデータ・プロパティを介してメタデータ・ヘッダーを追加します。 | 含めるメタデータ・プロパティがほとんどない場合は、この方法を使用します。ファイルの更新と管理が簡単で、メタデータ・ヘッダーの更新が困難なため、JSONファイルでは他の方法を使用することをお薦めします。 |
すべてのメソッドで、_metadata_schema.json
というメタデータ・スキーマ・ファイルをオブジェクト・ストレージ・バケットのルート・レベルで定義する必要があります。
必要なメタデータ・ファイルを保存する階層の例を次に示します。
次のステップでは、例を使用して、メタデータJSONファイルのフォーマット方法を示します。メタデータ・フィルタリングの制限も参照してください。
ナレッジ・ベース・データの収集後にメタデータ・フィールドを変更または削除することはできません。許可された制限に新規フィールドを追加できます。フィールドを削除または更新するには、ナレッジ・ベースを再作成します。
次の手順では、必要なメタデータ・スキーマとオプションのメタデータ・フィルタJSONファイル、ナレッジ・ベース、およびRAGツールとエンドポイントを含むエージェントを作成していることを前提としています。
内容 | 制限 |
---|---|
_all.metadata.json 内のエントリの最大数 |
10,000 |
ファイルごとに指定できるメタデータ・フィールドの最大数 | 20 |
list_of_string type 内のアイテムの最大数 |
10 |
list_of_string 型の個々のアイテムの最大長 |
50 |
メタデータ・キーの最大長(文字数) | 25 |
メタデータ値の最大長(文字) | 50 |
オブジェクト・ストレージ・メタデータ・ヘッダーへのメタデータの追加
カスタムURLを使用したオブジェクト・ストレージ・バケットへのデータの追加
ベータ版の顧客:
ベータ・フェーズでナレッジ・ベースを作成した場合は、URL処理機能が動作するように、データ・ソースを削除して再作成する必要がある場合があります。
召喚へのカスタムURLの割当て
metadata
オブジェクトにカスタムURLを追加します。このトピックでは、OCI CLIを使用してmetadata
オブジェクトを追加または更新する方法について説明します。
- デフォルトの引用をオーバーライドする
metadata
オブジェクトには、customized_url_source
という名前が必要です。 customized_url_source
という名前のmetadata
オブジェクトを1つ持つことができます。- 各
customized_url_source
にはURLを1つのみ含めることができます。 - ステップ5のコマンドは、現在の
metadata
オブジェクトの値を置き換えるため、metadata
オブジェクトの追加と更新の両方に有効です。 --metadata
オブジェクトの値を、ステップ5のコマンドに示されている形式で渡してください。