生成AIエージェントでのデータ・ソース・データの取込み

データ取込みジョブは、データ・ソース・ドキュメントからデータを抽出し、分析に適した構造化形式に変換してから、ナレッジ・ベースに格納します。

  1. 「ナレッジ・ベース」リスト・ページで、データ・ソースのデータを収集するナレッジ・ベースを選択します。
    リスト・ページの検索に関するヘルプが必要な場合は、ナレッジ・ベースのリストを参照してください。
  2. データを取り込むデータ・ソースを選択します。
  3. 「取込みジョブの作成」を選択します。
  4. 次の値を入力します:
    • 名前: 文字またはアンダースコアで始まり、文字、数字、ハイフンまたはアンダースコアが続く名前。長さは1から255文字です。
    • 説明: 説明(オプション
    • タグ: 「拡張オプションの表示」を選択し、取込みジョブに1つ以上のタグを追加します。リソースを作成する権限がある場合は、そのタグを更新する権限があります。ヘルプが必要な場合は、タグおよびタグ・ネームスペースの概念を参照してください。
  5. 「作成」を選択します。
  6. ジョブの「ライフサイクルの状態」「成功」と表示されるまで待ちます。
    ノート

    取込みジョブの作成後
    1. ステータス・ログをレビューして、更新されたファイルがすべて正常に取り込まれたことを確認します。
    2. 取込みジョブが失敗した場合(ファイルのサイズが大きすぎるなど)、問題に対処し、ジョブを再起動します。
    収集パイプラインによる以前実行されたジョブの処理方法

    以前に実行した取込みジョブを再起動すると、パイプラインは次のようになります。

    1. 以前に正常に取り込まれたファイルを検出してスキップします。
    2. 以前に失敗し、それ以降に更新されたファイルのみを取り込みます。
    シナリオの例

    取り込むファイルが20個あり、最初のジョブ実行で失敗したファイルが2個あるとします。ジョブを再起動すると、パイプラインは次のようになります。

    1. 18個のファイルがすでに正常に取り込まれていることを認識し、無視します。
    2. 以前に失敗し、その後更新された2つのファイルのみを取り込みます。