生成AIエージェントでのデータ・ソース・データの取込み

データ取込みジョブは、データ・ソース・ドキュメントからデータを抽出し、分析に適した構造化形式に変換してから、ナレッジ・ベースに格納します。

  1. 「ナレッジ・ベース」リスト・ページで、データ・ソースのデータを収集するナレッジ・ベースを選択します。
    リスト・ページの検索に関するヘルプが必要な場合は、ナレッジ・ベースのリストを参照してください。
  2. データを取り込むデータ・ソースを選択します。
  3. 「取込みジョブの作成」を選択します。
  4. 次の値を入力します:
    • 名前: 文字またはアンダースコアで始まり、文字、数字、ハイフンまたはアンダースコアが続く名前。長さは1から255文字です。
    • 説明: 説明(オプション
    • タグ: 「拡張オプションの表示」を選択し、取込みジョブに1つ以上のタグを追加します。リソースを作成する権限がある場合は、そのタグを更新する権限があります。ヘルプが必要な場合は、タグおよびタグ・ネームスペースの概念を参照してください。
  5. 「作成」を選択します。
  6. 取込みジョブ・ステータスが変更されるまで待機します。必要なアクションを実行します。
    取込みジョブのステータス 摘要 実行するアクション
    成功 ジョブが完了し、すべてのファイルが正常に処理されました。 ステータス・ログをレビューして、すべての更新済ファイルが正常に収集されていることを確認します。
    完了(失敗あり) ジョブが完了し、すべてのファイルが処理されました。ただし、いくつかのファイル障害があります。ファイルの失敗または失敗の可能性は次のとおりです。
    • 破損ファイル
    • PDFファイルはパスワードで保護されています。
    • ファイル内のイメージが小さすぎます。ファイルの内容のrestが収集されます。
    • ファイル内の破損したイメージは無視されます。ファイルの内容のrestが収集されます。
    • ファイル・メタデータ属性の処理中に問題があります。ファイルは収集されますが、メタデータ属性はありません。
    個々のファイル障害の理由を理解するには、ステータス・ログを確認します。問題に対処し、ジョブを再起動します。
    失敗、データ・ソースの修正 データ・ソース構成で指定されたバケットまたはファイルへのアクセスに問題があります。 ステータス・ログで問題の修正方法に関する提案を確認し、ジョブを再起動します。
    失敗、再試行が必要 オブジェクト・ストレージやOpenSearchなどの依存システムには、いくつかの再試行後も問題があります。 後でジョブを再度実行します。
    失敗しました。サポートに連絡してください 再試行して解決できない問題があります。 サポートに連絡

ノート

取込みジョブの作成後
  1. ステータスおよびステータス・ログをレビューして、更新されたすべてのファイルが正常に収集されたことを確認します。ステータス・ログの取得に関するヘルプが必要な場合は、「データ収集ジョブの詳細の取得」を参照してください。
  2. 取込みジョブが失敗した場合(たとえば、ファイルが大きすぎるため)は、問題に対処してジョブを再起動します。ジョブ・ステータスの意味と実行するアクションについては、ステップ6を参照してください。
収集パイプラインによる以前実行されたジョブの処理方法

以前に実行した取込みジョブを再起動すると、パイプラインは次のようになります。

  1. 以前に正常に取り込まれたファイルを検出してスキップします。
  2. 以前に失敗し、それ以降に更新されたファイルのみを取り込みます。
シナリオの例

取り込むファイルが20個あり、最初のジョブ実行で失敗したファイルが2個あるとします。ジョブを再起動すると、パイプラインは次のようになります。

  1. 18個のファイルがすでに正常に取り込まれていることを認識し、無視します。
  2. 以前に失敗し、その後更新された2つのファイルのみを取り込みます。