サービスの概要

Document Understandingは、サーバーレスのマルチテナント・サービスであり、アップロードするドキュメント・ファイルからテキスト、表、その他のキー・データを検出して分類するために使用できます。

このサービスには、コンソール、REST API、SDKおよびCLIを使用してアクセスできます。ProcessorJob APIエンドポイントを使用して、ドキュメントの個々のファイルまたはバッチを処理できます。

次の事前トレーニング済モデルがサポートされています。

光学式文字認識(OCR): ドキュメント内のテキストを検出して認識します。
テキスト抽出: 単語レベルおよび行レベルのテキストと、テキストが見つかった場所のバウンディング・ボックスの座標を提供します。
キー/値抽出: 入金、請求書、パスポートおよびドライバIDからキー/値ペア情報の事前定義済リストを抽出します。
表の抽出: 表形式でコンテンツを抽出し、セルの行と列の関係を維持します。
ドキュメント分類: ビジュアル表示、高レベルの機能および抽出されたキーワードに基づいて、ドキュメントを様々なタイプに分類します。文書タイプの例として、請求書と受入、履歴書があります。
光学文字認識(OCR) PDF: OCI Object Storageサービスで検索可能なPDFファイルを生成します。