サービスの概要
Document Understandingは、サーバーレスのマルチテナント・サービスであり、アップロードするドキュメント・ファイルからテキスト、表、その他のキー・データを検出して分類するために使用できます。
このサービスには、コンソール、REST API、SDKおよびCLIを使用してアクセスできます。ProcessorJob APIエンドポイントを使用して、ドキュメントの個々のファイルまたはバッチを処理できます。
次の事前トレーニング済モデルがサポートされています。
- 光学式文字認識(OCR): ドキュメント内のテキストを検出して認識します。
- テキスト抽出: 単語レベルおよび行レベルのテキストと、テキストが見つかった場所のバウンディング・ボックスの座標を提供します。
- キー/値抽出: 入金、請求書、パスポートおよびドライバIDからキー/値ペア情報の事前定義済リストを抽出します。
- 表の抽出: 表形式でコンテンツを抽出し、セルの行と列の関係を維持します。
- ドキュメント分類: ビジュアル表示、高レベルの機能および抽出されたキーワードに基づいて、ドキュメントを様々なタイプに分類します。文書タイプの例として、請求書と受入、履歴書があります。
- 光学文字認識(OCR) PDF: OCI Object Storageサービスで検索可能なPDFファイルを生成します。