キーフレーズ抽出

キーワード抽出は、入力テキストから、最も関連性の高い単語および表現を抽出する自動プロセスです。これは、コンテンツを要約して、主要トピックを認識するのに役立ちます。

キー・フレーズの抽出モデルは、NLPとMLを使用して、テキストの主要なポイントに関連するインサイトを検出します。これは、構造化されていない入力テキストを認識し、キー・ワードとキー・フレーズ(KP)を返します。

KPは、ドキュメント内の主語と目的語で構成されます。これらの主語や目的語に関連付けられている形容詞などの修飾語も出力に含まれます。KPに関する信頼性を表す各キー・フレーズの信頼度スコアが含まれます。信頼度スコアは0から1までの値です。

ユース・ケース

次のようなビジネス・ユース・ケースがあります:

  • ブランド・モニタリング

  • 市場研究のモニタリング

  • 競合市場分析

  • カスタマ・サポート・チケット

  • 従業員フィードバック分析

  • 顧客レビュー

  • 電子メール分析

サポートされている機能

  • キー・フレーズ

  • 信頼度スコア

  • リクエストでは、単一レコードおよび複数レコード・バッチがサポートされます。

入力テキストでサポートされる言語

  • 英語
  • スペイン語

入力テキスト キー・フレーズ
Red Bull Racing Honda, the four-time Formula-1 World 
Champion team, has chosen Oracle Cloud Infrastructure 
(OCI) as their infrastructure partner. 
Red Bull Racing Honda 0.9997
Oracle Cloud Infrastructure 0.9583
infrastructure partner 0.9583
oci 0.9979
OCI recently added new services to the existing 
compliance program including SOC, HIPAA, and ISO, to enable our customers 
to solve their use cases. We also released new technical papers and 
guidance documents related to Object Storage, the Australian Prudential 
Regulation Authority (APRA), and the Central Bank of Brazil. These 
resources help regulated customers better understand how OCI 
supports their regional and industry-specific compliance requirements. 
Not only are we expanding our number of compliance offerings and 
regulatory alignments, we continue to add regions and services at 
a faster rate.
OCI 0.9999
new services 0.9998
existing compliance program 0.9998
including SOC 0.9998
use cases 0.9998
new white papers 0.9998
guidance documents 0.9998
Object Storage 0.9998
Australian Prudential Regulation Authority 0.9998
Central Bank of Brazil 0.9998
regulated customers 0.9998
industry-specific compliance requirements 0.9998
number of compliance offerings 0.9998
regulatory alignments 0.9998
faster rate 0.9998
ISO 0.9992
customers 0.9992
apra 0.9992
resources 0.9992
services 0.8186
HIPPA 0.9979
regions 0.9147

最初の例のJSONは次のとおりです:

サンプル・リクエスト
POST https://<region-url>/20210101/actions/batchDetectLanguageKeyPhrases
APIリクエスト形式:
{
  "documents": [
    {
      "key": "doc1",
      "text": "Red Bull Racing Honda, the four-time Formula-1 World Champion team, has chosen Oracle Cloud Infrastructure (OCI) as their infrastructure partner."
    }
  ]
}
レスポンスJSON:
{
    "documents": [
        {
            "key": "1",
            "keyPhrases": [
                {
                    "text": "red bull racing honda",
                    "score": 0.9997546563973576
                },
                {
                    "text": "oracle cloud infrastructure",
                    "score": 0.9997546563973576
                },
                {
                    "text": "infrastructure partner",
                    "score": 0.9997546563973576
                },
                {
                    "text": "oci",
                    "score": 0.9979336625058923
                }
            ],
            "languageCode": "en"
        }
    ],
    "errors": []
}

制約

  • キー・フレーズ(修飾する形容詞を含む名詞句)が識別されます。つまり、この条件に合わない単語は無視されることがあります。

  • このモデルでは大文字と小文字は区別されません。

  • 単語間に複数の句読点を含むテキストが、キー・フレーズとしてフラグ付けされる場合があります。

  • 正しい形式のURL (http、httpsまたはwwwから始まる)は識別されます。