キーフレーズ抽出
キーワード抽出は、入力テキストから、最も関連性の高い単語および表現を抽出する自動プロセスです。これは、コンテンツを要約して、主要トピックを認識するのに役立ちます。
キー・フレーズの抽出モデルは、NLPとMLを使用して、テキストの主要なポイントに関連するインサイトを検出します。これは、構造化されていない入力テキストを認識し、キー・ワードとキー・フレーズ(KP)を返します。
KPは、ドキュメント内の主語と目的語で構成されます。これらの主語や目的語に関連付けられている形容詞などの修飾語も出力に含まれます。KPに関する信頼性を表す各キー・フレーズの信頼度スコアが含まれます。信頼度スコアは0から1までの値です。
ユース・ケース
次のようなビジネス・ユース・ケースがあります:
-
ブランド・モニタリング
-
市場研究のモニタリング
-
競合市場分析
-
カスタマ・サポート・チケット
-
従業員フィードバック分析
-
顧客レビュー
-
電子メール分析
サポートされている機能
-
キー・フレーズ
-
信頼度スコア
-
リクエストでは、単一レコードおよび複数レコード・バッチがサポートされます。
入力テキストでサポートされる言語
- 英語
- スペイン語
例
入力テキスト | キー・フレーズ |
---|---|
|
|
|
|
最初の例のJSONは次のとおりです:
- サンプル・リクエスト
-
POST https://<region-url>/20210101/actions/batchDetectLanguageKeyPhrases
- APIリクエスト形式:
-
{ "documents": [ { "key": "doc1", "text": "Red Bull Racing Honda, the four-time Formula-1 World Champion team, has chosen Oracle Cloud Infrastructure (OCI) as their infrastructure partner." } ] }
- レスポンスJSON:
-
{ "documents": [ { "key": "1", "keyPhrases": [ { "text": "red bull racing honda", "score": 0.9997546563973576 }, { "text": "oracle cloud infrastructure", "score": 0.9997546563973576 }, { "text": "infrastructure partner", "score": 0.9997546563973576 }, { "text": "oci", "score": 0.9979336625058923 } ], "languageCode": "en" } ], "errors": [] }
制約
-
キー・フレーズ(修飾する形容詞を含む名詞句)が識別されます。つまり、この条件に合わない単語は無視されることがあります。
-
このモデルでは大文字と小文字は区別されません。
-
単語間に複数の句読点を含むテキストが、キー・フレーズとしてフラグ付けされる場合があります。
-
正しい形式のURL (http、httpsまたはwwwから始まる)は識別されます。