データ・ラベリングについて
データ・ラベリングの概要、その内容および使用方法について説明します。
データ・ラベリングは、ドキュメント、テキストおよびイメージ(レコード)のプロパティ(ラベル)を識別し、それらのプロパティに注釈(ラベル)を付けるプロセスです。ニュース記事、ツイートのセンチメント、画像のキャプション、音声録音で話される重要な言葉、ビデオのジャンルは、すべてデータ・ラベルの例です。
多くの機械学習手法では、マシンのトレーニングに使用して自律的なタスクを完了する前に、ラベル付けされたデータが必要です。そのため、データ・ラベリングは人工知能(AI)または機械学習(ML)プロジェクトに不可欠な部分です。
データ・ラベル付けでは、データセットの作成と参照、データ・レコード(ドキュメント、テキストおよびイメージ)の表示およびラベルの適用によるAI/MLモデルの構築が可能です。データセットを行区切りJSONとしてエクスポートして、機械学習モデル開発で使用できます。データセットは、教師ありトレーニングをサポートするために、他のデータおよびAIサービス間でアクセス可能かつ相互運用可能です。たとえば、Oracle Cloud Infrastructure Languageを使用して専用モデルを作成できますが、それが可能なのはラベル付けされたデータをモデルのトレーニングに使用できる場合のみです。データ・ラベリングでは、最小限の構成ステップでRAWデータセットのラベル付けをすばやく開始できます。そのため、Oracle Cloud Infrastructure AIサービスのデータ・ラベリング・エクスペリエンスも提供されます。
ドキュメント、テキストおよびイメージでサポートされているファイル・タイプおよびコンテンツ・タイプの詳細は、「サポートされているファイル・フォーマット」を参照してください。