オンデマンド推論に対する支払
OCI生成AIのオンデマンド推論にコミットすると、次のメリットが得られます。
- 生成AIの使用を開始するための障壁が少ない。
- 使用可能なすべての生成AI基盤モデルにアクセスします。
- モデルの実験と評価に最適です。
- トランザクションのPay as you goです。詳細は、次のノートを参照してください。
オンデマンド推論では、次の文字長に従って支払います。
- チャット: プロンプトの長さ(文字数) +レスポンスの長さ(文字数)
- テキスト生成: プロンプトの長さ(文字数) +レスポンスの長さ(文字数)
- サマリー: プロンプトの長さ(文字) +レスポンスの長さ(文字)
- テキスト埋込み: 入力長(文字)
「価格設定」ページで、1 character
は1 transaction
として計算されます。
基盤モデルをホストする場合や、専用AIクラスタでファインチューニングする場合、トランザクションではなく単位時間で課金されます。この場合、専用AIクラスタのコストを計算する方法を学習するには、専用AIクラスタへの支払を参照してください。
モデルのオンデマンド価格への照合
価格設定ページの基本モデルとその製品名と一致させるには、次の表を参照してください。価格設定ページには、推論にプレイグラウンド、APIまたはCLIを使用する場合の10,000件のオンデマンド・トランザクションの価格がリストされます。次に、この項の例を確認して、入力文字と出力文字の数に基づいてコストを計算する方法を学習します。
チャット・モデル
モデル名 | OCIモデル名 | 価格設定ページ製品名 |
---|---|---|
Cohere Command R | cohere.command-r-16k (非推奨) |
Small Cohere |
Command R 08-2024 | cohere.command-r-08-2024 |
Small Cohere |
Cohere Command R+ | cohere.command-r-plus (非推奨) |
Large Cohere |
Command R+ 08-2024 | cohere.command-r-plus-08-2024 |
Large Cohere |
Meta Llama 3 | meta.llama-3-70b-instruct (非推奨) |
Large Meta |
Meta Llama 3.1 (70B) | meta.llama-3.1-70b-instruct |
Large Meta |
Meta Llama 3.1 (405B) | meta.llama-3.1-405b-instruct |
Meta Llama 3.1 405B |
Meta Llama 3.2 11B Vision | meta.llama-3.2-11b-vision-instruct |
Large Meta |
Meta Llama 3.2 90B Vision | meta.llama-3.2-90b-vision-instruct |
Large Meta |
モデルの埋込み
モデル名 | OCIモデル名 | 価格設定ページ製品名 |
---|---|---|
Cohere English Embed V3 | cohere.embed-english-v3.0 |
Embed Cohere |
Cohere Multilingual Embed V3 | cohere.embed-multilingual-v3.0 |
Embed Cohere |
Cohere English Light Embed V3 | cohere.embed-english-light-v3.0 |
Embed Cohere |
Cohere Multilingual Light Embed V3 | cohere.embed-multilingual-light-v3.0 |
Embed Cohere |
チャットの例
Paulは、次のプロンプト(220 characters
long)を使用してmeta.llama-3.3-70b-instruct
モデルをコールします。
サラウンド・サウンドを記録できるUSB接続コンパクト・マイク用の製品ピッチを生成します。マイクは、音楽や会話の録音に最も役立ちます。マイクは、ポッドキャストの記録にも役立ちます。
モデルからのレスポンスは2,205 characters
longです。ポールはこの電話の費用を知りたい。ここでは、コストを計算するステップを示します。
テキスト埋込みの例
Ginaは、顧客契約を新しいセマンティック検索アプリケーションの埋込みに変換しています。平均して、Ginaは毎時16の文書を取り込みます。各ドキュメントの長さは約1,000 characters
です。Ginaは、これらの埋込みを生成するための月次請求の見積を取得したいと考えています。ここでは、コストを計算するステップを示します。