Claude Fable 5（フェイブル5）の料金を計算検証：Opus 4.8（オーパス4.8）の2倍だが本当に高い？キャッシュ90%引き・Batch 50%引き活用術

Claude Fable 5（フェイブル5）の料金は、入力が100万トークンあたり10ドル、出力が100万トークンあたり50ドル。Opus 4.8（オーパス4.8）の5ドル／25ドルのちょうど2倍という設定で、発表直後から「高すぎる」という声が目立ちました。

ただ、額面の2倍がそのまま2倍の請求になるとは限りません。プロンプトキャッシュの90%引き、Batch APIの50%引き、そして「トークン約30%増」が実際にはどのモデル比の話なのかという前提を全部織り込むと、実効コストの見え方はかなり変わります。この記事では、その3つを数字に落とし込んで計算検証します。

結論から触れると、Opus 4.8と比べる限りトークン数は変わらないため、実効コストは概ね料金どおりの2倍が出発点です。そのうえで、使い方次第で2倍プレミアムは大きく圧縮できます。トークン増加が逆風になるのは、旧世代モデルから移行する場合に限られます。額面だけで判断する前に、自分のワークロードに当てはめて電卓を叩く材料を用意しました。

Fable 5の素の料金（入力10ドル／出力50ドル）とOpus 4.8（5ドル／25ドル）の比較
プロンプトキャッシュ90%引き・Batch API 50%引きで実効単価がどこまで下がるか
トークナイザ約30%増はどのモデル比の話か（対Opus 4.8ではトークン数は同じ）
「実効3〜5倍論」の中身と、2倍プレミアムが相殺されるという反対意見

Contents

Fable 5の料金はOpus 4.8のちょうど2倍
- 素の単価を並べて確認する
- 2倍という数字の受け止め方
プロンプトキャッシュ90%引きの効き方
- キャッシュヒットは入力単価を最大90%引きにする
- キャッシュを織り込んだ入力単価の試算
Batch API 50%引きで入力も出力も半額
- レイテンシを許容できる処理は半額になる
- キャッシュとBatchは重ねられる
トークナイザ約30%増という逆風の正体
- 同じ文章でもトークンが増える
- トークン数は推測せず実測する
「実効3〜5倍」論と「ほぼ2倍で済む」論
- 最悪ケースの3〜5倍という指摘
- 一発成功率で2倍プレミアムが相殺されるという反論
無料利用ウィンドウと注意点
- 6月22日までは追加費用なしで含まれる
- データ保持と思考モードの違い
まとめ
- 2倍プレミアムは設計で圧縮できる

Fable 5の料金はOpus 4.8のちょうど2倍

Fable 5 と Opus 4.8 の100万トークンあたりの料金を比較した表。Fable 5 は入力10ドル・出力50ドル、Opus 4.8 は入力5ドル・出力25ドルで、いずれもちょうど2倍であることを示す。

素の単価を並べて確認する

まず素の料金から確認します。Fable 5は入力が100万トークンあたり10ドル、出力が100万トークンあたり50ドル。これはOpus 4.8の入力5ドル・出力25ドルに対して、入力も出力も正確に2倍の設定です。コンテキストウィンドウは標準で100万トークン、1リクエストの最大出力は12万8千トークンに対応します。この100万トークンは標準価格内の既定値で、別料金ティアではありません。

Fable 5はAnthropicの最も高性能なモデルで、Opus・Sonnet・Haikuの上に新設されたMythosクラスという新ティアに属します。一般提供されるMythosクラスのモデルがFable 5、という位置づけです。最上位ティアらしい価格設定とも見えますが、論点は「額面の2倍がそのまま2倍の負担になるのか」という点に尽きます。

2倍という数字の受け止め方

素の単価だけを見れば、Opus 4.8で1ドルかかっていた処理がFable 5では2ドルになる、という単純な話に映ります。実際、海外の反応でも「10ドル／50ドルという価格が広範な利用の抑止要因になり得る」という指摘が出ています。一般提供されるAnthropicのモデルの中で最も高価なのは確かです。

一方で、APIの作法はOpus 4.8や4.7とほぼ同一なので、既存のコスト最適化テクニックがそのまま効きます。キャッシュやBatchをどれだけ織り込めるかで、実際の請求額は素の単価から大きく動きます。次の章から、その割引を一つずつ数字に当てていきます。Opusとの基本的な違いを押さえたい場合は、Claudeの無料枠と有料利用の境目もあわせて確認しておくと判断がぶれにくくなります。

プロンプトキャッシュ90%引きの効き方

キャッシュヒットは入力単価を最大90%引きにする

プロンプトキャッシュは、繰り返し送る前置き部分（システムプロンプト、長い参照文書、固定のツール定義など）をキャッシュして、再利用時の入力料金を下げる仕組みです。Fable 5ではキャッシュヒット分の入力が最大90%引き、つまり100万トークンあたり10ドルが実質1ドル相当まで下がります。出力側はこの割引の対象外なので、下がるのはあくまで入力のキャッシュヒット部分です。

キャッシュは前置きが固定であるほど効きます。変わらない内容を前に、変わる内容（リクエスト固有の値や毎回違う質問文）を後ろに置く設計にすると、固定部分がキャッシュとして再利用されやすくなります。逆に、毎回変わる値を前置きの先頭に差し込むと再利用が効きにくくなる、というのが基本の考え方です。

キャッシュが効果を発揮するのは、同じ前置きを何度も使う処理です。一度きりの単発リクエストでは再利用が発生しないため、キャッシュのうまみは出ません。RAGやエージェントのように共通の前置きを繰り返し送る用途ほど、入力側のコスト圧縮幅が大きくなります。

キャッシュを織り込んだ入力単価の試算

入力に占めるキャッシュヒットの割合で、実効入力単価がどう変わるかを試算します。前置きが固定で本文だけ変わるRAGやエージェント用途では、入力トークンの大半がキャッシュヒットになることも珍しくありません。仮に入力の80%がキャッシュヒットなら、Fable 5の実効入力単価はおおよそ10ドル×0.2＋1ドル×0.8で約2.8ドル相当まで下がります。

同じ条件をOpus 4.8（入力5ドル、キャッシュヒット0.5ドル相当）で計算すると約1.4ドル。比率としては依然2倍ですが、絶対額の差は素の単価で比べたときより縮みます。出力側はキャッシュの対象外なので50ドル対25ドルの2倍がそのまま残る点は変わりません。キャッシュの設計原則は設定ファイルの組み立て方とも密接に関わるため、固定部分を安定させる運用とセットで考えると効果が出やすくなります。

Batch API 50%引きで入力も出力も半額

Fable 5 の入力100万トークンあたり単価が、素の10ドルから、Batch 50%引きで5ドル、キャッシュ90%引きで1ドルへと下がる様子を示した横棒グラフ。

レイテンシを許容できる処理は半額になる

Batch APIは、即時応答が不要な処理をまとめて非同期に流すことで、入力・出力ともに50%引きで実行できる仕組みです。Fable 5なら入力10ドルが5ドル、出力50ドルが25ドルになります。つまりBatchで流したFable 5の単価は、素のOpus 4.8（5ドル／25ドル）とちょうど同じ水準まで下がる計算です。

大量の文書分類、要約、抽出といった「すぐ返ってこなくてよい」処理は、Batchに載せるだけで実効コストが半分になります。リアルタイム性が要らない処理かどうかが、この50%引きを取りに行けるかの分かれ目です。即時応答を捨てられる処理を切り出してBatchへ回すだけで、最上位モデルの単価がぐっと現実的になります。

キャッシュとBatchは重ねられる

BatchはMessages APIの機能をほぼそのまま使えるため、プロンプトキャッシュとの併用も可能です。共通の長い前置きを持つ大量リクエストをBatchで流せば、入力は「Batch 50%引き」と「キャッシュ90%引き」が重なり、実効入力単価はさらに下がります。出力はキャッシュ対象外ですが、Batchの50%引きは効きます。

同じFable 5でも、リアルタイムでフル単価か、Batch＋キャッシュを効かせるかで実効コストは大きく変わります。「難題はFable 5、それ以外はOpus 4.8」というモデル振り分けに、「即時不要な処理はBatchへ」という軸を足すと、最上位モデルでもコストを抑えながら使えます。

トークナイザ約30%増という逆風の正体

同じ文章でもトークンが増える

よく言われる「トークンが約30%増える」という話は、比較対象をどこに置くかで意味が変わります。Fable 5とMythos 5は、Opus 4.7で導入されたトークナイザを使っており、同じテキストでもOpus 4.7より前の旧世代モデル（Opus 4.6以前）と比べて約30%多くトークンを消費します。これはワークロード依存の概算値ですが、旧世代からの移行では無視できない差です。

たとえばOpus 4.6以前の旧世代モデルで1万トークンだった入力が、Fable 5では約1万3千トークンとして数えられる、というイメージです。一方、Opus 4.8はFable 5と同じOpus 4.7由来のトークナイザを使うため、同じテキストならトークン数は両者で変わりません。つまり対Opus 4.8の実効コストはトークン増を掛け算する必要がなく、概ね料金どおりの2倍です。「単価2倍×トークン約1.3倍で約2.6倍」と見積もるのは比較対象の取り違えで、約30%の増加分を織り込む必要があるのは、旧世代モデルから移行する場合に限られます。

トークン数は推測せず実測する

厄介なのは、この約30%という数字（旧世代比）がワークロードによってぶれることです。コードや非英語テキストでは増え方が変わることもあります。だからこそ、移行前にトークン数を推測で語らず、トークンカウントのAPIで実測してから判断するのが確実です。OpenAI系のトークナイザでの見積もりはClaudeには合わないため、専用のトークンカウントで数える必要があります。

実測のうえで、入力をキャッシュとBatchでどこまで下げられるか、出力トークンを切り詰められるかを合わせて見れば、旧世代から移行する場合の約30%増が割引でどこまで相殺されるかが見えてきます。Opus 4.8からの乗り換えであれば、確認すべきはトークン増ではなく、思考・探索によってトークン消費がどれだけ変わるかです。料金体系そのものの全体像はClaudeの料金体系の全体像でも整理しているので、APIとサブスクの違いを含めて押さえておくと見積もりがしやすくなります。

「実効3〜5倍」論と「ほぼ2倍で済む」論

最悪ケースの3〜5倍という指摘

実務面の中心的な批判はコストです。一般提供のAnthropicモデルの中で最も高価なうえ、トークンを多く消費するため、実効的なタスクコストがOpus 4.8の3〜5倍になり得る、という指摘があります。これは最悪ケースの見立てで確度は中程度ですが、両論を知っておく価値はあります。

ただし前提として、Opus 4.8とFable 5はトークナイザが同じで、同じテキストならトークン数は変わりません。したがってこの3〜5倍という数字は、トークナイザ差から来るものではなく、額面2倍に「最上位モデルが余分に思考・探索してトークンを使う」ケースを重ねた見立てだと整理できます。effortを高く設定すると探索が増える傾向があるため、設定次第でトークン消費が膨らむ場面は確かにあります。

一発成功率で2倍プレミアムが相殺されるという反論

一方で、反対意見もあります。公開コミュニティのローンチ議論に投稿された一意見ですが、あるユーザーは内部のエージェントハーネスで約半分のトークンでOpus 4.8と同等の結果が出たと報告し、価格的にはほぼ同等だとコメントしました。個別環境の報告であり一般化はできないものの、タスクの一発成功率が上がれば2倍の単価プレミアムは相殺され得る、という見立てです。

同じタスクをOpus 4.8で2回やり直すより、Fable 5で1回で仕留めたほうが結果として安い、という構図はあり得ます。SWE-bench Verifiedでは95.0%でOpus 4.8の88.6%を上回るなど、成功率の高さを示すベンチマークも複数あります（いずれもベンダーやアグリゲータの報告値で、独立した第三者監査ではない点には注意が必要です）。判断の起点としては、まずClaudeの価格と使い方の整理を押さえつつ、自分のタスクで一発成功率を測るのが現実的です。

無料利用ウィンドウと注意点

6月22日までは追加費用なしで含まれる

コスト検証の前提として、提供条件も押さえておきます。Fable 5は2026年6月9日に一般提供が始まり、6月9日から6月22日まではPro・Max・Team・シート制Enterpriseの各プランに追加費用なしで含まれます。6月23日にこれらのプランから外れて以降は、使用クレジット（課金）が必要になります。容量が許せば延長され得る、とAnthropicは注記しており、6月22日は確定の締切日ではありません。

無料ティアでは提供されません。提供チャネルはAPI、claude.ai（有料サブスク向けの段階的展開）、Claude Code、AWS Bedrock、Google Vertex AI、Microsoft Foundry、GitHub Copilotなどです。

データ保持と思考モードの違い

運用面では2つ注意点があります。1つはデータ保持で、Mythosクラス（Fable 5を含む）はゼロデータ保持ではなく30日間のデータ保持ポリシーが適用されます。既存のZDR契約をこのモデルクラスに限り上書きするため、金融・医療・セキュリティ用途では事前の確認が必要です。Opus 4.8やSonnet 4.5、Haiku 4.5はZDRのままです。

もう1つは思考モードです。Fable 5の思考はアダプティブシンキングのみで、budget_tokensは廃止され、effortパラメータ（low／medium／high／xhigh／max）で制御します。temperatureなどのサンプリングパラメータも既定値以外は400エラーになります。さらにFable 5固有のクセとして、thinkingを明示的に「無効化」すると400エラーになります（Opus 4.8や4.7では許容されます）。コスト管理の観点では、effortを上げすぎるとトークン消費が膨らむため、まずhighを起点に調整するのが扱いやすい設定です。thinking系のパラメータの考え方はClaudeのthinking機能の解説も参考になります。

まとめ

Fable 5 のコスト最適化の要点をまとめた早見表。2倍の素単価、キャッシュ90%引き、Batch 50%引き、トークン約30%増、effortはhigh起点という項目を一覧する。

2倍プレミアムは設計で圧縮できる

Fable 5の料金はOpus 4.8のちょうど2倍（入力10ドル／出力50ドル）。これは事実ですが、実効コストはその額面だけでは決まりません。プロンプトキャッシュで入力を最大90%引き、Batch APIで入力・出力とも50%引きにできるため、Batchで流せばFable 5の単価は素のOpus 4.8と同水準まで下がります。なお、対Opus 4.8ではトークナイザが同じでトークン数も変わらないため、コストは概ね料金どおりの2倍です。約30%のトークン増が効くのは、Opus 4.6以前の旧世代モデルから移行する場合に限られます。

「実効3〜5倍」は最悪ケースの見立て、「一発成功率で相殺されてほぼ2倍」は反対側の見立てで、どちらも一面の真実です。最終的な答えは、自分のワークロードでトークン数を実測し、キャッシュ・Batch・effort設定を当てはめて電卓を叩くしかありません。難題だけFable 5に回し、即時不要な処理はBatchへ、固定の前置きはキャッシュへ。この3点を押さえれば、最上位モデルでもコストを抑えながら使えます。最新の提供状況はClaude公式の料金ページ、モデルの位置づけはAnthropicの公式発表、第三者の評価値はArtificial Analysisのモデルページで確認できます。

Post Views: 33