Thunderbolt 5 の eGPU でローカルLLM は実用になりますか？

モデルが GPU の VRAM に一度載りきる用途（単機推論・画像生成）なら実用になります。Thunderbolt 5 でも GPU への実効リンクは PCIe Gen4 x4 ≒ 約8GB/s でデスクトップ x16 の約1/8ですが、生成自体は GPU 内のメモリ帯域で律速されるため、PCIe 帯域の細さはほとんど効きません。逆に VRAM に載りきらない巨大モデルのレイヤー分割や CPU オフロードが走ると、PCIe 経由のデータ転送がボトルネック化します。

eGPU はゲーミングとAIで効き方が違うのですか？

違います。ゲーミングは毎フレーム CPU と GPU が PCIe 越しに大量のデータをやり取りするため、Thunderbolt 5 eGPU では内蔵接続比で18〜27%程度フレームレートが落ちます。一方ローカルLLM 推論や Stable Diffusion 系の画像生成は、初回ロード後は GPU 内で計算が完結するため低下は数%にとどまります。この非対称性が eGPU を AI 用途で選ぶ根拠になります。

eGPU を使うのに必要なホスト側の条件は？

Thunderbolt 5（または USB4 v2）ポートが必須です。さらに巨大モデルを VRAM へ転送する際の前処理でメインメモリと CPU を使うため、ホスト側に 32GB 以上のメモリと最近の CPU があると安定します。ノートPCやミニPCにTB5ポートがあれば接続できますが、ポートが Thunderbolt 4 / USB4 v1 までだと帯域がさらに半分になり、ロード時間が伸びる点に注意してください。

RTX 5090 を eGPU（外付けGPUボックス）として使えますか？

使えます。AORUS RTX 5090 AI BOX のように、GPU 本体が RTX 5090（32GB VRAM）そのものの Thunderbolt 5 eGPU が登場しています。VRAM 容量・GPU 内部帯域はデスクトップ版と同じなので、32GB に載りきるモデルなら推論・生成性能はデスクトップ内蔵とほぼ同じです。差が出るのはモデルロード時間で、数十GB を約 8GB/s（PCIe Gen4 x4 相当）で転送するため、デスクトップ（約 64GB/s）より数倍長くなります。

eGPU（Thunderbolt 5）でローカルLLMを動かすとデスクトップよりどれくらい遅くなりますか？

推論・生成はほとんど遅くなりません。Thunderbolt 5 eGPU の実効リンクは PCIe Gen4 x4 ≒ 約8GB/s（デスクトップ x16 比約1/8）ですが、推論・画像生成は初回ロード後に GPU 内で計算が完結するため、速度低下は数%にとどまります。一方ゲーミングは毎フレーム PCIe を使うため内蔵比18〜27%低下します。この非対称性が eGPU を AI 用途で選ぶ根拠です。

eGPU でローカルLLM・AI開発はできるか 2026年版：Thunderbolt 5 外付け RTX 5090 の帯域ボトルネックを実測ベースで検証

本記事は Amazon.co.jp および各販売店のアフィリエイトリンクを含む場合があります。推奨は性能・コスパ・実機ベンチマーク基準で編集判断しており、提供記事は受け付けていません。詳細はプライバシーポリシーをご覧ください。

eGPU でローカルLLM 2026：Thunderbolt 5 外付け RTX 5090 の PCIe Gen4 x4 帯域がAIとゲーミングで効き方が違う図解

結論：Thunderbolt 5 の外付け GPU（eGPU）でローカルLLM・画像生成は「モデルが VRAM に載りきる用途なら」十分実用です。TB5 でも GPU への実効リンクは PCIe Gen4 x4 ≒ 約8GB/s で、デスクトップ x16（約64GB/s）の約1/8。しかし推論・生成は初回ロード後 GPU 内のメモリ帯域で律速されるため、PCIe 帯域の細さはほとんど効きません。eGPU が苦手なのは ① VRAM に載りきらない巨大モデルのレイヤー分割、② CPU オフロード併用、③ ゲーミング（毎フレーム転送）の3つ。「ノート/ミニPCに据え置きGPUの推論性能を足したい」なら有力、「ゲーム主目的」なら素直に内蔵がおすすめです。

「ノートPCやミニPCはコンパクトで良いが、ローカルLLM や画像生成のために RTX 5090 級の GPU を後付けしたい」。この需要に応えるのが Thunderbolt 5 接続の外付け GPU ボックス（eGPU）です。2026 年は Gigabyte AORUS RTX 5090 AI BOX のように、製品名に「AI」を冠した eGPU が登場し、ゲーミングだけでなく AI 用途を正面から想定するようになりました。

ただし eGPU には「PCIe 帯域がデスクトップより細い」という構造的な制約があります。本記事は、この帯域制約がローカルLLM 推論・画像生成・学習にどう効くか、そしてゲーミングとどう効き方が違うかを、公開実測ベースで整理します。

まず結論の前提：eGPU の「帯域」は本当に細いのか

Thunderbolt 5 は公称 80Gbps（双方向時は最大 120Gbps）。数字だけ見ると速そうですが、これを GPU の PCIe リンクに換算すると印象が変わります。

接続方式	GPU への実効リンク	実効帯域の目安	デスクトップ x16 比
デスクトップ内蔵（PCIe 5.0 x16）	PCIe 5.0 x16	約 64 GB/s	1.0x（基準）
デスクトップ内蔵（PCIe 4.0 x16）	PCIe 4.0 x16	約 32 GB/s	0.5x
Thunderbolt 5 eGPU	PCIe 4.0 x4 相当	約 8 GB/s	約 1/8
Thunderbolt 4 / USB4 v1 eGPU	PCIe 3.0 x4 相当	約 3〜4 GB/s	約 1/16

Thunderbolt 5 の 80Gbps を GB/s に直すと理論 10GB/s、プロトコルオーバーヘッドを引いた実効は約 8GB/s 前後。これは PCIe Gen4 x4 相当 で、デスクトップの x16 接続に対して約 1/8 の帯域です。

「1/8 しかないなら使い物にならないのでは？」と感じるのが自然な反応ですが、ここがローカルLLM・AI 用途のポイントです。この帯域がボトルネックになるかどうかは、ワークロードが何に律速されているかで決まります。

なぜAIはゲーミングほどPCIe帯域に敏感でないのか

GPU を使う処理は、PCIe（CPU⇔GPU 間のデータ転送）に対する依存度が用途で大きく違います。

ゲーミング：毎フレーム、CPU がジオメトリ・ドローコール・テクスチャ更新を GPU へ送り続ける。60〜240fps で常時 PCIe を使うため、帯域が細いとフレームレートが直接落ちる
ローカルLLM 推論：起動時にモデル重み（数十GB）を一度 VRAM へ転送したら、以降の生成は GPU 内で完結。VRAM ⇔ 演算ユニット間（GPU 内部メモリ帯域、RTX 5090 なら 1,792GB/s）で律速され、PCIe はほぼ使わない
画像生成（Stable Diffusion / SDXL / FLUX）：モデルを VRAM に載せたら、あとは GPU 内で拡散ステップを回す。PCIe を使うのは生成画像の取り出し程度で軽量
学習・ファインチューニング：データローダが毎ステップ大量のバッチを GPU へ送り、勾配を戻す。マルチGPU なら GPU 間通信も走るため、PCIe 帯域に敏感

この違いを一枚にまとめると、eGPU の向き不向きが見えてきます。

ワークロード	PCIe 依存度	eGPU（TB5）での性能低下目安
ローカルLLM 推論（VRAM に載りきる単機モデル）	極小	数%以内
画像生成（SDXL / FLUX、VRAM 内完結）	小	数%〜5%
ゲーミング（高fps）	大	18〜27%
LLM レイヤー分割（VRAM 超過、CPU オフロード併用）	大	大幅低下
学習・ファインチューニング（マルチGPU）	大	中〜大

AORUS RTX 5090 AI BOX 系のレビューで報告されている傾向も、この表と整合します。ゲームでは内蔵比 18〜27% 低下する一方、AI compute（推論・生成）の低下は数%にとどまる という非対称性が、eGPU を AI 用途で選ぶ最大の根拠です。

具体機種：Gigabyte AORUS RTX 5090 AI BOX

2026 年時点で AI 用途を明示する代表的な eGPU が、Gigabyte の AORUS RTX 5090 AI BOX です。要点を整理します。

項目	AORUS RTX 5090 AI BOX（概要）
搭載 GPU	GeForce RTX 5090（32GB GDDR7）
接続	Thunderbolt 5（実効 PCIe Gen4 x4 相当）
電源	内蔵 PSU（高ワット級、GPU の 575W TGP に対応）
ホスト要件	Thunderbolt 5 ポート必須、TB4 接続は帯域半減
想定用途	ノート/ミニPC への外付け、AI 推論・画像生成・ゲーミング

ポイントは GPU 本体が RTX 5090（32GB VRAM）そのもの であること。VRAM 容量・GPU 内部帯域はデスクトップ版と同じなので、「32GB に載りきるモデル」を回す限り、推論・生成性能はデスクトップ内蔵とほぼ変わりません。差が出るのは、

モデルロード時間：数十GB を約 8GB/s で転送するため、デスクトップ（64GB/s）より数倍長くなる。40GB のモデルなら内蔵 1 秒前後に対し eGPU は 5〜8 秒程度。常駐運用なら一度だけのコストなので許容範囲
VRAM 超過時：32GB を超えるモデルを「一部 CPU メモリにオフロード」する構成にすると、推論中に PCIe 越しの転送が走り、8GB/s がボトルネックになって速度が崩れる

RTX 5090 そのものの AI 用途での実力や、より上位の Pro 6000 系との違いは「RTX 5090 vs 4090 vs PRO 6000 ローカルLLM・AI 用途比較 2026年版」で詳しく扱っています。

電源は GPU の消費電力（RTX 5090 は TGP 575W）をボックス内蔵 PSU で賄うため、ホスト側ノートの電源容量を圧迫しない設計です。ただし TB5 ポートが無いホスト（TB4 / USB4 v1 まで）に繋ぐと帯域がさらに半減し、ロード時間が倍増する点は事前に確認してください。端子の見分け方は「Thunderbolt 5 / USB4 / USB 3.2 の違い 2026年版」で詳しく扱っています。

eGPU が向くケース / 向かないケース

判断軸を表で整理します。

ケース	評価	理由
32GB に載りきる単機モデルを単発推論（70B Q4 までは厳しいが 32B Q4 / 14B Q8 等）	◎	VRAM 内完結で帯域非依存。デスクトップ内蔵とほぼ同速
SDXL / FLUX などの画像生成	◎	拡散ステップは GPU 内完結。eGPU の弱点が出ない
ノート/ミニPC を母艦に、据え置きGPUの推論力を足したい	○	eGPU の本来の使いどころ。普段は本体のみ、必要時だけ接続
VRAM を超える巨大モデルをレイヤー分割（CPU オフロード併用）	△	推論中に PCIe 転送が走り 8GB/s がボトルネック化。速度が大幅低下
複数 GPU でのマルチGPU 学習	△	GPU 間・GPU⇔CPU 通信が帯域律速。学習効率が落ちる
高fps ゲーミングが主目的	✗	18〜27% のフレームレート低下。内蔵 GPU にすべき

「◎」が並ぶのは、いずれも モデルが一度 VRAM に載れば後は GPU 内で計算が完結する ワークロードです。逆に「△・✗」は、推論・描画の最中に CPU⇔GPU の転送が継続的に走る用途。eGPU を検討するなら、自分の使い方がこのどちらに寄っているかを最初に見極めてください。

eGPU か、最初から大容量ミニPCか

eGPU が刺さるのは「すでにノート/ミニPCを持っていて、AI 用途だけ GPU を足したい」場合です。一方、これから AI 用マシンを新調するなら、別解として 大容量 unified memory を積んだミニPC という選択肢もあります。

選択肢	強み	弱み
TB5 eGPU + RTX 5090（32GB）	生成が速い、画像生成に強い、普段はノート単体で身軽	VRAM 32GB の壁、巨大モデル不可、ロード遅い
Strix Halo ミニPC（VRAM 96GB 割当）	70B/120B が単機で動く、省電力（130W前後）	推論速度は遅め（帯域 256GB/s）

「速さ重視・32GB に収まるモデル中心」なら eGPU、「巨大モデルを 1 台で省電力に回したい」ならミニPC、という住み分けです。後者の詳細は「ミニPC / SFF（小型）PC 選び方ガイド 2026年版」を参照してください。外付けせず据え置きで AI 機を組む代替案として、DGX Spark / Strix Halo / Mac Studio を比べた「DGX Spark vs Strix Halo vs Mac Studio ローカルLLM 比較 2026年版」も判断材料になります。ノート単体でどこまで動くかは「ローカルLLM・AI開発が動くノートPCの選び方ガイド 2026年版」が詳しいです。

まとめ：eGPU は「VRAM に載りきる AI 用途」の強力な選択肢

eGPU の帯域制約を 1 行でまとめると 「PCIe は細いが、推論・生成は GPU 内で完結するから効かない」 です。Thunderbolt 5 の実効 8GB/s はデスクトップ x16 の 1/8 ですが、モデルが VRAM に載りきる限り、推論・画像生成の速度低下は数%。ゲーミングの 18〜27% 低下とは別物です。

「ノート/ミニPCを母艦に、必要なときだけ RTX 5090 級の推論力を足す」。この使い方に eGPU はよく刺さります。逆に、32GB を超える巨大モデルのレイヤー分割や、高fps ゲーミングが主目的なら、eGPU の帯域がそのまま足を引っ張ります。自分の用途が「VRAM 内完結」か「常時転送」かを見極めることが、eGPU を選ぶかどうかの分岐点です。

入手先・関連商品

当サイトは Amazon.co.jp アソシエイト・プログラムに参加予定です。下記リンク経由で購入された場合、紹介料を受け取ることがあります。読者の負担は増えません。リンクは記事評価とは独立しており、編集判断には影響しません。

Thunderbolt 5 eGPU ボックス・GPU

あなたに合うPCを診断する

用途や予算をもう少し細かく入力すると、3つの候補構成を提案します。

→ 診断スタート