デスクトップ 比較 更新 2026年6月20日

NVIDIA DGX Spark vs Ryzen AI MAX+ 395 vs Mac Studio:128GBクラスのローカルLLM実行機 3択 2026年版

DGX Spark vs Ryzen AI MAX+ 395 はどっちを買うべきか。128GB unified memoryのローカルLLM実行機が3陣営出揃った2026年、NVIDIA DGX Spark(GB10・約4,699ドル)・Ryzen AI MAX+ 395(Strix Halo)・Mac Studioを、メモリ帯域・tok/sec・動かせるモデル規模・CUDAエコシステム・価格・消費電力で比較し、自分の用途でどれを買うべきかを判断軸として示します。

  • #DGX Spark
  • #GB10
  • #Ryzen AI MAX+ 395
  • #Strix Halo
  • #Mac Studio
  • #ローカルLLM
  • #Unified Memory
  • #128GB

本記事は Amazon.co.jp および各販売店のアフィリエイトリンクを含む場合があります。推奨は性能・コスパ・実機ベンチマーク基準で編集判断しており、提供記事は受け付けていません。詳細は プライバシーポリシー をご覧ください。

NVIDIA DGX Spark vs Ryzen AI MAX+ 395 vs Mac Studio:128GBクラスのローカルLLM実行機3択 2026年版。メモリ帯域・tok/sec・CUDA・価格で比較

結論:速度(tok/sec)を取るなら Mac Studio、CUDA資産・微調整・将来のクラウド移植を取るなら NVIDIA DGX Spark、コスパと汎用性を取るなら Ryzen AI MAX+ 395(Strix Halo)です。3機種とも「128GB前後のメモリをGPUと共有して大きいモデルを1機に載せる」という同じコンセプトですが、決定的に違うのはメモリ帯域(Mac Studio が約546〜800GB/s と圧倒、DGX Spark 約273GB/s・Strix Halo 約215〜256GB/s)とソフトウェアエコシステム(DGX Spark はフルCUDA、Strix Halo は ROCm/Vulkan、Mac は MLX/Metal)の2点です。「自分の用途がどの軸を重視するか」で答えが変わります。

2026年、128GBクラスのローカルLLM実行機がついに3陣営出揃いました。AppleのMac Studio、AMDの Ryzen AI MAX+ 395(Strix Halo)、そして新顔の NVIDIA DGX Spark(GB10 Grace Blackwell)。どれも「大容量のメモリをGPUから直接使い、70Bクラス以上の巨大モデルをデスクトップ1台で動かす」という同じ夢を売っています。

では、自分はどれを買うべきなのか。私はこの記事で、①メモリ帯域、②トークン生成速度(tok/sec)、③プロンプト処理、④動かせるモデル規模、⑤エコシステム、⑥価格・消費電力の6軸で3機種を横並びにします。先に断っておくと、ここで使う数値は各社公称値と海外レビュー・コミュニティ実測を出典付きで集約したものです。iris-lab の自前実測はまだで、誇張した数字は載せません。実機での再現計測は入手次第このページに追記します。

まず3機種の素性を1枚に

項目NVIDIA DGX Spark(GB10)Ryzen AI MAX+ 395(Strix Halo)Mac Studio(M4 Max / M3 Ultra)
プロセッサGB10 Grace BlackwellZen 5 + Radeon 8060S(RDNA 3.5)Apple M4 Max / M3 Ultra
CPU20コア Arm(Cortex-X925×10 + A725×10)16コア32スレッド x8616コア / 最大32コア
GPUBlackwell・6,144 CUDAコア・5th-gen TensorRadeon 8060S・40 CU40コア / 最大80コア
メモリ128GB LPDDR5X(256-bit)最大128GB LPDDR5X最大128GB / 最大512GB
メモリ帯域約273 GB/s約215〜256 GB/s約546 GB/s(M4 Max)/ 約800 GB/s(M3 Ultra)
AI演算1 PFLOP FP4(sparsity)XDNA 2 NPU 50 TOPS超Neural Engine
OSDGX OS(Ubuntuベース)Windows / LinuxmacOS
エコシステムフルCUDA / TensorRT / NIMROCm / VulkanMLX / Metal
価格目安約$4,399〜5,404(≒70〜85万円)約30〜51万円約55〜100万円超

この表で最初に目が行くのはメモリ容量でしょうが、ローカルLLMの体感を決めるのは容量ではなくメモリ帯域です。ここを外すと買ってから後悔します。

軸1:メモリ帯域がtok/secの天井を決める

ローカルLLMのトークン生成では、1トークン出すたびにモデルの全重みをメモリから読み出します。だから読み出し速度=メモリ帯域が、そのまま生成速度の天井になります。TOPSやCUDAコア数より、まずここを見てください。

機種メモリ帯域帯域比(Strix Halo基準)
Ryzen AI MAX+ 395約215〜256 GB/s1.0x
NVIDIA DGX Spark約273 GB/s約1.1〜1.3x
Mac Studio M4 Max約546 GB/s約2.1〜2.5x
Mac Studio M3 Ultra約800 GB/s約3.1〜3.7x

DGX Spark と Strix Halo はどちらも256-bit幅のLPDDR5Xで、帯域はほぼ同じレンジです。一方で Mac Studio は M4 Max でも倍以上、M3 Ultra なら3倍以上の帯域を持ちます。純粋な生成速度(tok/sec)の序列は、この帯域の序列にほぼ比例します。

この仕組みは「メモリ帯域幅(GB/s)がローカルLLMの tok/sec を決める仕組み 2026年版」で詳しく解説しています。「DGX Spark は1 PFLOPもあるのに、なぜ Mac に生成速度で負けるの?」という疑問は、ここを読むと氷解します。

軸2:トークン生成速度(tok/sec)の現実

帯域から予想される生成速度の傾向です。70B Q4クラスでの目安レンジを示します。

機種70B Q4 生成 tok/sec(目安)備考
Mac Studio M3 Ultra約18〜25 tok/s帯域800GB/sで最速帯
Mac Studio M4 Max約6〜9 tok/s128GB構成の現実解
NVIDIA DGX Spark約5〜8 tok/s帯域273GB/s・FP4最適化で底上げ
Ryzen AI MAX+ 395約5 tok/s帯域律速

生成速度だけ見れば、帯域に勝る Mac が優位です。ただし注意点が2つあります。

1つ目。DGX Spark と Strix Halo は帯域が近いため、素のtok/secでは大差がつきません。差が出るのは後述するprefillとエコシステムです。

2つ目。70Bクラスをこのクラスの機材で回すというのは、「20〜30 tok/s の即レス」を買う選択ではありません。「自前で・オフラインで・巨大モデルを動かせる」こと自体に価値がある選択です。速度の即時性が最優先なら、答えはクラウドAPIやGPUサーバーです。128GB機が狙う土俵ではありません。

軸3:プロンプト処理(prefill)はDGX Sparkの隠れた強み

トークン生成(decode)とは別に、入力プロンプトを最初に読み込む処理(prefill / prompt processing)があります。長いコンテキストを投げたときの「最初の1文字が出るまでの待ち時間」を決める部分で、ここで効くのは帯域より演算性能です。

DGX Spark は 1 PFLOP の FP4 演算と6,144基のCUDAコアを持ち、prefillでは3機種の中で頭一つ抜けています。Tom’s Hardware のレビューでも、DGX Spark が総合で Ryzen AI MAX+ 395 を上回ると評価されている主因はここにあります。「長いコードベースや文書を丸ごと投入して質問する」「RAGで大量の文脈を毎回読ませる」といったエージェント的な使い方では、prefillの速さが体感を大きく左右します。

prefillが用途を左右する理由は「ローカルLLM プロンプト処理(prefill)速度 GPU別ベンチマーク 2026年版」で掘り下げています。tok/secだけ見て選ぶと、長文用途で「最初の応答が遅すぎる」と後悔しがちです。

軸4:動かせるモデル規模

容量別に、どこまでのモデルが現実的に載るかを整理します。

モデル規模DGX Spark 128GBStrix Halo 128GBMac Studio 128GBMac Studio M3 Ultra 512GB
70B Q4◎ 余裕◎ 余裕◎ 余裕◎ 余裕
70B Q8○ 動く○(96GB割当)○ 動く◎ 余裕
120B級 MoE○ 動く○ 動く○ 動く◎ 余裕
200B級(量子化)○(NVIDIA公称・最大200B)△ ギリギリ△ ギリギリ◎ 動く
300GB超フル○ 動く

128GB勢(DGX Spark / Strix Halo / Mac Studio M4 Max)は、おおむね70B〜120B MoEまでが快適圏です。NVIDIAは DGX Spark で量子化により最大200Bパラメータまでを謳い、2台をConnectX-7で接続すれば405Bクラスにも手が届くとしています。一方、300GB超の超巨大モデルを1機にフルで載せたいなら、これは128GB機の手に余ります。最大512GBを積める Mac Studio M3 Ultra の出番です。

軸5:エコシステムが一番の分かれ目

帯域や容量以上に、長く使ううえで効いてくるのがソフトウェアエコシステムです。

DGX SparkStrix HaloMac Studio
推論スタックCUDA / TensorRT-LLM / NIMROCm / Vulkan / llama.cppMLX / Metal / llama.cpp
微調整(fine-tuning)◎ フルCUDAで最も枯れている△ ROCm対応が前提○ MLXで可能・情報量は中
クラウド移植性◎ データセンターGPUと同一スタック
ツールの動作実績◎ 大半がCUDA前提で動く○ 改善中○ Apple系で充実
つまずきにくさ△(ROCmは環境構築が鬼門なことがある)

DGX Spark の最大の価値はここです。クラウドのデータセンターGPUと同じCUDA/TensorRT/NIM がデスクトップで動くため、研究や開発で書いたコードがそのまま本番のクラウドGPUに移植できます。「手元で試す → クラウドにスケールする」を同一スタックで通せるのは、Strix Halo や Mac にはない強みです。

逆に「とにかく動かせればいい」「コミュニティの情報が豊富なほうがいい」なら、Mac の MLX/Metal は導入が滑らかで日本語情報も増えています。Strix Halo の ROCm は性能こそ出るものの、環境構築でつまずく報告がまだあります(Vulkan/llama.cpp 経由なら比較的安定)。Strix Halo の実測と運用の勘所は「Ryzen AI MAX+ 395(Strix Halo)ローカルLLM 推論ベンチマーク 2026年版」にまとめています。

軸6:価格と消費電力

DGX SparkStrix Halo ミニMac Studio M4 Max 128GB
価格目安約$4,399〜5,404(≒70〜85万円)約30〜51万円約55〜65万円
OEM廉価版Acer / ASUS(Ascent GX10)/ Dell(Pro Max GB10)/ MSI(EdgeXpert)各社ミニPC多数
推論時の消費電力約170〜240W帯約120〜150W約120〜160W
アイドル約15〜25W約20〜30W
静音性ファン搭載筐体次第ほぼ無音

価格は Strix Halo ミニが圧勝です。Beelink GTR9 Pro のような攻めた機種なら128GB構成で約30万円から狙え、DGX Spark の半額以下になります。DGX Spark は当初$3,999スタートでしたが$700の値上げを経て、NVIDIA Marketplaceでは$4,699(DLI講座込み)、Best Buyでは$5,404と、実売は$4,400〜5,400レンジです。

消費電力はどれも優秀で、70B推論を150〜240Wで回せます。RTX 5090デスクトップ(推論中600〜700W)と比べれば3機種とも圧倒的に省電力で、「24時間モデルを回しっぱなし」用途ではどれを選んでも電気代で勝てます。

総合判定:あなたはどれを買うべきか

6軸を踏まえて言い切ります。

あなたの優先事項選ぶべき
70B以上の生成速度・静音・即レス体感Mac Studio(M4 Max / M3 Ultra)
300GB超の超巨大モデルを1機に載せたいMac Studio M3 Ultra(512GB)
CUDA資産・微調整・クラウド移植の互換性NVIDIA DGX Spark
長文コンテキスト・RAGでprefillが効く用途NVIDIA DGX Spark
とにかく安く128GBのLLM機が欲しいRyzen AI MAX+ 395 ミニ
Windows/Linux・x86互換・ゲーム兼用Ryzen AI MAX+ 395 ミニ

私の総括はこうです。速度に金を払えるなら Mac、CUDAという「将来への互換性」に金を払うなら DGX Spark、合理的に安く済ませるなら Strix Halo。 3機種ともスペック表の「128GB」は同じでも、性格はまるで違います。容量だけ見て「どれも同じようなもの」と判断すると、買ってから帯域差・価格差・エコシステムの壁に必ず驚きます。

2陣営での詳しい実測対決は「Ryzen AI MAX+ 395 vs Mac Studio M4 Max ローカルLLM 実測対決 2026年版」に、Strix Haloのメモリ構造そのものは「AMD Strix Halo の Unified Memory とは」にまとめてあります。AMDが2026年6月に予約開始した公式開発機を DGX Spark と単機対決させた「DGX Spark vs Ryzen AI Halo Developer Platform 2026:$3,999 のAMD公式Strix Halo開発機は買いか」も、DGX Spark を検討中なら合わせて読んでください。

入手先・関連商品

当サイトは Amazon.co.jp アソシエイト・プログラムに参加しています。下記リンク経由で購入された場合、紹介料を受け取ることがあります。読者の負担は増えません。リンクは記事評価とは独立しており、編集判断には影響しません。

NVIDIA DGX Spark(GB10)/ OEM版

AMD Ryzen AI MAX+ 395(Strix Halo)ミニPC

Apple Mac Studio(速度・静音・大容量)

UPS(DGX Spark / Mac Studio M3 Ultra のような長納期高単価機を停電から守る)


あなたに合うPCを診断する

用途や予算をもう少し細かく入力すると、3つの候補構成を提案します。

診断スタート

関連記事