AMD Strix Halo の Unified Memory とは:Apple Silicon・NVIDIA VRAM との違い 2026年版
AMD Ryzen AI MAX+ 395(Strix Halo)の Unified Memory アーキテクチャを 2026年版で解説。Apple Silicon の Unified Memory・NVIDIA の VRAM とは何が違うのか、なぜ最大 96GB を GPU 用に割り当ててローカル LLM を動かせるのかを、メモリバンド幅・帯域・アクセス遅延の3軸で比較します。
- #Strix Halo
- #Ryzen AI MAX+ 395
- #Unified Memory
- #VRAM
- #LPDDR5X
- #AMD
- #Apple Silicon
- #RDNA 3.5
- #ローカルLLM
本記事は Amazon.co.jp および各販売店のアフィリエイトリンクを含む場合があります。推奨は性能・コスパ・実機ベンチマーク基準で編集判断しており、提供記事は受け付けていません。詳細は プライバシーポリシー をご覧ください。

結論:Strix Halo の Unified Memory は「Apple 風の SoC 統合メモリを x86 + Windows / Linux にもたらした構造」です。256bit LPDDR5X バスで帯域 256GB/s、最大 128GB のうち 96GB を GPU 用 VRAM として動的に割り当てられる。Apple Silicon の M3 Ultra(800GB/s)には帯域で劣るものの、Windows / Linux のソフトウェア資産をそのまま使える点で「Apple のメモリ豪華さ × x86 のエコシステム」を初めて両立した SoC です。通常の iGPU の「システムメモリ共有」とはバス幅が違う別物として理解する必要があります。
「Strix Halo の Unified Memory って Apple と何が違うんですか?」「ノートPCの iGPU と何が違うんですか?」。Ryzen AI MAX+ 395(Strix Halo)搭載機が 2026 年に MINISFORUM・ASUS・GMKtec から登場し、検索やフォーラムでこの 2 つの質問が急増しています。同じ「Unified Memory」「メモリ共有」という言葉を使うので混同されがちですが、3 者(Strix Halo / Apple Silicon / 通常 iGPU)はメモリの構造がまったく違います。
この記事では、Strix Halo の Unified Memory を メモリバス幅・帯域・アクセス遅延・VRAM 割当機構 の 4 軸で分解し、Apple Silicon と NVIDIA dGPU と通常の iGPU(Phoenix / Hawk Point)と並べて、何がどう違うのかを構造から整理します。Strix Halo を「Apple と同じ Unified Memory」と紹介しているだけの記事の一段下、実装の話までを扱います。
「ローカル LLM の実測値だけを知りたい」方は「Ryzen AI MAX+ 395 (Strix Halo) ローカルLLM 実機ベンチマーク 2026年版」、「Strix Halo を載せたミニ PC をどれにするか」は「ミニPC / SFF(小型)PC 選び方ガイド 2026年版」をどうぞ。本記事は「なぜ Strix Halo が革新的なのか」をアーキテクチャ視点で読み解く構造解説です。
まず用語:3 種類の「メモリ共有」を区別する
「メモリ共有」と一口に言っても、ハードウェア的にはまったく違う実装が混在しています。Strix Halo の話に入る前に、3 つを区別しておきます。
| 方式 | 代表例 | メモリの物理位置 | バス幅 | 帯域 | GPU 割当上限 |
|---|---|---|---|---|---|
| 通常 iGPU の共有メモリ | Phoenix / Hawk Point / Meteor Lake | DIMM スロット(SO-DIMM) | 128bit | 約 90GB/s(DDR5-5600) | BIOS で 16GB 程度 |
| Strix Halo Unified Memory | Ryzen AI MAX+ 395 | SoC 周辺にオンボード | 256bit | 256GB/s | 最大 96GB(VGM) |
| Apple Silicon Unified Memory | M3 Ultra | SoC パッケージ内 | 1024bit(Ultra) | 819GB/s | 全量(macOS で動的) |
| NVIDIA dGPU の専用 VRAM | RTX 5090 | GPU 基板にハンダ付け | 512bit(GDDR7) | 1,792GB/s | 全量(物理上限) |
ここで一番見落とされやすいのが、「Strix Halo は通常の iGPU とバス幅が違う」 という点です。Phoenix / Hawk Point のような従来の iGPU は CPU と同じ 128bit バス(DDR5 SO-DIMM × 2 枚)でメモリにアクセスするので、CPU と GPU が帯域を奪い合う構造でした。Strix Halo は専用の 256bit バスで LPDDR5X-8000 をオンボード接続するので、帯域の絶対値がそもそも一桁違います。
Strix Halo の Unified Memory:仕様の核
Ryzen AI MAX+ 395 の Unified Memory 周りの仕様をまとめます。
| 項目 | Ryzen AI MAX+ 395(Strix Halo) |
|---|---|
| CPU | Zen 5、16 コア 32 スレッド |
| iGPU | Radeon 8060S(40 CU、RDNA 3.5) |
| NPU | XDNA 2、50 TOPS |
| メモリ規格 | LPDDR5X-8000(オンボード固定) |
| メモリ容量 | 32 / 64 / 96 / 128 GB |
| メモリバス | 256bit(128bit × 2 チャネル) |
| メモリ帯域 | 約 256 GB/s |
| iGPU 用 VRAM 割当 | 最大 96GB(AMD Variable Graphics Memory) |
| TDP | 55〜120W(モード可変) |
注目すべきは「メモリがオンボード固定」「バスが 256bit」「VRAM 割当が最大 96GB」の 3 つです。これらが組み合わさることで、従来の x86 + Windows / Linux 環境では不可能だった「iGPU 単体で 70B クラスの LLM を動かす」が成立します。
なぜ「オンボード固定」なのか
Strix Halo は LPDDR5X-8000 を SoC 周辺の基板に直接ハンダ付けしています。これは Apple Silicon と同じ思想で、配線長を最短にして信号品質と消費電力を稼ぐためです。DIMM スロットを介すると物理的な距離と挿抜のための機械的余裕が必要で、LPDDR5X-8000 の信号速度では帯域を維持できません。
その代償としてユーザーがメモリを後から増設・交換することは不可能になりました。購入時のメモリ容量がそのまま寿命まで固定 という Apple Silicon と同じ制約が x86 にも持ち込まれた形です。これが嫌で AM5 系の通常デスクトップに残る選択肢も依然として合理的です。
256bit バスの意味
通常のデスクトップ CPU(Ryzen 9000 / Core Ultra 200)のメモリバスは 128bit です。Strix Halo はその 2 倍の 256bit。これは「メモリチャネルが 2 倍ある」と読み替えて構いません。DDR5-6000 で 96GB/s 級だった帯域が、Strix Halo では 256GB/s まで跳ねます。
iGPU の性能はメモリ帯域に強く依存するので、この 2 倍の帯域がそのまま GPU 性能のジャンプにつながっています。Radeon 8060S(40 CU)が単体 GPU 換算で RTX 4060 〜 4070 級の性能を出せているのは、CU 数の多さに加えて 256bit バスで GPU が必要な帯域を確保できているからです。
AMD Variable Graphics Memory(VGM)= 96GB VRAM 割当
Strix Halo の最大のキラー機能が AMD Variable Graphics Memory(VGM) です。これは Unified Memory プールから動的に GPU 用 VRAM を切り出す仕組みで、Windows / Linux の両方で動作します。
| 物理メモリ容量 | VGM で割当可能な VRAM 上限 |
|---|---|
| 32 GB | 約 24 GB |
| 64 GB | 約 48 GB |
| 96 GB | 約 72 GB |
| 128 GB | 最大 96 GB |
128GB モデルで 96GB を VRAM に割り当てたとき、iGPU が掴めるメモリ量は RTX 5090(32GB)の 3 倍、RTX PRO 6000 Blackwell(96GB)と同等 になります。Llama 3.3 70B Q4(実ファイル 42GB)が 1 枚の iGPU 上で完結し、Qwen 3 120B クラスや DeepSeek V3 の 8bit 量子化版まで射程に入ります。
設定は Windows なら Adrenalin Edition の「パフォーマンス → グラフィックス → 詳細設定」、Linux なら amdgpu.gttsize カーネルパラメータで指定します。BIOS 側で UMA Frame Buffer Size を最大に振り、OS 側で VGM を有効化する 2 段階の手順が必要です。
Apple Silicon との比較:帯域では負け、エコシステムで勝つ
Strix Halo がよく Apple Silicon(特に M3 Ultra)と比較されるのは、両者ともに「SoC + Unified Memory + 高帯域」という同じ思想で作られているからです。横並びで見ます。
| 項目 | Strix Halo (128GB) | M3 Ultra (192GB) | M4 Max (128GB) |
|---|---|---|---|
| メモリ規格 | LPDDR5X-8000 | LPDDR5X-7500 | LPDDR5X-7500 |
| メモリバス | 256bit | 1024bit | 512bit |
| メモリ帯域 | 256 GB/s | 819 GB/s | 546 GB/s |
| GPU 用最大割当 | 96 GB | 約 144 GB(75%) | 約 96 GB(75%) |
| OS | Windows / Linux | macOS のみ | macOS のみ |
| 価格目安(128GB) | 35〜50 万円 | — | 80〜90 万円 |
帯域では M3 Ultra に対して 1/3、M4 Max に対しても約半分 という大差があります。LLM 推論は典型的なメモリ帯域律速のワークロードなので、同じ Llama 3.3 70B Q4 を回しても M3 Ultra の方が体感で 2〜3 倍速く感じる場面が多いです。
ではなぜ Strix Halo に意味があるかというと、「同じメモリ豪華さを Windows / Linux 環境で 1/2〜1/3 の値段で得られる」 からです。Windows 用 CUDA 互換ツール、AMD ROCm 環境、Ollama・LM Studio・llama.cpp・vLLM のような OSS 推論ランタイム、そして既存の x86 開発ツールチェイン(VS Code / WSL2 / Docker Desktop / NVIDIA 系のチュートリアル)をそのまま使えます。Mac に移行する心理的・移行コストを払わずに 96GB クラスの VRAM を得たい人にとっては、Strix Halo が唯一の選択肢です。
NVIDIA dGPU との比較:速度では絶対に負ける、容量で勝つ
NVIDIA dGPU との比較は「帯域 vs 容量」のトレードオフが Apple との比較よりさらに極端になります。
| 項目 | Strix Halo (128GB) | RTX 5090 | RTX PRO 6000 Blackwell |
|---|---|---|---|
| メモリ規格 | LPDDR5X-8000 | GDDR7 | GDDR7 ECC |
| メモリ容量 | 128 GB(96 GB VRAM 化) | 32 GB | 96 GB |
| メモリ帯域 | 256 GB/s | 1,792 GB/s | 1,800 GB/s |
| FP16 演算性能 | iGPU として中程度 | 100+ TFLOPS | 140+ TFLOPS |
| 価格目安 | 35〜50 万円 | 50〜60 万円(カード単体) | 130〜150 万円(カード単体) |
| 学習・ファインチューニング | 推論寄り | ◎ | ◎ |
帯域で 7 倍、演算性能でも一桁の差があります。70B Q4 を Strix Halo で 5〜6 tok/s 出すのに対し、RTX 5090 は同じモデルが乗り切らないか、PRO 6000 で 30〜50 tok/s 出る という極端な性能差になります。「動かしたい」だけなら Strix Halo、「速く動かしたい」なら PRO 6000、というのが端的な切り分けです。
ただし RTX PRO 6000 は単体で 130 万円超、Mac Studio M3 Ultra 192GB は 130 万円前後で、その下のグレードでは Strix Halo 機(35〜50 万円)がほぼ唯一の「70B+ を動かせる選択肢」になります。個人レベルの予算で 70B を「とりあえず動かしたい」需要の本命 がここに落ちてきます。
通常 iGPU との違い:「専用 256bit バス」が決定的
意外と混乱されているのが、Strix Halo と通常の iGPU(Phoenix / Hawk Point / Meteor Lake / Lunar Lake)の違いです。「両方とも CPU と GPU がメモリを共有する」点では同じですが、実装は別物です。
| 項目 | 通常 iGPU(Phoenix / Lunar Lake) | Strix Halo |
|---|---|---|
| メモリバス | 128bit(CPU と共有) | 256bit(GPU 用に拡張) |
| 帯域 | 80〜120 GB/s | 256 GB/s |
| GPU 用 VRAM 割当上限 | BIOS で 16GB 程度 | 96GB(VGM) |
| CU 数(GPU 規模) | 8〜16 CU | 40 CU |
| 想定用途 | 軽い 3D、動画再生 | ローカル LLM、Stable Diffusion |
通常 iGPU では CPU と GPU が同じ 128bit バスで帯域を奪い合う構造でした。GPU が大量にメモリを読みに行くと CPU 側のレスポンスも落ちます。Strix Halo は GPU 用に独立した 256bit バス相当のメモリ階層を持っている ので、GPU が全力でメモリを読んでも CPU は別チャネルで動けます。「iGPU が大きくなっただけ」ではなく、「内蔵 GPU でも本格的にメモリ帯域を確保できる構造に変わった」というのが Strix Halo の本質です。
用途別の選び方
ここまでの構造を踏まえて、用途別の判断ガイドです。
| やりたいこと | 推奨 |
|---|---|
| 70B Q4 を Windows / Linux で動かしたい | Strix Halo 128GB |
| 70B FP16 / 100B+ MoE を動かしたい | Mac Studio M3 Ultra 192GB 以上 |
| 70B を最速で推論したい | RTX PRO 6000 96GB |
| 14B〜32B クラスを高速に推論したい | RTX 5090 32GB |
| Stable Diffusion XL / Flux 推論 | Strix Halo or RTX 5090 |
| ファインチューニング / 学習 | NVIDIA dGPU 一択(ROCm はまだ厳しい) |
| 普通の自作機にしたい | AM5 + RTX 5090 / 5080 |
「70B を Windows で、35〜50 万円の予算で動かしたい」が Strix Halo の射程の中心 です。これより速度が欲しければ NVIDIA dGPU、より大きいモデルを 1 台で動かしたければ Mac Studio M3 Ultra、というのが 2026 年 5 月時点の選び分けになります。
Unified Memory と VRAM の概念差そのものをより深く理解したい方は、Apple Silicon と NVIDIA を中心に解説した「Apple Silicon の Unified Memory と NVIDIA VRAM、ローカルLLM では何が違うのか 2026年版」と、VRAM 単体の必要量計算を扱った「VRAM とは何か。ローカルLLM 推論に必要な量の決まり方 2026年版」も合わせてどうぞ。
まとめ:Strix Halo の Unified Memory が変えた地図
- Strix Halo の Unified Memory は 「Apple 風の SoC 統合メモリを x86 にもたらした」初の構造
- 256bit LPDDR5X-8000 バスで 256 GB/s、最大 128GB のうち 96GB を VRAM 化(AMD VGM)
- 通常の iGPU(Phoenix / Lunar Lake)とは メモリバス幅と帯域が一桁違う 別物
- Apple Silicon M3 Ultra に対しては 帯域で大きく劣るが、Windows / Linux + x86 エコシステム で 1/2〜1/3 の価格
- NVIDIA dGPU に対しては 帯域・演算性能で大差負け、容量・コスパで勝つ
- 「70B を Windows / Linux で 35〜50 万円で動かす」需要では現状ほぼ唯一の選択肢
2026 年は Apple Silicon と Strix Halo の 2 つで「SoC + 大容量 Unified Memory」というアーキテクチャが本格的に立ち上がった年でした。NVIDIA dGPU が帯域・演算で圧倒する一方、SoC 統合の道は「容量・コスパ・電力」で別の最適解を提供します。どちらを選ぶかは、最終的に「動かすモデルの規模」と「OS の制約」で決まります。
入手先・関連商品
当サイトは Amazon.co.jp アソシエイト・プログラムに参加予定です。下記リンク経由で購入された場合、紹介料を受け取ることがあります。読者の負担は増えません。リンクは記事評価とは独立しており、編集判断には影響しません。
Strix Halo 搭載ミニ PC(Ryzen AI MAX+ 395)
- MINISFORUM MS-S1 MAX を Amazon.co.jp で見る:Strix Halo ミニ PC の本命、128GB 構成が選べる
- GMKtec EVO-X2 Ryzen AI MAX を Amazon.co.jp で見る:価格を抑えた Strix Halo 選択肢
- ASUS ROG Z13 Flow 2026 Ryzen AI MAX を Amazon.co.jp で見る:モバイル運用したい人向けのタブレット型 Strix Halo
あなたに合うPCを診断する
用途や予算をもう少し細かく入力すると、3つの候補構成を提案します。
→ 診断スタート
関連記事
- Apple Silicon の Unified Memory と NVIDIA VRAM、ローカルLLM では何が違うのか 2026年版 — Apple vs NVIDIA の構造比較。本記事と合わせて Unified Memory の地図が一通り揃う
- Ryzen AI MAX+ 395 (Strix Halo) ローカルLLM 実機ベンチマーク 2026年版 — 70B / 120B クラスの実測 tok/s
- ミニPC / SFF(小型)PC 選び方ガイド 2026年版 — Strix Halo を載せたミニ PC のどれを買うか
- VRAM とは何か。ローカルLLM 推論に必要な量の決まり方 2026年版 — VRAM の必要量計算の基礎