AMD Strix Halo の Unified Memory は Apple Silicon と何が違う？

Strix Halo（Ryzen AI MAX+ 395）は 256bit LPDDR5X バスで帯域 256GB/s、最大128GBのうち最大96GBを GPU 用 VRAM に割り当てられ、x86 + Windows / Linux のソフトウェア資産をそのまま使えます。Apple M3 Ultra は 1024bit バスで 819GB/s と帯域では上回りますが macOS 専用です。つまり Strix Halo は帯域で Apple に劣る代わりに、x86 エコシステムで Apple 風の大容量統合メモリを初めて両立した SoC、という位置づけです。

Strix Halo は通常のノートPCの iGPU（メモリ共有）と何が違う？

バス幅が違います。Phoenix / Hawk Point などの通常 iGPU は CPU と同じ 128bit の DDR5 SO-DIMM バス（約90GB/s）を使い、CPU と GPU が帯域を奪い合ううえ BIOS の GPU 割当上限も16GB程度でした。Strix Halo は専用の 256bit LPDDR5X-8000 バスで帯域256GB/s、GPU 割当も最大96GB と、帯域も割当上限も一桁違う別物です。

Strix Halo はローカルLLM用に VRAM をどれだけ割り当てられる？

AMD Variable Graphics Memory（VGM）により、最大128GBのメモリのうち最大96GBを GPU 用 VRAM として動的に割り当てられます。これにより、従来の x86 + Windows / Linux では不可能だった「iGPU 単体で 70B クラスの LLM を動かす」が成立します。ただしメモリは SoC 周辺にオンボードで固定（増設・交換不可）なので、購入時の容量がそのまま寿命まで固定になります。

AMD Unified Memory とは（Strix Halo）：最大96GBをVRAM化、Apple・NVIDIA VRAMとの違い 2026年版

本記事は Amazon.co.jp および各販売店のアフィリエイトリンクを含む場合があります。推奨は性能・コスパ・実機ベンチマーク基準で編集判断しており、提供記事は受け付けていません。詳細はプライバシーポリシーをご覧ください。

Strix Halo Unified Memory 2026:LPDDR5X 256bit / 96GB VRAM 割当の構造解説

結論：Strix Halo の Unified Memory は「Apple 風の SoC 統合メモリを x86 + Windows / Linux にもたらした構造」です。256bit LPDDR5X バスで帯域 256GB/s、最大 128GB のうち 96GB を GPU 用 VRAM として動的に割り当てられる。Apple Silicon の M3 Ultra（800GB/s）には帯域で劣るものの、Windows / Linux のソフトウェア資産をそのまま使える点で「Apple のメモリ豪華さ × x86 のエコシステム」を初めて両立した SoC です。通常の iGPU の「システムメモリ共有」とはバス幅が違う別物として理解する必要があります。

「Strix Halo の Unified Memory って Apple と何が違うんですか？」「ノートPCの iGPU と何が違うんですか？」。Ryzen AI MAX+ 395（Strix Halo）搭載機が 2026 年に MINISFORUM・ASUS・GMKtec から登場し、検索やフォーラムでこの 2 つの質問が急増しています。同じ「Unified Memory」「メモリ共有」という言葉を使うので混同されがちですが、3 者（Strix Halo / Apple Silicon / 通常 iGPU）はメモリの構造がまったく違います。

この記事では、Strix Halo の Unified Memory を メモリバス幅・帯域・アクセス遅延・VRAM 割当機構 の 4 軸で分解し、Apple Silicon と NVIDIA dGPU と通常の iGPU（Phoenix / Hawk Point）と並べて、何がどう違うのかを構造から整理します。Strix Halo を「Apple と同じ Unified Memory」と紹介しているだけの記事の一段下、実装の話までを扱います。

「ローカル LLM の実測値だけを知りたい」方は「Ryzen AI MAX+ 395 (Strix Halo) ローカルLLM 実機ベンチマーク 2026年版」、「Strix Halo を載せたミニ PC をどれにするか」は「ミニPC / SFF（小型）PC 選び方ガイド 2026年版」をどうぞ。本記事は「なぜ Strix Halo が革新的なのか」をアーキテクチャ視点で読み解く構造解説です。

まず用語：3 種類の「メモリ共有」を区別する

「メモリ共有」と一口に言っても、ハードウェア的にはまったく違う実装が混在しています。Strix Halo の話に入る前に、3 つを区別しておきます。

方式	代表例	メモリの物理位置	バス幅	帯域	GPU 割当上限
通常 iGPU の共有メモリ	Phoenix / Hawk Point / Meteor Lake	DIMM スロット（SO-DIMM）	128bit	約 90GB/s（DDR5-5600）	BIOS で 16GB 程度
Strix Halo Unified Memory	Ryzen AI MAX+ 395	SoC 周辺にオンボード	256bit	256GB/s	最大 96GB（VGM）
Apple Silicon Unified Memory	M3 Ultra	SoC パッケージ内	1024bit（Ultra）	819GB/s	全量（macOS で動的）
NVIDIA dGPU の専用 VRAM	RTX 5090	GPU 基板にハンダ付け	512bit（GDDR7）	1,792GB/s	全量（物理上限）

ここで一番見落とされやすいのが、「Strix Halo は通常の iGPU とバス幅が違う」 という点です。Phoenix / Hawk Point のような従来の iGPU は CPU と同じ 128bit バス（DDR5 SO-DIMM × 2 枚）でメモリにアクセスするので、CPU と GPU が帯域を奪い合う構造でした。Strix Halo は専用の 256bit バスで LPDDR5X-8000 をオンボード接続するので、帯域の絶対値がそもそも一桁違います。

Strix Halo の Unified Memory：仕様の核

Ryzen AI MAX+ 395 の Unified Memory 周りの仕様をまとめます。

項目	Ryzen AI MAX+ 395（Strix Halo）
CPU	Zen 5、16 コア 32 スレッド
iGPU	Radeon 8060S（40 CU、RDNA 3.5）
NPU	XDNA 2、50 TOPS
メモリ規格	LPDDR5X-8000（オンボード固定）
メモリ容量	32 / 64 / 96 / 128 GB
メモリバス	256bit（128bit × 2 チャネル）
メモリ帯域	約 256 GB/s
iGPU 用 VRAM 割当	最大 96GB（AMD Variable Graphics Memory）
TDP	55〜120W（モード可変）

注目すべきは「メモリがオンボード固定」「バスが 256bit」「VRAM 割当が最大 96GB」の 3 つです。これらが組み合わさることで、従来の x86 + Windows / Linux 環境では不可能だった「iGPU 単体で 70B クラスの LLM を動かす」が成立します。

なぜ「オンボード固定」なのか

Strix Halo は LPDDR5X-8000 を SoC 周辺の基板に直接ハンダ付けしています。これは Apple Silicon と同じ思想で、配線長を最短にして信号品質と消費電力を稼ぐためです。DIMM スロットを介すると物理的な距離と挿抜のための機械的余裕が必要で、LPDDR5X-8000 の信号速度では帯域を維持できません。

その代償としてユーザーがメモリを後から増設・交換することは不可能になりました。購入時のメモリ容量がそのまま寿命まで固定 という Apple Silicon と同じ制約が x86 にも持ち込まれた形です。これが嫌で AM5 系の通常デスクトップに残る選択肢も依然として合理的です。

256bit バスの意味

通常のデスクトップ CPU（Ryzen 9000 / Core Ultra 200）のメモリバスは 128bit です。Strix Halo はその 2 倍の 256bit。これは「メモリチャネルが 2 倍ある」と読み替えて構いません。DDR5-6000 で 96GB/s 級だった帯域が、Strix Halo では 256GB/s まで跳ねます。

iGPU の性能はメモリ帯域に強く依存するので、この 2 倍の帯域がそのまま GPU 性能のジャンプにつながっています。Radeon 8060S（40 CU）が単体 GPU 換算で RTX 4060 〜 4070 級の性能を出せているのは、CU 数の多さに加えて 256bit バスで GPU が必要な帯域を確保できているからです。

AMD Variable Graphics Memory（VGM）= 96GB VRAM 割当

Strix Halo の最大のキラー機能が AMD Variable Graphics Memory（VGM） です。これは Unified Memory プールから動的に GPU 用 VRAM を切り出す仕組みで、Windows / Linux の両方で動作します。

物理メモリ容量	VGM で割当可能な VRAM 上限
32 GB	約 24 GB
64 GB	約 48 GB
96 GB	約 72 GB
128 GB	最大 96 GB

128GB モデルで 96GB を VRAM に割り当てたとき、iGPU が掴めるメモリ量は RTX 5090（32GB）の 3 倍、RTX PRO 6000 Blackwell（96GB）と同等 になります。Llama 3.3 70B Q4（実ファイル 42GB）が 1 枚の iGPU 上で完結し、Qwen 3 120B クラスや DeepSeek V3 の 8bit 量子化版まで射程に入ります。

設定は Windows なら Adrenalin Edition の「パフォーマンス → グラフィックス → 詳細設定」、Linux なら amdgpu.gttsize カーネルパラメータで指定します。BIOS 側で UMA Frame Buffer Size を最大に振り、OS 側で VGM を有効化する 2 段階の手順が必要です。

Apple Silicon との比較：帯域では負け、エコシステムで勝つ

Strix Halo がよく Apple Silicon（特に M3 Ultra）と比較されるのは、両者ともに「SoC + Unified Memory + 高帯域」という同じ思想で作られているからです。横並びで見ます。

項目	Strix Halo (128GB)	M3 Ultra (192GB)	M4 Max (128GB)
メモリ規格	LPDDR5X-8000	LPDDR5X-7500	LPDDR5X-7500
メモリバス	256bit	1024bit	512bit
メモリ帯域	256 GB/s	819 GB/s	546 GB/s
GPU 用最大割当	96 GB	約 144 GB（75%）	約 96 GB（75%）
OS	Windows / Linux	macOS のみ	macOS のみ
価格目安（128GB）	35〜50 万円	—	80〜90 万円

帯域では M3 Ultra に対して 1/3、M4 Max に対しても約半分 という大差があります。LLM 推論は典型的なメモリ帯域律速のワークロードなので、同じ Llama 3.3 70B Q4 を回しても M3 Ultra の方が体感で 2〜3 倍速く感じる場面が多いです。

ではなぜ Strix Halo に意味があるかというと、「同じメモリ豪華さを Windows / Linux 環境で 1/2〜1/3 の値段で得られる」 からです。Windows 用 CUDA 互換ツール、AMD ROCm 環境、Ollama・LM Studio・llama.cpp・vLLM のような OSS 推論ランタイム、そして既存の x86 開発ツールチェイン（VS Code / WSL2 / Docker Desktop / NVIDIA 系のチュートリアル）をそのまま使えます。Mac に移行する心理的・移行コストを払わずに 96GB クラスの VRAM を得たい人にとっては、Strix Halo が唯一の選択肢です。

NVIDIA dGPU との比較：速度では絶対に負ける、容量で勝つ

NVIDIA dGPU との比較は「帯域 vs 容量」のトレードオフが Apple との比較よりさらに極端になります。

項目	Strix Halo (128GB)	RTX 5090	RTX PRO 6000 Blackwell
メモリ規格	LPDDR5X-8000	GDDR7	GDDR7 ECC
メモリ容量	128 GB（96 GB VRAM 化）	32 GB	96 GB
メモリ帯域	256 GB/s	1,792 GB/s	1,800 GB/s
FP16 演算性能	iGPU として中程度	100+ TFLOPS	140+ TFLOPS
価格目安	35〜50 万円	50〜60 万円（カード単体）	130〜150 万円（カード単体）
学習・ファインチューニング	推論寄り	◎	◎

帯域で 7 倍、演算性能でも一桁の差があります。70B Q4 を Strix Halo で 5〜6 tok/s 出すのに対し、RTX 5090 は同じモデルが乗り切らないか、PRO 6000 で 30〜50 tok/s 出る という極端な性能差になります。「動かしたい」だけなら Strix Halo、「速く動かしたい」なら PRO 6000、というのが端的な切り分けです。

ただし RTX PRO 6000 は単体で 130 万円超、Mac Studio M3 Ultra 192GB は 130 万円前後で、その下のグレードでは Strix Halo 機（35〜50 万円）がほぼ唯一の「70B+ を動かせる選択肢」になります。個人レベルの予算で 70B を「とりあえず動かしたい」需要の本命 がここに落ちてきます。

通常 iGPU との違い：「専用 256bit バス」が決定的

意外と混乱されているのが、Strix Halo と通常の iGPU（Phoenix / Hawk Point / Meteor Lake / Lunar Lake）の違いです。「両方とも CPU と GPU がメモリを共有する」点では同じですが、実装は別物です。

項目	通常 iGPU（Phoenix / Lunar Lake）	Strix Halo
メモリバス	128bit（CPU と共有）	256bit（GPU 用に拡張）
帯域	80〜120 GB/s	256 GB/s
GPU 用 VRAM 割当上限	BIOS で 16GB 程度	96GB（VGM）
CU 数（GPU 規模）	8〜16 CU	40 CU
想定用途	軽い 3D、動画再生	ローカル LLM、Stable Diffusion

通常 iGPU では CPU と GPU が同じ 128bit バスで帯域を奪い合う構造でした。GPU が大量にメモリを読みに行くと CPU 側のレスポンスも落ちます。Strix Halo は GPU 用に独立した 256bit バス相当のメモリ階層を持っている ので、GPU が全力でメモリを読んでも CPU は別チャネルで動けます。「iGPU が大きくなっただけ」ではなく、「内蔵 GPU でも本格的にメモリ帯域を確保できる構造に変わった」というのが Strix Halo の本質です。

用途別の選び方

ここまでの構造を踏まえて、用途別の判断ガイドです。

やりたいこと	推奨
70B Q4 を Windows / Linux で動かしたい	Strix Halo 128GB
70B FP16 / 100B+ MoE を動かしたい	Mac Studio M3 Ultra 192GB 以上
70B を最速で推論したい	RTX PRO 6000 96GB
14B〜32B クラスを高速に推論したい	RTX 5090 32GB
Stable Diffusion XL / Flux 推論	Strix Halo or RTX 5090
ファインチューニング / 学習	NVIDIA dGPU 一択（ROCm はまだ厳しい）
普通の自作機にしたい	AM5 + RTX 5090 / 5080

「70B を Windows で、35〜50 万円の予算で動かしたい」が Strix Halo の射程の中心 です。これより速度が欲しければ NVIDIA dGPU、より大きいモデルを 1 台で動かしたければ Mac Studio M3 Ultra、というのが 2026 年 5 月時点の選び分けになります。

Unified Memory と VRAM の概念差そのものをより深く理解したい方は、Apple Silicon と NVIDIA を中心に解説した「Apple Silicon の Unified Memory と NVIDIA VRAM、ローカルLLM では何が違うのか 2026年版」と、VRAM 単体の必要量計算を扱った「VRAM とは何か。ローカルLLM 推論に必要な量の決まり方 2026年版」も合わせてどうぞ。

まとめ：Strix Halo の Unified Memory が変えた地図

Strix Halo の Unified Memory は 「Apple 風の SoC 統合メモリを x86 にもたらした」初の構造
256bit LPDDR5X-8000 バスで 256 GB/s、最大 128GB のうち 96GB を VRAM 化（AMD VGM）
通常の iGPU（Phoenix / Lunar Lake）とは メモリバス幅と帯域が一桁違う 別物
Apple Silicon M3 Ultra に対しては 帯域で大きく劣るが、Windows / Linux + x86 エコシステム で 1/2〜1/3 の価格
NVIDIA dGPU に対しては 帯域・演算性能で大差負け、容量・コスパで勝つ
「70B を Windows / Linux で 35〜50 万円で動かす」需要では現状ほぼ唯一の選択肢

2026 年は Apple Silicon と Strix Halo の 2 つで「SoC + 大容量 Unified Memory」というアーキテクチャが本格的に立ち上がった年でした。NVIDIA dGPU が帯域・演算で圧倒する一方、SoC 統合の道は「容量・コスパ・電力」で別の最適解を提供します。どちらを選ぶかは、最終的に「動かすモデルの規模」と「OS の制約」で決まります。

入手先・関連商品

当サイトは Amazon.co.jp アソシエイト・プログラムに参加予定です。下記リンク経由で購入された場合、紹介料を受け取ることがあります。読者の負担は増えません。リンクは記事評価とは独立しており、編集判断には影響しません。

Strix Halo 搭載ミニ PC（Ryzen AI MAX+ 395）

MINISFORUM MS-S1 MAX を Amazon.co.jp で見る：Strix Halo ミニ PC の本命、128GB 構成が選べる
GMKtec EVO-X2 Ryzen AI MAX を Amazon.co.jp で見る：価格を抑えた Strix Halo 選択肢
ASUS ROG Z13 Flow 2026 Ryzen AI MAX を Amazon.co.jp で見る：モバイル運用したい人向けのタブレット型 Strix Halo

あなたに合うPCを診断する

用途や予算をもう少し細かく入力すると、3つの候補構成を提案します。

→ 診断スタート

Apple Silicon の Unified Memory と NVIDIA VRAM、ローカルLLM では何が違うのか 2026年版 — Apple vs NVIDIA の構造比較。本記事と合わせて Unified Memory の地図が一通り揃う
Ryzen AI MAX+ 395 (Strix Halo) ローカルLLM 実機ベンチマーク 2026年版 — 70B / 120B クラスの実測 tok/s
ミニPC / SFF（小型）PC 選び方ガイド 2026年版 — Strix Halo を載せたミニ PC のどれを買うか
VRAM とは何か。ローカルLLM 推論に必要な量の決まり方 2026年版 — VRAM の必要量計算の基礎