コラム 比較

AMD Strix Halo の Unified Memory とは:Apple Silicon・NVIDIA VRAM との違い 2026年版

AMD Ryzen AI MAX+ 395(Strix Halo)の Unified Memory アーキテクチャを 2026年版で解説。Apple Silicon の Unified Memory・NVIDIA の VRAM とは何が違うのか、なぜ最大 96GB を GPU 用に割り当ててローカル LLM を動かせるのかを、メモリバンド幅・帯域・アクセス遅延の3軸で比較します。

  • #Strix Halo
  • #Ryzen AI MAX+ 395
  • #Unified Memory
  • #VRAM
  • #LPDDR5X
  • #AMD
  • #Apple Silicon
  • #RDNA 3.5
  • #ローカルLLM

本記事は Amazon.co.jp および各販売店のアフィリエイトリンクを含む場合があります。推奨は性能・コスパ・実機ベンチマーク基準で編集判断しており、提供記事は受け付けていません。詳細は プライバシーポリシー をご覧ください。

Strix Halo Unified Memory 2026:LPDDR5X 256bit / 96GB VRAM 割当の構造解説

結論:Strix Halo の Unified Memory は「Apple 風の SoC 統合メモリを x86 + Windows / Linux にもたらした構造」です。256bit LPDDR5X バスで帯域 256GB/s、最大 128GB のうち 96GB を GPU 用 VRAM として動的に割り当てられる。Apple Silicon の M3 Ultra(800GB/s)には帯域で劣るものの、Windows / Linux のソフトウェア資産をそのまま使える点で「Apple のメモリ豪華さ × x86 のエコシステム」を初めて両立した SoC です。通常の iGPU の「システムメモリ共有」とはバス幅が違う別物として理解する必要があります。

「Strix Halo の Unified Memory って Apple と何が違うんですか?」「ノートPCの iGPU と何が違うんですか?」。Ryzen AI MAX+ 395(Strix Halo)搭載機が 2026 年に MINISFORUM・ASUS・GMKtec から登場し、検索やフォーラムでこの 2 つの質問が急増しています。同じ「Unified Memory」「メモリ共有」という言葉を使うので混同されがちですが、3 者(Strix Halo / Apple Silicon / 通常 iGPU)はメモリの構造がまったく違います。

この記事では、Strix Halo の Unified Memory を メモリバス幅・帯域・アクセス遅延・VRAM 割当機構 の 4 軸で分解し、Apple Silicon と NVIDIA dGPU と通常の iGPU(Phoenix / Hawk Point)と並べて、何がどう違うのかを構造から整理します。Strix Halo を「Apple と同じ Unified Memory」と紹介しているだけの記事の一段下、実装の話までを扱います。

「ローカル LLM の実測値だけを知りたい」方は「Ryzen AI MAX+ 395 (Strix Halo) ローカルLLM 実機ベンチマーク 2026年版」、「Strix Halo を載せたミニ PC をどれにするか」は「ミニPC / SFF(小型)PC 選び方ガイド 2026年版」をどうぞ。本記事は「なぜ Strix Halo が革新的なのか」をアーキテクチャ視点で読み解く構造解説です。

まず用語:3 種類の「メモリ共有」を区別する

「メモリ共有」と一口に言っても、ハードウェア的にはまったく違う実装が混在しています。Strix Halo の話に入る前に、3 つを区別しておきます。

方式代表例メモリの物理位置バス幅帯域GPU 割当上限
通常 iGPU の共有メモリPhoenix / Hawk Point / Meteor LakeDIMM スロット(SO-DIMM)128bit約 90GB/s(DDR5-5600)BIOS で 16GB 程度
Strix Halo Unified MemoryRyzen AI MAX+ 395SoC 周辺にオンボード256bit256GB/s最大 96GB(VGM)
Apple Silicon Unified MemoryM3 UltraSoC パッケージ内1024bit(Ultra)819GB/s全量(macOS で動的)
NVIDIA dGPU の専用 VRAMRTX 5090GPU 基板にハンダ付け512bit(GDDR7)1,792GB/s全量(物理上限)

ここで一番見落とされやすいのが、「Strix Halo は通常の iGPU とバス幅が違う」 という点です。Phoenix / Hawk Point のような従来の iGPU は CPU と同じ 128bit バス(DDR5 SO-DIMM × 2 枚)でメモリにアクセスするので、CPU と GPU が帯域を奪い合う構造でした。Strix Halo は専用の 256bit バスで LPDDR5X-8000 をオンボード接続するので、帯域の絶対値がそもそも一桁違います。

Strix Halo の Unified Memory:仕様の核

Ryzen AI MAX+ 395 の Unified Memory 周りの仕様をまとめます。

項目Ryzen AI MAX+ 395(Strix Halo)
CPUZen 5、16 コア 32 スレッド
iGPURadeon 8060S(40 CU、RDNA 3.5)
NPUXDNA 2、50 TOPS
メモリ規格LPDDR5X-8000(オンボード固定)
メモリ容量32 / 64 / 96 / 128 GB
メモリバス256bit(128bit × 2 チャネル)
メモリ帯域約 256 GB/s
iGPU 用 VRAM 割当最大 96GB(AMD Variable Graphics Memory)
TDP55〜120W(モード可変)

注目すべきは「メモリがオンボード固定」「バスが 256bit」「VRAM 割当が最大 96GB」の 3 つです。これらが組み合わさることで、従来の x86 + Windows / Linux 環境では不可能だった「iGPU 単体で 70B クラスの LLM を動かす」が成立します。

なぜ「オンボード固定」なのか

Strix Halo は LPDDR5X-8000 を SoC 周辺の基板に直接ハンダ付けしています。これは Apple Silicon と同じ思想で、配線長を最短にして信号品質と消費電力を稼ぐためです。DIMM スロットを介すると物理的な距離と挿抜のための機械的余裕が必要で、LPDDR5X-8000 の信号速度では帯域を維持できません。

その代償としてユーザーがメモリを後から増設・交換することは不可能になりました。購入時のメモリ容量がそのまま寿命まで固定 という Apple Silicon と同じ制約が x86 にも持ち込まれた形です。これが嫌で AM5 系の通常デスクトップに残る選択肢も依然として合理的です。

256bit バスの意味

通常のデスクトップ CPU(Ryzen 9000 / Core Ultra 200)のメモリバスは 128bit です。Strix Halo はその 2 倍の 256bit。これは「メモリチャネルが 2 倍ある」と読み替えて構いません。DDR5-6000 で 96GB/s 級だった帯域が、Strix Halo では 256GB/s まで跳ねます。

iGPU の性能はメモリ帯域に強く依存するので、この 2 倍の帯域がそのまま GPU 性能のジャンプにつながっています。Radeon 8060S(40 CU)が単体 GPU 換算で RTX 4060 〜 4070 級の性能を出せているのは、CU 数の多さに加えて 256bit バスで GPU が必要な帯域を確保できているからです。

AMD Variable Graphics Memory(VGM)= 96GB VRAM 割当

Strix Halo の最大のキラー機能が AMD Variable Graphics Memory(VGM) です。これは Unified Memory プールから動的に GPU 用 VRAM を切り出す仕組みで、Windows / Linux の両方で動作します。

物理メモリ容量VGM で割当可能な VRAM 上限
32 GB約 24 GB
64 GB約 48 GB
96 GB約 72 GB
128 GB最大 96 GB

128GB モデルで 96GB を VRAM に割り当てたとき、iGPU が掴めるメモリ量は RTX 5090(32GB)の 3 倍、RTX PRO 6000 Blackwell(96GB)と同等 になります。Llama 3.3 70B Q4(実ファイル 42GB)が 1 枚の iGPU 上で完結し、Qwen 3 120B クラスや DeepSeek V3 の 8bit 量子化版まで射程に入ります。

設定は Windows なら Adrenalin Edition の「パフォーマンス → グラフィックス → 詳細設定」、Linux なら amdgpu.gttsize カーネルパラメータで指定します。BIOS 側で UMA Frame Buffer Size を最大に振り、OS 側で VGM を有効化する 2 段階の手順が必要です。

Apple Silicon との比較:帯域では負け、エコシステムで勝つ

Strix Halo がよく Apple Silicon(特に M3 Ultra)と比較されるのは、両者ともに「SoC + Unified Memory + 高帯域」という同じ思想で作られているからです。横並びで見ます。

項目Strix Halo (128GB)M3 Ultra (192GB)M4 Max (128GB)
メモリ規格LPDDR5X-8000LPDDR5X-7500LPDDR5X-7500
メモリバス256bit1024bit512bit
メモリ帯域256 GB/s819 GB/s546 GB/s
GPU 用最大割当96 GB約 144 GB(75%)約 96 GB(75%)
OSWindows / LinuxmacOS のみmacOS のみ
価格目安(128GB)35〜50 万円80〜90 万円

帯域では M3 Ultra に対して 1/3、M4 Max に対しても約半分 という大差があります。LLM 推論は典型的なメモリ帯域律速のワークロードなので、同じ Llama 3.3 70B Q4 を回しても M3 Ultra の方が体感で 2〜3 倍速く感じる場面が多いです。

ではなぜ Strix Halo に意味があるかというと、「同じメモリ豪華さを Windows / Linux 環境で 1/2〜1/3 の値段で得られる」 からです。Windows 用 CUDA 互換ツール、AMD ROCm 環境、Ollama・LM Studio・llama.cpp・vLLM のような OSS 推論ランタイム、そして既存の x86 開発ツールチェイン(VS Code / WSL2 / Docker Desktop / NVIDIA 系のチュートリアル)をそのまま使えます。Mac に移行する心理的・移行コストを払わずに 96GB クラスの VRAM を得たい人にとっては、Strix Halo が唯一の選択肢です。

NVIDIA dGPU との比較:速度では絶対に負ける、容量で勝つ

NVIDIA dGPU との比較は「帯域 vs 容量」のトレードオフが Apple との比較よりさらに極端になります。

項目Strix Halo (128GB)RTX 5090RTX PRO 6000 Blackwell
メモリ規格LPDDR5X-8000GDDR7GDDR7 ECC
メモリ容量128 GB(96 GB VRAM 化)32 GB96 GB
メモリ帯域256 GB/s1,792 GB/s1,800 GB/s
FP16 演算性能iGPU として中程度100+ TFLOPS140+ TFLOPS
価格目安35〜50 万円50〜60 万円(カード単体)130〜150 万円(カード単体)
学習・ファインチューニング推論寄り

帯域で 7 倍、演算性能でも一桁の差があります。70B Q4 を Strix Halo で 5〜6 tok/s 出すのに対し、RTX 5090 は同じモデルが乗り切らないか、PRO 6000 で 30〜50 tok/s 出る という極端な性能差になります。「動かしたい」だけなら Strix Halo、「速く動かしたい」なら PRO 6000、というのが端的な切り分けです。

ただし RTX PRO 6000 は単体で 130 万円超、Mac Studio M3 Ultra 192GB は 130 万円前後で、その下のグレードでは Strix Halo 機(35〜50 万円)がほぼ唯一の「70B+ を動かせる選択肢」になります。個人レベルの予算で 70B を「とりあえず動かしたい」需要の本命 がここに落ちてきます。

通常 iGPU との違い:「専用 256bit バス」が決定的

意外と混乱されているのが、Strix Halo と通常の iGPU(Phoenix / Hawk Point / Meteor Lake / Lunar Lake)の違いです。「両方とも CPU と GPU がメモリを共有する」点では同じですが、実装は別物です。

項目通常 iGPU(Phoenix / Lunar Lake)Strix Halo
メモリバス128bit(CPU と共有)256bit(GPU 用に拡張)
帯域80〜120 GB/s256 GB/s
GPU 用 VRAM 割当上限BIOS で 16GB 程度96GB(VGM)
CU 数(GPU 規模)8〜16 CU40 CU
想定用途軽い 3D、動画再生ローカル LLM、Stable Diffusion

通常 iGPU では CPU と GPU が同じ 128bit バスで帯域を奪い合う構造でした。GPU が大量にメモリを読みに行くと CPU 側のレスポンスも落ちます。Strix Halo は GPU 用に独立した 256bit バス相当のメモリ階層を持っている ので、GPU が全力でメモリを読んでも CPU は別チャネルで動けます。「iGPU が大きくなっただけ」ではなく、「内蔵 GPU でも本格的にメモリ帯域を確保できる構造に変わった」というのが Strix Halo の本質です。

用途別の選び方

ここまでの構造を踏まえて、用途別の判断ガイドです。

やりたいこと推奨
70B Q4 を Windows / Linux で動かしたいStrix Halo 128GB
70B FP16 / 100B+ MoE を動かしたいMac Studio M3 Ultra 192GB 以上
70B を最速で推論したいRTX PRO 6000 96GB
14B〜32B クラスを高速に推論したいRTX 5090 32GB
Stable Diffusion XL / Flux 推論Strix Halo or RTX 5090
ファインチューニング / 学習NVIDIA dGPU 一択(ROCm はまだ厳しい)
普通の自作機にしたいAM5 + RTX 5090 / 5080

「70B を Windows で、35〜50 万円の予算で動かしたい」が Strix Halo の射程の中心 です。これより速度が欲しければ NVIDIA dGPU、より大きいモデルを 1 台で動かしたければ Mac Studio M3 Ultra、というのが 2026 年 5 月時点の選び分けになります。

Unified Memory と VRAM の概念差そのものをより深く理解したい方は、Apple Silicon と NVIDIA を中心に解説した「Apple Silicon の Unified Memory と NVIDIA VRAM、ローカルLLM では何が違うのか 2026年版」と、VRAM 単体の必要量計算を扱った「VRAM とは何か。ローカルLLM 推論に必要な量の決まり方 2026年版」も合わせてどうぞ。

まとめ:Strix Halo の Unified Memory が変えた地図

  • Strix Halo の Unified Memory は 「Apple 風の SoC 統合メモリを x86 にもたらした」初の構造
  • 256bit LPDDR5X-8000 バスで 256 GB/s、最大 128GB のうち 96GB を VRAM 化(AMD VGM)
  • 通常の iGPU(Phoenix / Lunar Lake)とは メモリバス幅と帯域が一桁違う 別物
  • Apple Silicon M3 Ultra に対しては 帯域で大きく劣るが、Windows / Linux + x86 エコシステム で 1/2〜1/3 の価格
  • NVIDIA dGPU に対しては 帯域・演算性能で大差負け、容量・コスパで勝つ
  • 「70B を Windows / Linux で 35〜50 万円で動かす」需要では現状ほぼ唯一の選択肢

2026 年は Apple Silicon と Strix Halo の 2 つで「SoC + 大容量 Unified Memory」というアーキテクチャが本格的に立ち上がった年でした。NVIDIA dGPU が帯域・演算で圧倒する一方、SoC 統合の道は「容量・コスパ・電力」で別の最適解を提供します。どちらを選ぶかは、最終的に「動かすモデルの規模」と「OS の制約」で決まります。

入手先・関連商品

当サイトは Amazon.co.jp アソシエイト・プログラムに参加予定です。下記リンク経由で購入された場合、紹介料を受け取ることがあります。読者の負担は増えません。リンクは記事評価とは独立しており、編集判断には影響しません。

Strix Halo 搭載ミニ PC(Ryzen AI MAX+ 395)


あなたに合うPCを診断する

用途や予算をもう少し細かく入力すると、3つの候補構成を提案します。

診断スタート

関連記事