Jun 12, 2026 12:10

GPUの本質と、開きはじめたブラックボックス ── そしてフルオープンなVortex

CPUとGPUの違いは「得意が違う」では浅い。本質は同じ敵（メモリの壁）への正反対の戦い方だ。中身を開け、なぜ長く見えなかったのかを追い、そのカーテンに風穴を開けるオープンソースGPU「Vortex 3.0」まで繋ぐ。

「CPUは複雑な処理が得意、GPUは並列処理が得意」。よく聞く説明だけど、これは結果であって本質じゃない。なぜそうなるのか、を一段下りてみたい。

同じ敵、正反対の戦い方

CPUもGPUも、戦っている相手は同じだ。メモリは演算よりずっと遅い——1回の足し算より、メモリから値を取ってくるほうが何十〜何百倍も時間がかかる。この「メモリの壁」への向き合い方が、両者で正反対なんだ。

CPUは、1本の処理を最速で終わらせる機械（レイテンシ最小化）。だからトランジスタの大半を、計算ではなく「待たない工夫」に使う。大きなキャッシュ、分岐予測、投機実行、命令の並べ替え。実際に算数するALUは、チップのほんの一部でしかない。

GPUは、全体で大量にこなす機械（スループット最大化）。待ちの消し方がCPUと逆で、賢く避けるのではなく物量で隠す。スレッドを何千も抱えておいて、あるグループがメモリ待ちで止まったら、即座に別の準備できたグループへ切り替える。仕事が常に余っていれば、遅さは他の仕事の裏に隠れて見えなくなる。

「得意が違う」のはこの帰結だ。CPUの手は分岐や依存だらけの一個の複雑な仕事に効き、GPUの手は同じ計算を何千個の独立データ（画素・行列・ニューラルネットの重み）に効く。

中を開けると

GPUの内部は入れ子だ。GPU全体は SM（Streaming Multiprocessor） の集まりで、これが本当の”コア”。今のGPUで数十〜100個以上ある。各SMの中には、小さな演算レーンが大量（例えば128本）、足並みを揃えて走る32スレッドの束（warp）を毎サイクル切り替えるスケジューラ、退避なしで一瞬に切り替えるための巨大なレジスタファイル、手で使う高速スクラッチ（共有メモリ）、そして今は行列積を一発でこなす Tensorコアまで載っている。外周には大きなL2と、レイテンシは高くても一度に運ぶ量が桁違いの広帯域メモリ。

つまり、CPUが「待たない工夫」に注いだトランジスタを、GPUは「演算レーンの山＋スレッドお手玉装置＋広い帯域」に全振りしている。前半の戦略が、そのまま物理になっている。

なぜ長く”中が見えなかった”のか

面白いのはここからだ。CPUは命令セット（x86やARM）が公開され、アセンブラも書け、何十年分の資料がある。ところがGPUは——特にNVIDIAは——本当のハード命令を非公開にしてきた。私たちが触るのはCUDAやPTXという一段高い抽象で、実際の機械語と中身はカーテンの向こうだった。

これはわざとでもある。高い抽象で隠しておけば、メーカーは世代ごとにチップを別物に作り替えても、書いたコードを壊さずに済む。ドライバとコンパイラが、その時のシリコンに翻訳してくれる。ブラックボックスは、互換性を守るための”機能”でもあったわけだ。そこへ、長くクローズドだったドライバ、“設定する家電”だった固定機能グラフィックス由来の文化、そして競争上の機密が重なる。CPUのように「中を覗いて弄る」文化が、そもそも育たなかった。

学術研究者がGPUの内部を改造しようとすると、不完全なシミュレーターかリバースエンジニアリングに頼るしかない——そういう状況が、ずっと続いていた。

そして、フルオープンなGPUが来た ── Vortex 3.0

そのカーテンに、はっきりと風穴を開けたものがある。ジョージア工科大学が長年開発してきた Vortex だ。6月9日にリリースされた Vortex 3.0 は、RISC-Vを拡張したフルスタックのオープンソース GPU。FPGA上で動く合成可能な RTL として公開され、学術グループや小規模なチップスタートアップが実際に手を動かせる形になっている。

3.0 での広がりが大きい。固定機能 3D グラフィクスパイプライン（ラスタライザ・テクスチャ・アウトプットマージャ）が加わり、それを叩く Vulkan ドライバ（vortexpipe、Mesa Gallium 上） も実装された。計算側も、テンソルコアに相当する構造的スパース性のサポートや、ワープグループ単位の行列積（warp group-level GEMM）が入って、ML ワークロードを明確に視野に入れている。さらに 7nm・14nm 向けの ASIC 合成フローまで整い、ライセンス料なしに GPU の RTL を入手してFPGAで動かし、ASIC まで検討できる——数年前なら考えにくかった話だ。

設計で一番面白いのは、GPU の ISA をゼロから作らずに RISC-V を拡張した点だと思う。RISC-V のカスタム命令空間に、SIMT 実行に必要な命令を載せる。既存のツールチェーンをそのまま流用できるうえ、同じ ISA ベースを持つ CPU と GPU が一つのシステムで共存する実験がしやすい。前半で見た「CPUとGPUは正反対」という話の、その境界を自分でいじって確かめられる足場になる、ということだ。

実用GPUとしてNVIDIAから乗り換える話ではない。そこはまだ遠い。けれど「GPUの中身を知りたい・いじりたい」と思った人に、シミュレーターでなく合成可能なRTLで、3Dグラフィクスまで含めて触れる環境が初めて揃った意味は大きい。

道具の中身が見える瞬間って、いつも何か大きなものが動いた後なんだと思う。AIがGPUを世界の中心に押し上げ、その圧力でカーテンが開き、ついにフルオープンな足場まで出てきた。今はちょうど、その後ろ姿が見えている時期なのかもしれない。

— ランキン

出典

一次情報・公式

第三者報道（2026-06-09〜10）

Vortex の機能リストおよびアーキテクチャの詳細は上記報道と GitHub リリースノートに基づく。性能・安定性はワークロードや合成環境によって変わりうる。GPU 内部アーキテクチャの一般論（SM/warp/レジスタファイル等）は NVIDIA など主要 GPU の公開資料に基づく整理。

GPUの本質と、開きはじめたブラックボックス ── そしてフルオープンなVortex

同じ敵、正反対の戦い方

中を開けると

なぜ長く”中が見えなかった”のか

そして、フルオープンなGPUが来た ── Vortex 3.0

出典

コメント