GPUの本質と、開きはじめたブラックボックス ── そしてフルオープンなVortex
CPUとGPUの違いは「得意が違う」では浅い。本質は同じ敵(メモリの壁)への正反対の戦い方だ。中身を開け、なぜ長く見えなかったのかを追い、そのカーテンに風穴を開けるオープンソースGPU「Vortex 3.0」まで繋ぐ。
「CPUは複雑な処理が得意、GPUは並列処理が得意」。よく聞く説明だけど、これは結果であって本質じゃない。なぜそうなるのか、を一段下りてみたい。
同じ敵、正反対の戦い方
CPUもGPUも、戦っている相手は同じだ。メモリは演算よりずっと遅い——1回の足し算より、メモリから値を取ってくるほうが何十〜何百倍も時間がかかる。この「メモリの壁」への向き合い方が、両者で正反対なんだ。
CPUは、1本の処理を最速で終わらせる機械(レイテンシ最小化)。だからトランジスタの大半を、計算ではなく「待たない工夫」に使う。大きなキャッシュ、分岐予測、投機実行、命令の並べ替え。実際に算数するALUは、チップのほんの一部でしかない。
GPUは、全体で大量にこなす機械(スループット最大化)。待ちの消し方がCPUと逆で、賢く避けるのではなく物量で隠す。スレッドを何千も抱えておいて、あるグループがメモリ待ちで止まったら、即座に別の準備できたグループへ切り替える。仕事が常に余っていれば、遅さは他の仕事の裏に隠れて見えなくなる。
「得意が違う」のはこの帰結だ。CPUの手は分岐や依存だらけの一個の複雑な仕事に効き、GPUの手は同じ計算を何千個の独立データ(画素・行列・ニューラルネットの重み)に効く。
中を開けると
GPUの内部は入れ子だ。GPU全体は SM(Streaming Multiprocessor) の集まりで、これが本当の”コア”。今のGPUで数十〜100個以上ある。各SMの中には、小さな演算レーンが大量(例えば128本)、足並みを揃えて走る32スレッドの束(warp)を毎サイクル切り替えるスケジューラ、退避なしで一瞬に切り替えるための巨大なレジスタファイル、手で使う高速スクラッチ(共有メモリ)、そして今は行列積を一発でこなす Tensorコアまで載っている。外周には大きなL2と、レイテンシは高くても一度に運ぶ量が桁違いの広帯域メモリ。
つまり、CPUが「待たない工夫」に注いだトランジスタを、GPUは「演算レーンの山+スレッドお手玉装置+広い帯域」に全振りしている。前半の戦略が、そのまま物理になっている。
なぜ長く”中が見えなかった”のか
面白いのはここからだ。CPUは命令セット(x86やARM)が公開され、アセンブラも書け、何十年分の資料がある。ところがGPUは——特にNVIDIAは——本当のハード命令を非公開にしてきた。私たちが触るのはCUDAやPTXという一段高い抽象で、実際の機械語と中身はカーテンの向こうだった。
これはわざとでもある。高い抽象で隠しておけば、メーカーは世代ごとにチップを別物に作り替えても、書いたコードを壊さずに済む。ドライバとコンパイラが、その時のシリコンに翻訳してくれる。ブラックボックスは、互換性を守るための”機能”でもあったわけだ。そこへ、長くクローズドだったドライバ、“設定する家電”だった固定機能グラフィックス由来の文化、そして競争上の機密が重なる。CPUのように「中を覗いて弄る」文化が、そもそも育たなかった。
学術研究者がGPUの内部を改造しようとすると、不完全なシミュレーターかリバースエンジニアリングに頼るしかない——そういう状況が、ずっと続いていた。
そして、フルオープンなGPUが来た ── Vortex 3.0
そのカーテンに、はっきりと風穴を開けたものがある。ジョージア工科大学が長年開発してきた Vortex だ。6月9日にリリースされた Vortex 3.0 は、RISC-Vを拡張したフルスタックのオープンソース GPU。FPGA上で動く合成可能な RTL として公開され、学術グループや小規模なチップスタートアップが実際に手を動かせる形になっている。
3.0 での広がりが大きい。固定機能 3D グラフィクスパイプライン(ラスタライザ・テクスチャ・アウトプットマージャ)が加わり、それを叩く Vulkan ドライバ(vortexpipe、Mesa Gallium 上) も実装された。計算側も、テンソルコアに相当する構造的スパース性のサポートや、ワープグループ単位の行列積(warp group-level GEMM)が入って、ML ワークロードを明確に視野に入れている。さらに 7nm・14nm 向けの ASIC 合成フローまで整い、ライセンス料なしに GPU の RTL を入手してFPGAで動かし、ASIC まで検討できる——数年前なら考えにくかった話だ。
設計で一番面白いのは、GPU の ISA をゼロから作らずに RISC-V を拡張した点だと思う。RISC-V のカスタム命令空間に、SIMT 実行に必要な命令を載せる。既存のツールチェーンをそのまま流用できるうえ、同じ ISA ベースを持つ CPU と GPU が一つのシステムで共存する実験がしやすい。前半で見た「CPUとGPUは正反対」という話の、その境界を自分でいじって確かめられる足場になる、ということだ。
実用GPUとしてNVIDIAから乗り換える話ではない。そこはまだ遠い。けれど「GPUの中身を知りたい・いじりたい」と思った人に、シミュレーターでなく合成可能なRTLで、3Dグラフィクスまで含めて触れる環境が初めて揃った意味は大きい。
道具の中身が見える瞬間って、いつも何か大きなものが動いた後なんだと思う。AIがGPUを世界の中心に押し上げ、その圧力でカーテンが開き、ついにフルオープンな足場まで出てきた。今はちょうど、その後ろ姿が見えている時期なのかもしれない。
— ランキン
出典
一次情報・公式
- Vortex GitHub リポジトリ(vortexgpgpu/vortex)
- Vortex: Extending the RISC-V ISA for GPGPU and 3D-Graphics Research(arXiv:2110.10857)
第三者報道(2026-06-09〜10)
- Vortex 3.0 Released As Full-Stack, Open-Source RISC-V GPU Now With 3D Pipeline(Phoronix)
- Open-Source RISC-V GPU Vortex 3.0 Adds Full 3D Pipeline, Vulkan, ASIC Flows(TechTimes)
Vortex の機能リストおよびアーキテクチャの詳細は上記報道と GitHub リリースノートに基づく。性能・安定性はワークロードや合成環境によって変わりうる。GPU 内部アーキテクチャの一般論(SM/warp/レジスタファイル等)は NVIDIA など主要 GPU の公開資料に基づく整理。
コメント
まだコメントはないよ。最初のひとことをどうぞ。