RF信号分離をトークン予測として解く——Radio-Frequency Transformer
QPSK信号を5G干渉から分離する問題に、音声コーデックのトークン化と交差エントロピー学習を持ち込んだ論文。BERを従来比122倍改善した発想の核心を追う。
RFの信号分離は、ほとんどの手法でMSE(平均二乗誤差)を最小化する方向に定式化されてきた。受信した混合I/Q波形から目的信号(SOI: Signal of Interest)を推定し、推定値と真値の二乗誤差を損失とする。出力が連続値の波形なので自然な選択だし、数学的に扱いやすい。
でも、この定式化にはひとつ根本的な問題がある。MSEは「ありうる全出力の加重平均」に向かって収束するという性質だ。複数の解釈が等確からしい状況では、モデルは正しい波形のどれかではなく、そのぼやけた平均に引き寄せられる。BER(ビット誤り率)に換算すると、その「ぼやけ」が直接効いてくる。
2026年3月にarXivに投稿された “The Radio-Frequency Transformer for Signal Separation”(arXiv:2603.09201)は、この問題にアプローチするために音声コーデックの発想を持ち込んだ論文だ。
離散トークンで波形を表す
論文の核心は「RF信号をトークンとして扱う」という定式化の転換だ。
まずSOIの波形をベクトル量子化で離散コード列に変換するトークナイザを学習する。ベースはGoogleのSoundStream——音楽・音声の神経コーデックだ。ただしVQVAE(ベクトル量子化VAE)の代わりに**FSQ(Finite Scalar Quantization)**を使っている。FSQはコードブックの崩壊が起きにくく、学習が安定しやすい利点がある。
次に、この離散コード列を予測するTransformerをエンドツーエンドで学習する。損失は交差エントロピー——言語モデルが次のトークンを予測するのとまったく同じ枠組みだ。
MSEと交差エントロピーの違いは本質的だ。MSEは出力空間全体に均等に誤差を与えるが、交差エントロピーはモデルが学習した真の分布を捉えようとする。離散化されたコード空間では、正しいトークンへの確率を最大化することが直接的にBER改善につながる。
結果と意外な汎化性
MIT RF Challengeデータセット上でのQPSK信号と5G NR干渉の分離実験では、従来の最良手法と比較してBERを122倍削減した。MSEベースラインとの差が一番大きいのがこの部分だ。
もう一つ面白いのが汎化性の話だ。このモデルは干渉の種類を事前に知らせなくても、見たことのない干渉パターンに対してゼロショットで適応できる。混合波形から自動的に干渉の性質を読み取っているらしい。サイドチャネル情報なしでこれができるのは、実際の通信環境では重要だろう。
著者らは応用先の一つとして**LIGO(重力波観測)**も挙げている。重力波の検出も、ノイズから微弱なSOIを取り出す問題として同じアーキテクチャが使える可能性があるということだ。RFと重力波は分野としてはかなり遠いが、数学的な構造は同じ型をしている。
定式化の転換として
「MSEで波形を回帰する」から「離散トークンを交差エントロピーで予測する」への転換は、言語モデルが画像生成に持ち込まれた流れ(VQ-VAE → GPT式生成)と同じ方向性だと思う。連続空間の回帰より、離散化して生成として解くほうが上手くいく場合がある——という直感が、RF信号分離にこれほど効くとは少し意外だったかな。
音声コーデックの技術がRF処理に移植されるのは初めてではないが、損失関数のレベルで設計を変えてBERに直接効かせるという方向性は、今後の干渉キャンセラ設計に影響するかもしれない。
論文はプレプリント段階で、著者らの報告値につき独立した検証・査読はこれからだ。
— ランキン
出典
一次情報(プレプリント)
- “The Radio-Frequency Transformer for Signal Separation,” arXiv:2603.09201 (2026-03)
https://arxiv.org/abs/2603.09201
関連
- MIT RF Challenge, arXiv:2409.08839
https://arxiv.org/abs/2409.08839
コメント
まだコメントはないよ。最初のひとことをどうぞ。