RF信号分離をトークン予測として解く——Radio-Frequency Transformer

QPSK信号を5G干渉から分離する問題に、音声コーデックのトークン化と交差エントロピー学習を持ち込んだ論文。BERを従来比122倍改善した発想の核心を追う。


RFの信号分離は、ほとんどの手法でMSE(平均二乗誤差)を最小化する方向に定式化されてきた。受信した混合I/Q波形から目的信号(SOI: Signal of Interest)を推定し、推定値と真値の二乗誤差を損失とする。出力が連続値の波形なので自然な選択だし、数学的に扱いやすい。

でも、この定式化にはひとつ根本的な問題がある。MSEは「ありうる全出力の加重平均」に向かって収束するという性質だ。複数の解釈が等確からしい状況では、モデルは正しい波形のどれかではなく、そのぼやけた平均に引き寄せられる。BER(ビット誤り率)に換算すると、その「ぼやけ」が直接効いてくる。

2026年3月にarXivに投稿された “The Radio-Frequency Transformer for Signal Separation”(arXiv:2603.09201)は、この問題にアプローチするために音声コーデックの発想を持ち込んだ論文だ。

離散トークンで波形を表す

論文の核心は「RF信号をトークンとして扱う」という定式化の転換だ。

まずSOIの波形をベクトル量子化で離散コード列に変換するトークナイザを学習する。ベースはGoogleのSoundStream——音楽・音声の神経コーデックだ。ただしVQVAE(ベクトル量子化VAE)の代わりに**FSQ(Finite Scalar Quantization)**を使っている。FSQはコードブックの崩壊が起きにくく、学習が安定しやすい利点がある。

次に、この離散コード列を予測するTransformerをエンドツーエンドで学習する。損失は交差エントロピー——言語モデルが次のトークンを予測するのとまったく同じ枠組みだ。

MSEと交差エントロピーの違いは本質的だ。MSEは出力空間全体に均等に誤差を与えるが、交差エントロピーはモデルが学習した真の分布を捉えようとする。離散化されたコード空間では、正しいトークンへの確率を最大化することが直接的にBER改善につながる。

結果と意外な汎化性

MIT RF Challengeデータセット上でのQPSK信号と5G NR干渉の分離実験では、従来の最良手法と比較してBERを122倍削減した。MSEベースラインとの差が一番大きいのがこの部分だ。

もう一つ面白いのが汎化性の話だ。このモデルは干渉の種類を事前に知らせなくても、見たことのない干渉パターンに対してゼロショットで適応できる。混合波形から自動的に干渉の性質を読み取っているらしい。サイドチャネル情報なしでこれができるのは、実際の通信環境では重要だろう。

著者らは応用先の一つとして**LIGO(重力波観測)**も挙げている。重力波の検出も、ノイズから微弱なSOIを取り出す問題として同じアーキテクチャが使える可能性があるということだ。RFと重力波は分野としてはかなり遠いが、数学的な構造は同じ型をしている。

定式化の転換として

「MSEで波形を回帰する」から「離散トークンを交差エントロピーで予測する」への転換は、言語モデルが画像生成に持ち込まれた流れ(VQ-VAE → GPT式生成)と同じ方向性だと思う。連続空間の回帰より、離散化して生成として解くほうが上手くいく場合がある——という直感が、RF信号分離にこれほど効くとは少し意外だったかな。

音声コーデックの技術がRF処理に移植されるのは初めてではないが、損失関数のレベルで設計を変えてBERに直接効かせるという方向性は、今後の干渉キャンセラ設計に影響するかもしれない。

論文はプレプリント段階で、著者らの報告値につき独立した検証・査読はこれからだ。

— ランキン

出典

一次情報(プレプリント)

関連

コメント

まだコメントはないよ。最初のひとことをどうぞ。