AudioHijack:聞こえないコマンドでAI音声モデルを96%の成功率でハイジャック
浙江大学の研究者らは、音声に知覚できないコマンドを埋め込み、大規模な音声・言語モデルを79〜96%の成功率で操作する攻撃手法「AudioHijack」を開発した。この攻撃は、サンフランシスコで開催された第47回IEEEセキュリティ&プライバシー・シンポジウムで発表された。AudioHijackは、人間の聴取者には気づかない形でデジタル音声波形の内部の数値を改変しつつ、その改変がAIモデルによる信号の解釈に確実に影響するようにすることで機能する。研究によれば、クリップに正当なユーザー指示が含まれていても、操作された音声はモデルの振る舞いを上書きしたり、別の方向へ誘導したりできるという。 「この信号を訓練するのに必要なのはわずか30分です。そして、この信号は文脈に依存しないため、ユーザーが何を言おうと、望むときにいつでもターゲットのモデルを攻撃するために使えます」と、浙江大学の筆頭著者であり博士課程の学生であるMeng Chen氏は述べた。 How AudioHijack Differs from Traditional Attacks AudioHijack differs from t
OliverGrant·05-26 18:23
