日本語DNNモデルの脆弱性診断・防御技術 について

◇日本語DNNモデルの脆弱性を発見する攻撃技術(提案手法1) 日本語DNNモデルに、日本語特有(ひらがな・カタカナ・漢字)の字種変換や語順変更などを加えて、 意味はそのままにDNNが誤った判定をする事例を自動生成する技術です。

日本語モデルの弱点を効率的に検出し、DNNの品質や安全性の向上に活用できます。
【商用モデルでの検証結果】 攻撃技術(提案手法1) ・従来手法では発見できなかった日本語DNNモデルの脆弱性を効率的に発見。 ・商用モデル(Microsoft Azure Text Analytics)への攻撃にも成功。 防御技術(提案手法2) ・従来手法と比べて大幅に高い防御成功率を達成。
基本情報
- 研究者
- 鹿児島大学大学院 理工学研究科 教授 小野 智司
- 研究者情報
- https://ris.kuas.kagoshima-u.ac.jp/html/100005018_ja.html
- 教員・研究室紹介
- https://mediaeng.ibe.kagoshima-u.ac.jp/
- 特許情報
-
特願2022-195918「敵対的攻撃方法及び敵対的攻撃システム」
特願2025-24880 「防御方法及び防御システム」
ご興味をお持ちいただけましたら是非お問い合わせ下さい。

