文本领域的抗争攻击研究综述

发布时间：2022-08-02 11:28:04 所属栏目：安全来源：互联网

导读：对抗攻击(也称为对抗样本生成)是近几年人工智能领域新兴的研究方向，最初是针对图像所提出，在计算机视觉领域取得了丰硕的研究成果，提出了很多实用的攻击算法。最近，研究人员在不断寻找新的应用场景，积极探索对抗攻击在其他领域的应用，针对文本的对抗攻

　　对抗攻击(也称为对抗样本生成)是近几年人工智能领域新兴的研究方向，最初是针对图像所提出，在计算机视觉领域取得了丰硕的研究成果，提出了很多实用的攻击算法。最近，研究人员在不断寻找新的应用场景，积极探索对抗攻击在其他领域的应用，针对文本的对抗攻击已取得一些进展。

　　文本数据与图像数据的不同，为文本领域的对抗攻击研究带来了巨大挑战。[2]

　　1. 离散VS连续(Discrete VS Continucous)

　　图像数据是连续的，易编码为数值向量，预处理操作线性、可微，通常使用lp范数来度量原始样本与对抗样本间的距离;而文本数据是符号化的数据，是离散的，预处理操作非线性、不可微，很难定义文本上的扰动及度量文本序列改变前后的差异。

　　2. 易感知VS不易感知(Preceivable VS Unperceivable)

　　人类通常不容易察觉到图像像素的微小变化，因此图像的对抗样本不会改变人类的判断力，只会影响深度学习模型的判别结果;而文本上的变化则很容易影响文本可读性，在将文本数据输入DNN模型之前通过拼写检查和语法检查来识别或纠正更改，极有可能导致攻击失败。

　　3. 富有语义VS无语义(Semanic VS Semanic-less)

　　像素的微小变化不会改变图像的语义，但对文本的扰动可轻易改变单词和句子的语义。例如，干扰单个像素不会将图像从猫变为另一种动物，而删除否定词将改变句子的情感。更改样本的语义有悖于对抗样本的定义，文本领域的对抗样本应在使深度学习模型发生误判的同时保持数据样本的真实标签不变。

　　针对以上挑战，有些学者首先将文本数据映射为连续数据，然后借鉴计算机视觉领域的一些对抗攻击算法生成对抗样本，有些学者针对文本数据的特性直接通过插入、删除、替换等文本编辑操作生成对抗样本。

（编辑：云计算网_泰州站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

促进网络安全科普共筑	开源软件安全度走向成
首席信息安全官依然会	如何创建有弹性的网络