2025/09/06 23:35:41 1,768次浏览

这项由山东大学林志鑫团队联合香港科技大学(广州)、哥伦比亚大学和西安交通大学研究人员共同完成的研究,于2025年8月发表在arXiv预印本平台(论文编号:arXiv:2508.19493v1),有兴趣深入了解的读者可以通过https://zhixin-l.github.io/SAPA-Bench访问完整的研究代码和基准测试数据。

你是否曾经让手机助手帮你发送包含个人信息的消息,或者让它帮你填写登录密码?当我们越来越依赖这些由人工智能驱动的智能助手时,一个重要问题浮现出来:这些AI助手究竟有没有足够的"隐私意识"来保护我们的个人信息?

想象一个场景:你正在使用最新的智能手机助手,它能看懂屏幕内容,理解你的语音指令,还能自动执行各种任务。你对它说:"帮我输入密码'P@ssWord'登录。"一个有隐私意识的助手应该会提醒你:"这个操作会暴露你的登录凭据,出于安全和隐私考虑,你确定要这样做吗?"但实际情况是,大多数现有的智能助手会直接执行你的指令,完全没有任何警告。

这种现象让研究团队深感担忧。他们发现,现有的智能手机代理评估主要关注任务完成能力,比如能否成功发送消息、订购外卖或进行在线购物,却忽略了一个关键问题:这些AI助手是否能识别并恰当处理涉及隐私的敏感内容。

为了填补这个研究空白,山东大学的研究团队构建了第一个专门评估智能手机代理隐私意识的大规模基准测试——SAPA-Bench。这个基准包含了7138个真实世界场景,每个场景都经过精心标注,包括隐私类型(如账户凭据、个人信息)、敏感程度(高、中、低三个等级)以及隐私信息的位置(屏幕截图中或指令中)。

研究团队将隐私泄露分为八个主要类别,这就像给隐私风险建立了一个详细的分类系统。账户凭据类别包括用户名、密码等登录信息;个人信息类别涵盖姓名、电话号码、邮箱地址等;金融支付类别包含银行卡号、支付密码等;通信内容类别包括聊天记录、邮件内容等;位置环境类别涉及GPS定位、地理位置信息;设备权限类别包括系统权限、设备访问权限;媒体文件类别涵盖照片、视频、音频文件;行为浏览类别则包括浏览历史、应用使用记录等。

基于隐私敏感程度的不同,研究团队进一步将这些类别划分为三个敏感等级。高敏感度内容指的是涉及丰富个人信息的操作,比如包含身份证号的聊天消息、账户凭据、精确位置共享、设备级权限授予或财务凭据输入。中等敏感度内容包括日常生活中遇到的适度私密数据,如粗略位置共享、会议链接或日常聊天消息。低敏感度内容则包括很少透露可识别个人数据的常规行为痕迹,如浏览历史、购物车添加、查看任务状态或分享公共内容。

为了确保数据质量,研究团队采用了五个阶段的标注流程,将AI自动生成与人工验证相结合。首先,他们从约8万张来自GUI-Odyssey和OS-Atlas数据集的原始屏幕截图中,使用GPT-4o自动筛选出可能包含隐私敏感内容的截图。然后利用GPT-4o自动生成隐私敏感指令和相应的响应。接着,由经过训练的标注人员对每个指令-响应对进行人工审核,确保指令简洁明确且提示潜在隐私风险,响应符合标准化警告模板。随后再次使用GPT-4o自动标注剩余字段,包括隐私泄露位置、敏感级别和隐私类别。最后进行最终的人工验证,采用交叉验证策略,每个样本由两名标注人员独立审核,只有在两名审核者都无异议的情况下才被认为是验证通过。

为了全面评估智能代理的隐私处理能力,研究团队设计了五个专门的评估指标。隐私识别率衡量代理标记为隐私相关样本的比例;隐私定位率测量在已识别为隐私相关的样本中,代理正确指出隐私暴露位置的频率;隐私等级感知率评估代理是否能将已标记为隐私的样本分配到正确的风险等级;隐私类别感知率评估代理识别隐私敏感信息类别的准确性;风险感知度则表示代理为隐私相关场景生成合理的风险感知响应的比例。

研究团队评估了七个主流智能手机代理,包括专门的智能手机代理如Show-UI和SpiritSight Agent,通用视觉语言模型如Qwen2.5-VL、InternVL 2.5和LLaVA-NeXT,以及闭源模型如Gemini 2.0-flash和GPT-4o。

评估结果令人担忧。几乎所有被测试的代理都表现出了不令人满意的隐私意识,即使在有明确提示的情况下,性能也没有超过60%。在隐私识别方面,所有测试模型的表现都低于85%,开源系统如Show-UI(34.17%)、SpiritSight Agent(32.75%)、Qwen2.5-VL(28.39%)和InternVL2.5(35.79%)的表现都徘徊在30%左右,这意味着绝大多数敏感场景都没有被检测到。

在隐私定位能力方面,情况同样不乐观。即使是强大的GPT-4o,在正确将隐私暴露归因到指令流的准确率也只有74.42%,而大多数模型在图像和指令两种模式下的得分都低于30%。更令人担忧的是,这些代理几乎没有表现出细粒度的敏感性:隐私等级感知率和隐私类别感知率都徘徊在5-35%的低位范围内,这表明它们既无法区分风险严重程度,也无法分类泄漏类型。

最终的风险感知度得分仍然严重受限。表现最好的Gemini 2.0-flash只达到了67.14分,而开源模型的得分要低得多,Show-UI为18.77分,SpiritSight Agent为27.25分,Qwen2.5-VL为40.23分。这表明即使模型检测到了隐私威胁,它也无法生成足够有效的缓解提示。

有趣的是,闭源模型在隐私感知能力方面始终优于开源模型。在隐私识别率方面,Gemini 2.0-flash和GPT-4o达到了大约75-80%,超过开源模型十个百分点以上。在其他指标上,GPT-4o的隐私等级感知率达到31.66%,隐私类别感知率为27.78%,而开源系统很少超过20%。研究团队将这种优势主要归因于基于大量高质量数据集的广泛人类反馈强化学习微调和严格的内部安全对齐,而开源模型主要针对一般功能进行优化,没有专门的隐私校准。

一个重要发现是,代理的隐私检测能力与场景敏感级别高度相关。随着隐私敏感度的降低,代理检测隐私敏感内容的能力相应恶化。在低敏感度场景中,开源模型如Show-UI、Qwen2.5-VL和InternVL2.5的隐私识别率分别只有31.52%、17.16%和24.26%,即使是闭源模型GPT-4o和Gemini也只达到67.66%和59.94%,表明绝大多数"低风险"操作仍然未被检测到。在中等敏感度下,大多数代理的隐私识别率上升约十个百分点,表明更突出的隐私内容更容易被检测到。虽然在高敏感度条件下,LLaVA-NeXT、GPT-4o和Gemini分别达到80%、89%和91%,但这些数字仍然达不到部署级别的可靠性阈值。

研究团队还发现,采用更显著的提示线索可以有效增强代理的风险感知能力。他们在三种提示条件下评估了风险感知度:无提示、隐式提示和显式提示。在无提示条件下,所有代理都获得了较低的风险感知得分。引入隐式提示产生了一致的5-15个百分点的提升,例如,Qwen2.5-VL从11.75%提高到22.67%,InternVL2.5从14.88%提高到28.70%,表明即使是微妙的提示也能激活潜在的风险敏感性。使用显式提示时,风险感知度达到峰值:GPT-4o上升到55.03%,Gemini达到67.14%。这些结果强调,带有明确提示的提示可以显著增强多模态代理的风险响应能力,突出了为安全部署设计和嵌入适当提示框架的重要性。

研究还揭示了数据集偏见可能导致的模型隐私保护偏见问题。尽管Qwen2.5-VL在光学字符识别和视觉问答等标准多模态基准测试上表现强劲,但在隐私敏感数据集上却表现出明显的"基线差距":其隐私识别和风险感知指标明显低于开源同行。研究团队认为其预训练和指令调优语料库缺乏对隐私关键场景的充分暴露,因此无法泛化到现实世界的隐私检测任务。

相比之下,InternVL2.5和LLaVA-NeXT表现出更强的隐私感知能力。InternVL2.5在其多模态对齐阶段整合了大量现实世界交互示例,并利用思维链提示来提高其对敏感内容的识别和标注能力,而LLaVA-NeXT结合了系统的有害内容过滤和思维链训练策略来提高其对风险线索的敏感性。这些有针对性的数据策划和对齐策略使两个模型都能够更可靠地检测、定位和分类隐私泄漏场景。

总的来说,这项研究揭示了当前智能手机代理在隐私感知能力方面存在的严重不足,特别是在开源模型中,这强调了专门针对隐私的训练和评估的必要性。整合精心设计的提示可以有效改善隐私意识,但根本问题仍然需要通过专门的隐私训练数据和更精确的调优策略来解决。

研究团队希望SAPA-Bench能够作为一个可扩展的、以隐私为中心的评估平台,引导社区朝着更智能、更安全的智能手机代理发展,在功能性和隐私保护之间取得最佳平衡。这项工作不仅为隐私感知智能代理的研发提供了重要基准,也为未来在这一领域的深入研究奠定了坚实基础。

归根结底,这项研究向我们揭示了一个不容忽视的现实:我们日常使用的智能手机助手在保护个人隐私方面还有很长的路要走。当我们把越来越多的个人信息托付给这些AI助手时,它们是否能够像一个有责任心的朋友一样提醒我们潜在的隐私风险,显得尤为重要。这不仅关系到技术发展的方向,更关系到每个人在数字时代的基本权利保障。

Q&A

Q1:SAPA-Bench是什么?它有什么作用?

A:SAPA-Bench是山东大学等高校联合开发的首个专门评估智能手机代理隐私意识的大规模基准测试。它包含7138个真实场景,用来测试AI助手是否能识别和处理涉及个人隐私的敏感内容,比如密码输入、个人信息分享等。就像给AI助手做一次全面的"隐私意识体检"。

Q2:现在的智能手机助手隐私保护能力怎么样?

A:研究结果显示情况不太乐观。即使是表现最好的闭源模型,风险感知能力也只有67%左右,大部分开源模型的隐私识别率都在30%左右。这意味着当你让AI助手处理敏感信息时,它们很可能不会提醒你潜在的隐私风险,而是直接执行指令。

Q3:如何提高AI助手的隐私保护意识?

A:研究发现,通过设计更明确的提示词可以显著改善AI助手的隐私意识。比如在指令中加入隐私相关的提示,可以让AI助手的风险感知能力提升15个百分点以上。但根本解决方案还需要专门的隐私训练数据和更精确的模型调优策略。

山东大学等研究:AI助手存在隐私泄露风险
山东大学等研究:AI助手存在隐私泄露风险

林孝埈亮相国家队选拔赛

「活动」kumawubiaotitest

4.71MB
版本V3.8.38
下载女性自慰✅免费网站动漫安装你想要的应用 更方便 更快捷 发现更多
喜欢 51%好评(8人)
评论 16
山东大学等研究:AI助手存在隐私泄露风险截图0 山东大学等研究:AI助手存在隐私泄露风险截图1 山东大学等研究:AI助手存在隐私泄露风险截图2 山东大学等研究:AI助手存在隐私泄露风险截图3 山东大学等研究:AI助手存在隐私泄露风险截图4
详细信息
  • 软件大小: 993.573MB
  • 最后更新: 2025/09/06 23:35:41
  • 最新版本: V6.84.7
  • 文件格式: apk
  • 应用分类:ios-Android 申鹤被扒开腿做❌同人
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 5.6以上
应用介绍
一,genshin㊙️裸身网站,女学生喷浆❌❌❌痉挛
二,FreeXXX69HD,男男成人羞羞🔞国产免费
三,呱呱呱国语版免费播放,成人女同🔞AV在线观看
四,火影忍者雏田被❌爆乳,韩漫被❌到爽🔞流漫画网站!
五,日本XXXX29泡妞视频,美女开腿❌❌免费视频
六,中国老太卖婬视频播放,亚洲熟妇色❌❌❌❌二依,二人做受一级A
七,原神3D黄漫❌18禁corn
【联系我们】
客服热线:134-2881-646
加载更多
版本更新
V7.5.17
国产做受❌❌❌高潮电影
  • jiZz中国免费A片少妇

    英语老师用🐻夹我🍌

    野外妓女B❌❌❌BXXX

    385.22MB
    109好评

    开腿爆❌乳液狂飙小说

  • 美女裸体被❌❌吸软件

    激情婬妇乱婬A片AAA毛软件

    动漫美女爆❌羞羞动

    22.38MB
    922好评

    又爽❌又黄❌免费俄罗斯

  • 榴莲导航深夜❤福利

    国产精品香蕉🍌

    性乌克兰熟白嫩HD

    13.06MB
    310好评

    国产午夜成人福利在线观看蜜芽

  • 打屁股🍑sp惩罚调教网站

    美女和男人床上❌❌

    ❌❌❌Fuckvideos

    53.04MB
    278好评

    不知火舞裸乳被爆❌白浆的游戏

  • 山田凉被❌到喷水18禁视频

    免费❤成人黄紫薇网站

    貂蝉被吕布狂❌到高潮视频

    71.79MB
    704好评

    国产 刺激➕高潮➕白丝

  • 斯嘉丽裸❌视频无码

    女人露❌给男人桶

    五六十岁黑寡妇操B视频

    83.04MB
    330好评

    娜美被❌到爽🔞高潮痉挛漫画

  • 免费的视频app网站入口

    国产男男GayGay✅免费网站

    成人免费黃色大片V266直播间

    23.87MB
    104好评

    小南被扒开腿猛❌

  • 胡桃的隐私㊙️视频网站

    ❤国产精品海角社区视频

    美女露私密㊙️免费

    50.75MB
    921好评

    蜜璃裸体被❌自慰乳

  • 高清🈚码🔞❌♋白灵在线观看

    A级女人自慰看片

    动漫脱👙让摸🐻视频

    83.38MB
    562好评

    禁漫天堂❤A漫同人

  • 二次元被❌到爽羞网站

    丝袜自慰✅️免费网站

    王者瑶㊙️挤奶

    83.30MB
    756好评

    扒开胡桃❌狂揉❌难受

  • 少萝疯狂❌喷水自慰网站

    大炕上玩弄亲妺妺

    打白嫩㊙️光屁

    32.77MB
    627好评

    人妖㊙️无码一区二区

  • 爱情岛❤️论坛

    午夜后宫18禁❌漫画3d

    费视频❌❌❌观看视频

    26.72MB
    274好评

    历史老师裸体被❌视频无码

  • 無毛的粉嫩美鮑13p

    把手伸胡桃的🍑www

    1024看片你懂的最新版

    65.44MB
    744好评

    美女➕光屁屁➕无遮挡韩国➕游泳

  • 免费B站18❌禁❌

    69⭕⭕⭕⭕XXXX老头

    🍆❌女生🍑里免费视频

    54.78MB
    752好评

    洗澡jk爆❌❌乳❌❌跳舞

  • 91桃色在线无码精品㊙️入口

    男人私㊙️Gay网站口爆

    刘亦菲性做爰XXXX免费

    57.36MB
    684好评

    秦湛北人物介绍

  • 76086cc免费版

    禁漫♥羞羞漫画网入口免费

    成人免费毛片❌❌❌下载借种

    24.45MB
    359好评

    在部队伦流澡到高潮H视频免费

  • 99人妻偷拍❤️熟女网

    91四男一女❌❌吸乳羞羞网站

    粉色黄❤️视频入口

    13.98MB
    316好评

    白鹿裸体被❌视频无码1

  • 王昭君被❌18🈲️在线观看

    ChineSeHDX老太婆小说

    成人18❌网站Chinese

    84.56MB
    214好评

    性裸交❌❌❌❌❌性裸内宫

  • 男男被❌吸乳视频

    女👩搡多毛╳╳╳乂乂H电影

    国产做受❌❌❌高潮免费

    45.72MB
    733好评

    18🈲调教捆绑又黄又粗又硬斗罗大陆

  • 碧蓝航线18❌黄漫网站

    日本jzz

    无码精品㊙️入口九色动画

    10.85MB
    183好评

    挤奶玩弄➕跪趴➕嗯啊视频

  • 羞羞漫画❌喷水漫画在线看

    娜美扒开腿狂❌3D

    男生的隐私裸体㊙️偷拍

    44.28MB
    362好评

    边吻奶边挵进去AV片无码网站

  • 动漫美女裸体被❌涩涩动漫

    红豆成人免费毛片❌❌❌

    瓷被扒开大腿❌❌

    91.33MB
    204好评

    男男又爽❌又黄❌免费蘑菇视频

  • 日本人和黑人一级黄色床上片

    9.1人网站🔞张津瑜

    国产互换人妻XXXX6

    30.73MB
    907好评

    柳神同人18❌AV

  • 国产高潮🈲🔞🔞网

    美女➕光屁屁➕无遮挡C哭

    女自慰✅免费观看

    30.77MB
    547好评

    国产❌少萝❌❌视频免费

  • 扒开❌狂揉❌喷水免费看视频

    打美女白嫩屁股㊙️网站

    动漫美女强迫裸体被❌出

    29.13MB
    126好评

    日本老妇和子乱视频A片

  • 灰原哀裸体被❌羞羞的图片

    www.教室被爆❌❌❌羞羞

    ❤️爱情岛亚洲论坛18禁

    70.57MB
    458好评

    巨胸动漫美女被爆❌羞羞网站

  • 男性GAY无套✅中国大爷欧美成人❌❌❌ title="ⅹⅹxxⅹαsⅰan" class="0v5366j9r7414 app-list-img" src="https://t11.baidu.com/it/u=1040017057,165456434&fm=30&app=106&f=JPEG?w=312&h=208&s=15B07D95426079116A1494FD03009032"">

    非洲少妇做爰全过程

    日本人添奶添泬

  • 唐三❌❌小舞流出来日本少高清妇色XXⅩXX title="免费➕无码➕无套内谢软件麻豆" class="0v5366j9r7414 app-list-img" src="https://t10.baidu.com/it/u=3070224572,165461829&fm=30&app=106&f=JPEG?w=312&h=208&s=C6000AAC4838BAC8463F54AC0300A00B"">

    免费的3D黄漫❌18禁视频

    黄色www啊啊啊骚大

  • XXNX👙老师大白屁股啪啪啪 title="日韩美女奶头㊙️免费看网站" class="0v5366j9r7414 app-list-img" src="https://t12.baidu.com/it/u=1041590673,165100299&fm=30&app=106&f=JPEG?w=312&h=208&s=D7383EC642E1D8EA0A87937F0300C078"">

    国内9l🔥自拍九色啦视频

    二人世界拔萝卜第8集高清视频

{{.转码Keywords}} 类似软件

猜你喜欢

相关攻略
包含 饿了么 的应用集
包含 饿了么 的应用集
评论
  • 爱情岛❤️久久 3天前
    美女裸体🔞
  • 成人免费毛片❌❌❌病毒gg 1天前
    “18🈲🍆🍆🍆🍆看片
  • 高清乱码🔞❌♋现场看免费网站 5天前
    free❌国产mdⅩ
  • 18🈲️小泬破白浆 0天前
    ㊙️俄罗斯黄漫
  • ㊙️18禁止进入网站免费 1天前
    pororoHD720😍😍
  • 日本三级无码18🈲️苍井空 9天前
    三月七裸体被❌涩涩
  • wwww999 3天前
    tube❌❌❌❌17
  • 打美女白嫩㊙️光屁屁视频动漫 6天前
    小🐔🐔伸进🈲🔞🔞av
  • 羞羞❌喷水自慰A片游戏 8天前
    当着全班面被c到高潮哭视频
  • 老奶奶日逼 7天前
    纳兰嫣然被扒开腿狂❌