哈?AI 秘密潜入 Reddit 社区," 操纵 " 用户观点 4 个月。
离谱的是,人类全程毫无察觉,而且被 AI 说服改变想法的概率,高达正常基准的 6 倍!
Reddit Lies 在 X 上发布了一则帖子,引发二百多万网友围观。
Reddit 的 r/changemyview(CMV)版主最近曝光了一项研究,称苏黎世大学研究人员在 2024 年 11 月至 2025 年 3 月期间,瞒着 CMV 社区用户,搞了一场未经授权的实验。
他们违背 CMV 社区规则,部署了 AI 账号生成评论以研究 AI 如何影响和改变人们的观点。
先来看一下这项实验。
在 r/changemyview 中,用户就各类话题分享观点,通过提出论点和反驳观点来促使他人改变看法。
通用条件:LLM 仅接收帖子的标题和正文内容。
个性化条件:除帖子内容外,LLM 还会获取原发帖人(OP)的个人属性(性别、年龄、种族、所在地…),这些属性是通过另一个 LLM 从原发帖人的发帖历史中推断得出的。
社区对齐条件:为确保回复符合社区的写作风格和潜在规范,回复由经过微调的模型生成,该模型使用实验前帖子中获得 " Δ " 的评论进行训练。
发帖流程如图:
团队报告了每种处理条件下获得 " Δ " 的评论比例。
结果在所有处理条件下,AI 表现都大幅超越人类水平,说服率是人类基线水平 3-6 倍。个性化条件的说服率为 0.18,通用条件为 0.17,社区对齐条件略低,为 0.09,但仍显著优于仅为 0.03 的基线水平。
下图展示了不同用户个体说服率的累积分布情况 ,有一部分是 " 专家用户 ",他们之前在社区就得到过很多 " Δ "。
在个性化条件下,LLM 表现特别突出,在所有用户里排到了前 1%,在专家用户里排到了前 2%;通用条件下,排在所有用户的前 2%,专家用户的前 4%;社区对齐条件相对弱一些,在所有用户里排在前 12% ,专家用户里排在前 25%。
另外值得一提的是,团队指出本研究已获苏黎世大学伦理委员会批准,并在 OSF 进行了预注册。所有生成评论均由团队的一名研究人员审核,以保不会发布有害或不道德的内容。
研究指出,实验仍在进行中,结束后会向社区妥善披露相关情况。
虽说研究团队有自己的说法,但一些网友们可不买账,对这种不经授权就进行 AI 实验的做法进行了谴责。
参考链接:
[ 1 ] https://x.com/reddit_lies/status/1916916134630117814
[ 2 ] https://regmedia.co.uk/202504/29/supplied_can_ai_change_your_view.pdf
[ 3 ] https://www.reddit.com/r/changemyview/comments/1k8b2hj/meta_unauthorized_experiment_on_cmv_involving/
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
点亮星标
科技前沿进展每日见