关于ZAKER Skills 合作
新识研究所 2小时前

特殊“指令”能诱导 AI 生成低俗内容?元宝、Kimi、DeepSeek、智谱清言等都存在漏洞

网络色情小说写手借 AI 批量生产低俗内容,ds、元宝、kimi、智谱等多款 AI 存漏洞

近日,据媒体报道,在社交平台上,不少用户公开分享各种完整 AI 提示词,通过角色扮演剧本和互动模拟器等玩法,轻轻松松就让 DeepSeek、元宝、Kimi、智谱清言等主流国产 AI 生成露骨色情或暴力血腥内容。

据悉,这些东西传播隐蔽,复制起来又简单,已经被一些网文写手拿来批量 " 生产 " 低俗小说。

截止目前,小红书方面未就该类文案内容文章的处理措施回应新识研究所,而 DeepSeek、元宝也未就指令生成低俗内容的管控问题作回应。

在小红书社交平台上,流传着 "* 车指令 ""* 游指令 "" 指令 ***" 等词语,成为诱导 AI 生成低俗内容的密码。

大量用户晒出与 AI 的低俗对话截图,附上对应指令或传授诱导话术技巧,相关内容动辄收获数千点赞、收藏,被圈内网友奉为 " 热门资源 "。

南方都市媒体记者点进几个私域群里发现,里面流传着十几套专门针对 DeepSeek 的现成模板,有 " 高岭之花剑尊 × 撩人不自知小徒弟 "" 狠戾暴君 × 和亲公主 " 这种古风虐恋,也有 " 冷面上司 × 职场新人 "" 冷血高利贷债主 × 替兄还债舞蹈生 " 等现代设定,甚至还有师生、母子、强制之类的敏感情节。

这些指令写得特别细,从人物性格、关系设定到互动尺度,全都提前安排好。普通用户根本不用动脑子,直接复制粘贴到对话框里,就能立刻进入低俗模式。

记者也拿其中一个 " 高岭之花剑尊 × 撩人不自知小徒弟 " 的指令试了试,DeepSeek 马上就开始输出对话、心理描写和亲密动作。后面再随便说一句 " 说点暧昧的话 " 或者 " 描述你的动作 ",AI 就源源不断吐出尺度很大的内容,几乎没有任何阻拦。

实际上,不止 DeepSeek 这样,用 " 禁欲隐忍家教哥哥 × 无心撩人软萌学妹 " 指令测试市面上八款主流模型,其中千问、智谱清言、元宝、Kimi 等大模型均直接生成了涵盖色情内容的剧情。

除了这种一对一角色扮演,更麻烦的是 " 模拟器 " 类指令。这类游戏中,用户只需输入特定启动指令,AI 便会按预设规则输出剧情,后续用户既可直接根据剧情选项选择,也能自行输入指令,一步步推动包含暴力、色情元素的剧情发展。

记者通过网友拿到一个 4000 多字的 "** 模拟器 " 完整模板,里面从背景设定、规则、角色创建到剧情流程写得清清楚楚,还明确提到可以加入窒息、束缚之类的性癖元素,以及身体状态变化和表情描写。

把指令发给 DeepSeek,它立刻显示 " 文字游戏已启动 ",然后引导创建人物,接着就弹出包含暴力砍手指和大量性行为的任务选项。用户选一个,AI 就详详细细地往下编。智谱清言和 Kimi 也都能正常启动这类游戏。

在这个圈子里的人大多是网文写手和读者,AI 出来后,他们很快就把这工具用在低俗内容生产上,还发展出角色扮演、互动剧情这些新花样。

内容在平台上半公开传播,用户经常晒生成结果,互相交流哪个模型 " 更听话 "。聊天记录里甚至出现 " 六年级都秒懂 "" 初中生玩得挺开心 " 这样的说法,让人担心未成年人接触这些东西。

为了躲过平台和 AI 的双重审核,他们已经练出一套 " 黑话 " 体系。比如用 " 脐 *"" 颠 *" 这类隐晦词代替敏感内容,输入 AI 后照样能触发露骨输出。

测试发现,DeepSeek 和智谱清言在这上面确实很容易中招。另外还有各种 " 防撤回指令 ",通过加特殊标点或者故意写 " 严禁出现 **" 这种迷惑性要求,逼 AI 绕过安全机制继续生成。

目前看,这些绕过手段门槛低、传播快,已经形成小圈子资源共享。如何让 AI 既聪明又守底线,成了摆在行业面前的现实难题。

平台和模型厂商恐怕得尽快想办法升级防护,不能让低俗内容借着 AI 的 " 翅膀 " 到处飞。

相关标签
新识研究所

新识研究所

奇偶之于无界,产业、公司、数据、产品,我们求客观表达

订阅

觉得文章不错,微信扫描分享好友

扫码分享

企业资讯

查看更多内容