用上大模型，阴谋论不灵了！来自MIT最新研讨丨Science封面

09-15 477阅读 0评论

叨乐发自凹非寺
量子位 | 大众号 QbitAI

诡计论的“兔子洞”，被AI破解了！

MIT的最新研讨登上了Science封面：与AI对话，有助于继续地下降诡计论的影响。

研讨成果显现，大模型辩驳诡计论的准确性极高！

经过专业实际核查员评价，99.2%的辩驳内容都被认定为实在信息，仅有0.8%存在必定的误导性，而且全体没有任何虚伪信息和成见内容。

研讨成果一经宣布，就受到了广泛重视，但人们对AI破解诡计论的情绪褒贬不一。

有人以为这是人类对立过错思想的巨大东西。

也有人说，放到实际中的话，这一切并不建立。因为她身边的诡计论者都十分抵抗运用AI东西，就算他们用了AI也不会信任它所给出的答案。

但是，更多的人仍然对这项研讨成果持乐观情绪。

至于成果终究怎么，我们来一探终究！

成功破解“兔子洞”

试验中，研讨人员别离招募了1055人进行医治组试验，以及2286人进行对照组试验。

其间，医治组要求参与者与AI进行对话，评论他们挑选的诡计论，而对照组则是和AI评论一个无关的论题。

终究的试验成果显现，医治组的诡计论崇奉均匀削减了约20%，而对照组几乎没有改变。

这一作用在2个月后仍然存在，而且对各种诡计论都有遍及的影响。

即使是对初始崇奉根深柢固的参与者也是如此。

试验也影响了参与者的后续的行为。（比方他们会在交际媒体上取关那些传达诡计论的博主）

团队的研讨人员更是发文感叹：

需求和动机并不会彻底使你在堕入诡计论后失掉沉着，只需详细且量身定制的依据就能够协助你回归实际。干涉是可行的！

怎么破解？

已然“干涉是可行的”，那我们就来一同唠唠试验中是怎么进行“干涉”的。

试验中，研讨人员先是让参与者们完成了包含了15个诡计论的崇奉量表，以0-100的等级来对他们的初始崇奉进行评分。

而且要求他们描绘出一个自己信任的诡计论，还要供给出相关的依据。（用来生成AI对话的初始摘要）

之后就将他们分配到“医治组”和“对照组”进行试验。

期间他们会与依据GPT-4 Turbo的模型进行三轮对话，对话均匀继续8.4分钟。

试验中，AI的意图是针对参与者所供给的详细依据进行辩驳，并企图削减他们对该诡计论的崇奉。

在对话完毕后，一切参与者需求从头测验他们对所述诡计论的崇奉程度，等级规模仍然是0-100，用来评价干涉的的作用。

之后的10天和2个月的时间内，研讨人员再次联络参与者，进行崇奉程度的追寻丈量，从而评价崇奉改变的持久性。

此外，研讨团队经过不断调整问卷的遣词，成功在两轮试验中验证了研讨成果的稳定性。

看完试验进程，我们再来唠一唠这项试验有哪些立异之处：

首要，研讨采用了实时互动形式，AI能依据参与者的详细依据和辩驳灵敏调整观点和战略，这种办法比传统的静态问卷或预设干涉更具灵敏性和针对性。

其次，研讨提出了一种新的试验范式，结合了行为科学和生成式AI的优势，使得研讨者能够实时获取参与者的崇奉陈说，并将其转化为定量成果。

不过AI虽好，可不要贪杯，究竟“水能载舟亦能覆舟”。

就像研讨人员所说的那样：

假如没有保护措施，言语模型也可能让人们信任诡计论或其他虚伪信息。

不过他仍是交心的给我们送上了相关链接供我们进行测验。

试玩链接现已附上，感兴趣的朋友们能够围观一下~

试玩链接：
https://www.debunkbot.com/

参阅链接：
[1]https://www.science.org/doi/10.1126/science.adq1814
[2]https://www.science.org/doi/10.1126/science.ads0433
[3]https://www.science.org/doi/10.1126/science.adt0007
[4]https://x.com/DG_Rand/status/1834291074480660560

相关阅读

发表评论取消回复

评论列表（暂无评论，477人围观）

还没有评论，来说两句吧...

目录[+]