用上大模型,阴谋论不灵了!来自MIT最新研讨丨Science封面
叨乐 发自 凹非寺
量子位 | 大众号 QbitAI
诡计论的“兔子洞”,被AI破解了!
MIT的最新研讨登上了Science封面:与AI对话,有助于继续地下降诡计论的影响。
研讨成果显现,大模型辩驳诡计论的准确性极高!
经过专业实际核查员评价,99.2%的辩驳内容都被认定为实在信息,仅有0.8%存在必定的误导性,而且全体没有任何虚伪信息和成见内容。
研讨成果一经宣布,就受到了广泛重视,但人们对AI破解诡计论的情绪褒贬不一。
有人以为这是人类对立过错思想的巨大东西。
也有人说,放到实际中的话,这一切并不建立。因为她身边的诡计论者都十分抵抗运用AI东西,就算他们用了AI也不会信任它所给出的答案。
但是,更多的人仍然对这项研讨成果持乐观情绪。
至于成果终究怎么,我们来一探终究!
成功破解“兔子洞”
试验中,研讨人员别离招募了1055人进行医治组试验,以及2286人进行对照组试验。
其间,医治组要求参与者与AI进行对话,评论他们挑选的诡计论,而对照组则是和AI评论一个无关的论题。
终究的试验成果显现,医治组的诡计论崇奉均匀削减了约20%,而对照组几乎没有改变。
这一作用在2个月后仍然存在,而且对各种诡计论都有遍及的影响。
即使是对初始崇奉根深柢固的参与者也是如此。
试验也影响了参与者的后续的行为。(比方他们会在交际媒体上取关那些传达诡计论的博主)
团队的研讨人员更是发文感叹:
需求和动机并不会彻底使你在堕入诡计论后失掉沉着,只需详细且量身定制的依据就能够协助你回归实际。干涉是可行的!
怎么破解?
已然“干涉是可行的”,那我们就来一同唠唠试验中是怎么进行“干涉”的。
试验中,研讨人员先是让参与者们完成了包含了15个诡计论的崇奉量表,以0-100的等级来对他们的初始崇奉进行评分。
而且要求他们描绘出一个自己信任的诡计论,还要供给出相关的依据。(用来生成AI对话的初始摘要)
之后就将他们分配到“医治组”和“对照组”进行试验。
期间他们会与依据GPT-4 Turbo的模型进行三轮对话,对话均匀继续8.4分钟。
试验中,AI的意图是针对参与者所供给的详细依据进行辩驳,并企图削减他们对该诡计论的崇奉。
在对话完毕后,一切参与者需求从头测验他们对所述诡计论的崇奉程度,等级规模仍然是0-100,用来评价干涉的的作用。
之后的10天和2个月的时间内,研讨人员再次联络参与者,进行崇奉程度的追寻丈量,从而评价崇奉改变的持久性。
此外,研讨团队经过不断调整问卷的遣词,成功在两轮试验中验证了研讨成果的稳定性。
看完试验进程,我们再来唠一唠这项试验有哪些立异之处:
首要,研讨采用了实时互动形式,AI能依据参与者的详细依据和辩驳灵敏调整观点和战略,这种办法比传统的静态问卷或预设干涉更具灵敏性和针对性。
其次,研讨提出了一种新的试验范式,结合了行为科学和生成式AI的优势,使得研讨者能够实时获取参与者的崇奉陈说,并将其转化为定量成果。
不过AI虽好,可不要贪杯,究竟“水能载舟亦能覆舟”。
就像研讨人员所说的那样:
假如没有保护措施,言语模型也可能让人们信任诡计论或其他虚伪信息。
不过他仍是交心的给我们送上了相关链接供我们进行测验。
试玩链接现已附上,感兴趣的朋友们能够围观一下~
试玩链接:
https://www.debunkbot.com/
参阅链接:
[1]https://www.science.org/doi/10.1126/science.adq1814
[2]https://www.science.org/doi/10.1126/science.ads0433
[3]https://www.science.org/doi/10.1126/science.adt0007
[4]https://x.com/DG_Rand/status/1834291074480660560
还没有评论,来说两句吧...