OpenAI 发布“ o1”新一代大模型，更拿手推理也更贵

09-13 305阅读 0评论

传说中的“草莓”现身，9月12日晚间，OpenAI正式对外发布一款名为o1的新模型，这款模型为该公司下一代 “推理” 模型中的第一个，o为“Orion（猎户座）”，这款模型可以比人类更快地答复更杂乱的问题。

与曾经的模型比较，在编写代码和处理多进程问题方面做得更好。但它也比此前发布的GPT-4o更贵，答复问题也更慢。OpenAI着重o1的这次发布为 “预览版”，还仅仅初始状况。此次一起发布的还有更小、更廉价的版别o1-mini 。对OpenAI来说，o1 代表着向其更广泛的类人人工智能方针迈出的一步。

ChatGPT Plus和团队用户即日起便可以拜访o1预览版和o1-mini，而企业和教育用户将在下周初取得拜访权限。OpenAI表明，它方案让ChatGPT的一切免费用户都能拜访o1-mini，但没有确认发布日期。

对开发者来说，拜访o1的本钱比之前要高出许多：经过API运用o1预览版，输入每百万token要收费15美元，输出每百万收费60美元。比较之下，GPT-4o的百万token输入收费只要5美元，输出为15美元。

OpenAI 的研讨担任人杰里・特沃雷克（Jerry Tworek）向媒体泄漏，o1 “是运用一种全新的优化算法和专门为其定制的新练习数据集进行练习的”，它设置了奖赏和赏罚机制，经过强化学习的技能练习模型自行处理问题，它使用相似人类经过逐渐处理问题方法的“思想链”处理问题。这种新的练习方法，使得模型愈加精确。“咱们注意到这个模型的错觉更少了，” 特沃雷克说，但这个问题依然存在，“咱们不能说咱们处理了错觉问题。”

依据OpenAI的说法，这个新模型与GPT-4o的首要差异在于它可以比其前身更好地处理杂乱问题，如编码和数学，一起还能解说其推理进程。OpenAI还对o1进行了国际数学奥林匹克资格考试的测验，尽管 GPT-4o只正确处理了13%的问题，但o1得分达到了83%。

在被称为Codeforces竞赛的在线编程竞赛中，这个新模型达到了参与者的89%的百分位，OpenAI宣称这个模型的下一次更新将在具有挑战性的物理、化学和生物学基准使命中体现得 “相似于博士生”。

尽管在数学和代码方面发挥更超卓，但o1在许多方面不如GPT-4o，包含在关于国际的现实常识方面体现欠安，以及没有阅读网页或处理文件和图画的才能。不过，OpenAI以为它代表了一种全新的才能类别，被命名为o1是为了表明 “将计数器重置回 1”。