发布时间:2025-06-11 来源:AIG
ChatGPT 宕机了一整晚,全球网友已经乱成一锅粥了。
OpenAI 的处理方案也有些另类,一边抓紧时间修 bug,一边突然上线了 o3-pro 模型。
从今天起,o3-pro 率先向 Pro 和 Team 用户开放,在模型选择器里将替代原本的 o1-pro,而 Enterprise 和 Edu 用户还得等到下周。
只能说,Plus 用户的命也是命。
作为推理模型 o3 的升级版,o3-pro 在处理复杂问题、给出更精准的回答方面表现更强,尤其在科学研究、编程、教育和写作这些场景下,有着明显优势。
此外,它也支持调用 ChatGPT 的全套工具,比如网页搜索、文件分析、图像推理、Python 编程、记忆个性化等,整体执行力和整合能力都更强。
当然,功能多了,响应速度也稍微慢了下来。
由于任务调度和工具链调用更复杂,o3-pro 的响应速度一般要比 o1-pro 要长一点,所以更适合在你需要认真思考,或者对答案准确性要求较高的场景中使用。
在官方专家评估中,评审人员普遍认为 o3 Pro 在表达清晰度、答案完整性、指令执行能力和逻辑准确性方面都比 o3 模型更进一步,尤其适合用在科学、教育、编程、商业和写作这些需要深度输出的任务中。
学术评估也验证了这一点,o3-pro 的整体表现持续优于 o1-pro 和 o3。
为了更科学评估模型的稳定性,OpenAI 引入了「四次全对」的评估标准——只有模型连续四次给出正确答案,才算成功。
可以说,这套机制大幅提升了对推理一致性的要求。
值得注意的是,o3 Pro 此次并未单独发布系统卡。OpenAI 表示,由于 o3-pro 与 o3 使用相同的底层模型,其完整的安全性说明请参见 o3 系统卡。
但目前 o3 Pro 仍存在一些功能限制,比如不支持临时对话、图像生成和 Canvas 功能。如需生成图像,用户仍需使用 GPT-4o、o3 或 o4-mini 模型。
在正式上线之前,一些开发者已获得 o3 Pro 的早期访问权限。
前 SpaceX 软件工程师及苹果 visionOS 设计师的 Ben Hylak 在过去一周获得了 o3-pro 的早期访问权限,其体验历程也得到了 OpenAI CEO Sam Altman 在社交媒体上的转发。
具体来说,Ben 与其联合创始人 Alexis 花时间整理了 Raindrop 过去所有的规划会议记录、目标、甚至语音备忘录,然后请 o3-pro 尝试生成一个战略性规划文档。
最终模型生成的结果让他们大受震撼:内容清晰、结构完整,不仅覆盖了目标和时间线,还自动梳理出优先级,甚至明确指出了哪些内容应被砍掉。
在 Ben 看来,模型再强,如果无法融入真实的工作环境,也难以成为真正有用的「成员」。
而 o3 Pro 在理解复杂环境、表达工具能力、提出适当问题、合理调度资源方面有明显提升。尽管模型偶尔在缺乏上下文时会出现「过度思考」的问题,但整体表现已明显优于此前版本。