OpenAI DeepSeek,突破界限,未引发恐慌的奇迹
OpenAI推出的DeepSeek并未引发社会的担忧或恐慌,DeepSeek是一款功能强大的AI工具,旨在帮助用户更有效地进行搜索和分析任务,它的推出,旨在推动人工智能的发展并造福人类,并未引起不必要的紧张情绪。
今日凌晨,备受瞩目的OpenAI o3模型完整版终于面世,与以往的逐步发布方式不同,这次OpenAI同时发布了o3和o4-mini两款模型,官方宣称,这两款模型的亮点在于能够组合调用ChatGPT中的多个工具,如网络搜索、Python编程、图像分析、文件解释和图像生成等,这标志着OpenAI在Agent能力方面的探索取得了新的进展。
作为推理模型,o3在编程、数学、科学、视觉感知等多个领域的基准测试中都取得了显著的成绩,特别是在Codeforces、SWE-bench和MMMU等基准测试中,o3在视觉任务上的准确率高达87.5%,MathVista达到75.4%,真正引人注目的是o3和o4-mini具备将图像直接纳入思维链的能力,这意味着图像不仅被看到,还能作为思考过程的一部分被运用。
从OpenAI团队成员发布的帖文中可以看出,“用图像思考”的研发计划自去年9月发布o系列模型以来就已启动,尽管之前推出了o1 Vision并进行了初步预览,但o3和o4-mini实现这一能力后,才真正引起了业界的广泛关注。
据外部专家评估,o3在处理复杂问题上的表现相较于其前任有了显著的提升,特别是在生物学、数学和工程等领域,一位医学博士在测评后表示,o3在处理临床或医学问题时,能够给出精准且全面的回答,表现出真正的专家级水平。
对于想要体验的用户来说,OpenAI官方已经提供了体验o3、o4-mini以及o4-mini-high的机会,之前的模型如o1、o3-mini和o3-mini-high已经逐渐退出舞台,这一转变被一些网友形象地称为“内部赛马”。
尽管o3和o4-mini模型已经亮相,但一些业内人士对其评价并不如预期那么高,他们认为OpenAI的创新步伐似乎有所放缓,一位业内人士感叹,OpenAI的步调已经不再那么昂首挺胸,行业趋势已经转向对数据高要求、对Agent全适配的方向,这意味着私有化和混合模型推理的时代已经到来。
竞争对手的快速发展也给OpenAI带来了压力,年初DeepSeek-R1的亮相以其超低的训练成本和与o1相当的性能给OpenAI带来了挑战,尤其是DeepSeek的全方位开源更是加大了OpenAI的竞争压力,这两记“耳光”不仅使OpenAI失去竞争优势,还打乱了其节奏和创新步伐,尽管官方表示此次发布的模型是GPT-5前的关键一步,但业界对于OpenAI能否重回巅峰仍持观望态度。
OpenAI在模型发布上持续努力,但在技术创新方面仍面临诸多挑战,未来OpenAI能否重拾辉煌,还需拭目以待,期待OpenAI能够克服挑战,持续推动人工智能的发展,并为用户带来更有效的搜索和分析体验。