GPT-5 不会发布!

LLM的基础训练已经达到了极限。以下是原因以及人工智能创新未来的方向。

最新的 Twitter 讨论在 AI 领域引起了轰动:将不会推出 GPT-5!

那就对了 - 专家们声称我们已经达到了大型语言模型的顶峰。句号。

但这是全部故事吗?

在本文中,我们将把标题党与事实分开,并探讨人工智能创新的下一步发展。

Sam Altman and Ilya Sutskever. Source

基础训练的巅峰

训练最先进的LLMs需要大量的数据。问题是什么?高质量、多样化的文本信息宇宙是有限的。随着模型的增长,添加更多数据和计算的收益变得微不足道。

简单地说:我们已经达到了基本培训所能达到的极限。

更大并不一定更好的成本

将模型变得更大不仅会消耗所有可用的数据,还会造成巨额成本。如今训练最大的模型成本高达数亿美元,但改进幅度越来越小。

要在功能方面取得重大进展,我们需要成倍增加数据和计算力-这要远远超过现实世界中可用的数量。

How Much Money and Data Were Spent on Training Recent Models. source

这引发了一个关键问题:

如果缩放不再是答案,这是否意味着人工智能的进展已经结束了?

答案并不像看起来那么简单。

真正的改变是从哪里来的?

尽管基础训练可能已经达到顶峰,但真正的进步现在发生在我们如何使用人工智能,而不是如何训练它。OpenAI最近的o1模型展示了这种转变。o1并不依赖于更多的数据或更大的模型,而是通过更智能的方法实现了最先进的性能。

Comparison of o1, o1-preview, gpt-4o and experts performance. source

o1的成功关键在于其对思维链技术的运用:

思维链:一种推理方法,其中人工智能模型将复杂问题分解成较小的逻辑步骤,提高决策的准确性和清晰度。

举例来说,模型不是通过一次性解决问题,而是步步解释其过程来模拟人类推理。这里有一个著名的例子:问题:在“草莓”中有多少个“r”?回答:首先,让我们把这个单词拆成字母:“s”,“t”,“r”,“a”,“w”,“b”,“e”,“r”,“r”,“y”。现在,让我们数一下字母“r”的出现次数:1,2,3。答案是3。

这种方法可以让人工智能更深入地思考任务,而不需要更大或更昂贵的模型。

代理商:下一个大事件

另一个推动创新的领域是人工智能代理的兴起 - 自主系统可以与工具、环境甚至自身互动,以解决问题或完成任务。

这些代理不仅仅是回答问题,他们还采取行动,与其他系统合作,甚至从结果中学习。它们代表着人工智能应用的下一个前沿:在我们的专题文章中了解更多关于AI代理如何不断进化的信息。

接下来是什么?

未来:更小的模型,更智能的应用随着企业将人工智能整合到运营中,重点正在转向实用性。现在重要的不再是拥有最大的模型,而是针对特定任务最有能力的模型。

在Axioma AI,我们看到三个关键领域引领着这种转变:

  1. 上下文专业知识:针对金融、医疗保健或媒体等行业定制的专业模型。
  2. 自主代理:能够与工具和平台进行交互,自主处理复杂工作流程的人工智能系统。
  3. 合作智能:系统的设计不是用来取代人类,而是直接集成到业务流程中。

基础训练的黄金时代也许已经过去,但真正的工作才刚刚开始。通过专注于更智能的方法论、增强的互动性和定制的应用程序,我们可以释放人工智能的真正潜力。

Photo by Matt Foxx on Unsplash

在Axioma AI,我们领先于建立更智能、更高效的系统,超越了武力扩展的局限。我们的使命是重新定义行业,赋予企业在快速变化的世界中蓬勃发展的力量。共同努力,我们可以共同塑造一个未来,AI不仅仅是一个工具——它是一个值得信赖的伙伴,推动着可能性的边界。

与艾克索玛AI一起,我们在人工智能实验室开发前沿解决方案,帮助企业节省时间和金钱。

⭕准备好削减不必要的运营成本了吗?✅查看我们的 AI 实验室,并申请免费咨询,开始构建更智能、数据驱动的未来。

⭕需要每日人工智能创新和内幕提示吗?✅在LinkedIn和𝕏上关注我们,获取每日分析和成功故事、新闻以及可执行策略。

⭕ 喜欢这篇文章吗?✅关注Axioma AI Journal获取深入的教程、顶级分析和独家AI洞察。

感谢阅读!

2024-11-18 04:41:31 AI中文站翻译自原文