北京时间18日中午,美国企业家埃隆·马斯克创办的人工智能公司xAI推出了新一代AI模型Grok 3,马斯克称其“聪明得可怕”。Grok 3拥有更高的推理、计算和适应能力,代表着AI模型向前迈出重要一步。
马斯克在直播演讲中表示:“Grok 3的能力比Grok 2高出一个数量级,它是一种最大程度寻求真相的人工智能。”
xAI公司称,Grok 3在包括AIME(评估模型在数学问题样本上的表现)和GPQA(博士专家水平的物理、生物和化学问题评估模型)在内的基准测试中胜过了GPT-4o。
更准确地说,Grok 3代表一个模型系列,而非单一的模型型号。xAI公司表示,Grok 3的推理模型处于测试阶段(Beta版),并且仍在训练中。该公司推出了推理模型的迷你版本,即Grok 3 mini,它可以更快地回答问题,但准确性可能不高。
此外,Grok 3还引入了“DeepSearch”,该公司称其为一种新型搜索引擎,同时也是类似代理功能的早期版本。
原计划在此次发布中推出的语音模式并未如期上线,马斯克称其最快将在大约一周后推出。几个月后,当Grok 3模型成熟之时,xAI将开源Grok 2。
据xAI此前报告称,其仅用8个月时间打造的Colossus超级计算机加速了Grok 3的开发进程。该系统搭载了10万台英伟达H100 GPU,提供了2亿GPU小时的训练时长,相较其前身Grok 2提升了10倍。算力的显著提升使Grok 3能高效处理大型数据集,缩短训练时间并提高准确性。xAI还表示,已在Grok 3中引入人类反馈循环和情境训练,从而确保其回答更加自然和准确。
为了增强Grok 3的能力,xAI还调整了训练方法。现在,该模型通过整合合成数据集、引入自我校正机制和强化学习,来全面提升性能表现。据xAI方面和马斯克介绍,这些改进将通过多重验证步骤减少错误回答(即“幻觉”现象),通过核对可靠信息源来提高逻辑准确性,并通过持续自我评价和学习实现更有效的适应。