关注我们在 Facebook 上

Walaw

技术

OpenAI 披露其新生成式 AI 模型的部分架构

星期二 01 四月 2025 - 09:37

Zoom

OpenAI 首席执行官萨姆·奥特曼 (Sam Altman) 周一宣布，这家初创公司将公布一种新型生成人工智能 (AI) 模型的部分架构，这是自推出 ChatGPT 以来该公司一直对其程序和方法保密的战略转变。
OpenAI将提供开放的权重参数，即定义模型如何工作并在开发后指导模型的标准。

“开放权重”不同于“开源”，即可以自由获取模型本身的编程代码。它受到更多限制，不允许我们确定如何构建生成式 AI 界面。

专家们对一些生成式人工智能参与者提出了批评，他们声称提供开放访问权限，但实际上他们仅限于加权。

访问权重可以帮助开发人员根据他们的特定需求校准 OpenAI 模型。

“我们已经考虑了很长时间，但其他优先事项占据了上风，”X 上的 Sam Altman（前 Twitter 员工）解释道，他回忆说，自 2019 年推出 GPT 2 以来，Open AI 就没有发布过模型的细节。

ChatGPT 于 2022 年 11 月推出，基于 GPT 3.5。

OpenAI 产品经理 Kevin Weil 向 X 表示，上述模型将在“未来几个月内”发布。

在不久的将来，该初创公司将在旧金山、欧洲和亚洲举办活动，让程序员测试该模型并分享他们的印象和建议。

到目前为止，OpenAI 和 Anthropic 是生成式人工智能领域少数几个没有透露其模型机制的重量级公司之一。

Meta、Google 和 Mistral 都选择发布其部分架构，中国公司 DeepSeek 也是如此，其 R1 模型在一月份震惊了生成式人工智能领域。

关键词：

300 / 剩余字符 300

发布条件 : 不得侮辱作者、他人或宗教场所，不得攻击宗教或神灵，避免种族煽动和侮辱

评论中表达的观点仅代表作者本人，不代表 Lou.Press 的观点