- 11:11地区紧张局势:伊朗威胁若西方国家支持以色列将袭击其设施
- 10:44非洲司令部总部:摩洛哥会很快成为美国在非洲的军事首都吗?
- 10:30韩国科技巨头 Naver 与英伟达和 Taqa Morocco 合作,在摩洛哥启动人工智能数据中心
- 16:19特朗普:我们一次又一次地给予伊朗达成协议的机会,下一次将更具侵略性
- 13:25美国施压各国抵制联合国巴勒斯坦问题会议
- 09:26五角大楼承认已制定应对格陵兰岛和巴拿马入侵的应急计划
- 09:10加拉·巴伊亚在纽约强调国际社会对摩洛哥自治计划的大力支持
- 15:15中国确认与美国达成贸易协议
- 14:35尽管特朗普发出威胁,美国各地仍爆发大规模抗议活动,抗议军事化和移民政策
关注我们在 Facebook 上
技术
OpenAI 披露其新生成式 AI 模型的部分架构
OpenAI 首席执行官萨姆·奥特曼 (Sam Altman) 周一宣布,这家初创公司将公布一种新型生成人工智能 (AI) 模型的部分架构,这是自推出 ChatGPT 以来该公司一直对其程序和方法保密的战略转变。
OpenAI将提供开放的权重参数,即定义模型如何工作并在开发后指导模型的标准。
“开放权重”不同于“开源”,即可以自由获取模型本身的编程代码。它受到更多限制,不允许我们确定如何构建生成式 AI 界面。
专家们对一些生成式人工智能参与者提出了批评,他们声称提供开放访问权限,但实际上他们仅限于加权。
访问权重可以帮助开发人员根据他们的特定需求校准 OpenAI 模型。
“我们已经考虑了很长时间,但其他优先事项占据了上风,”X 上的 Sam Altman(前 Twitter 员工)解释道,他回忆说,自 2019 年推出 GPT 2 以来,Open AI 就没有发布过模型的细节。
ChatGPT 于 2022 年 11 月推出,基于 GPT 3.5。
OpenAI 产品经理 Kevin Weil 向 X 表示,上述模型将在“未来几个月内”发布。
在不久的将来,该初创公司将在旧金山、欧洲和亚洲举办活动,让程序员测试该模型并分享他们的印象和建议。
到目前为止,OpenAI 和 Anthropic 是生成式人工智能领域少数几个没有透露其模型机制的重量级公司之一。
Meta、Google 和 Mistral 都选择发布其部分架构,中国公司 DeepSeek 也是如此,其 R1 模型在一月份震惊了生成式人工智能领域。
评论 (0)