关注我们在 Facebook 上
技术
Meta 宣布无需人工干预即可进行学习和训练的人工智能模型
Meta 宣布了一种名为“自学习评估器”的新人工智能模型,它提供了评估和训练其他人工智能模型的能力,而无需人类反馈。这一举措是鉴于科技公司之间不断加速开发独立且更高效的人工智能模型的竞赛而采取的。
Meta 超越了依赖人类干预的人类反馈强化学习 (RLAIF) 技术,这种新模型旨在加速人工智能模型的训练过程并降低其高昂的成本。
自学评估员如何工作?
该模型基于OpenAI开发的“思维链”技术,这是一种基于将复杂问题分解为更小的逻辑步骤的方法。这种方法有助于人工智能为科学、数学和编程问题提供更精确的答案。新模型还对人工智能生成的数据进行训练,使其在学习方面更加自主。
这项技术的重要性
Meta 开发人员强调,新模型仍然依赖人类反馈来确保准确性,但它显着减少了持续人类干预的需要。这位自学成才的评估者有望通过加速和开发人工智能模型来进行创新,而无需付出巨大的人力成本,从而使 Meta 处于这场关键技术竞赛的前沿。