主要内容
思考机器实验室,一家由 OpenAI 知名研究员联合创立的获得大量资金的初创公司,透露了其首款产品——一种名为 Tinker 的工具,该工具可自动创建定制的前沿 AI 模型。在宣布之前接受《连线》杂志采访时,思考机器的联合创始人兼首席执行官 Mira Murati 表示:“我们相信[Tinker]将帮助研究人员和开发者进行模型实验,并使前沿能力对所有人更易获取。”
大公司和学术实验室已经在微调开源 AI 模型,以创建针对特定任务优化的新变体,如解决数学问题、起草法律协议或回答医疗问题。通常,这项工作涉及获取和管理 GPU 集群,并使用各种软件工具来确保大规模训练运行的稳定和高效。Tinker 承诺通过自动化大部分工作,让更多企业、研究人员甚至爱好者能够微调自己的 AI 模型。本质上,该团队押注帮助人们微调前沿模型将成为 AI 的下一件大事。并且有理由相信他们可能是正确的。
思考机器实验室由在创建 ChatGPT 中发挥核心作用的研究人员领导。据我与之交谈的测试人员称,与市场上的类似工具相比,Tinker 更强大且用户友好。Murati 表示,思考机器实验室希望揭开调整世界上最强大的 AI 模型所涉及工作的神秘面纱,并使更多人能够探索 AI 的极限。“我们正在使原本是前沿的能力对所有人都可访问,这完全是变革性的,”她说,“外面有很多聪明人,我们需要尽可能多的聪明人进行前沿 AI 研究。”
Tinker 目前允许用户微调两个开源模型:Meta 的 Llama 和阿里巴巴的 Qwen。用户可以编写几行代码接入 Tinker API,并通过监督学习(即使用标记数据调整模型)或强化学习(一种基于模型输出给予正负反馈来调整模型的日益流行的方法)开始微调。然后,用户可以下载其微调后的模型并在任何地方运行。
AI 行业密切关注此次推出,部分原因是其背后团队的水平。Murati 此前是 OpenAI 的首席技术官。在 2023 年底董事会罢免 Sam Altman 后,她短暂担任 OpenAI 的首席执行官。大约 10 个月后,她宣布离开该公司。Murati 与其他一些 OpenAI 资深人士共同创立了思考机器实验室,包括 OpenAI 联合创始人 John Schulman、研究前副总裁 Barret Zoph、从事安全和机器人研究的 Lilian Weng、从事预训练和推理工作的 Andrew Tulloch 以及训练后专家 Luke Metz。
该团队在甚至还未宣布任何产品之前就引起了很多关注:7 月,该初创公司透露已筹集到 20 亿美元的种子资金,使其估值达到 120 亿美元。Schulman 领导了通过强化学习微调支持 ChatGPT 的大型语言模型的工作。人类测试人员的输入提供了一个奖励信号,使模型在保持连贯对话、回答问题时不偏离轨道以及避免不良行为方面要好得多(尽管不是完美的)。他声称,Tinker 将通过利用强化学习和其他训练技巧,使更多人更容易从大型模型中引出新能力。“有很多秘密魔法,但我们让人们完全控制训练循环,”Schulman 告诉《连线》杂志,“我们抽象掉了分布式训练的细节,但我们仍然让人们完全控制数据和算法。”
思考机器实验室将于周三开始让用户申请访问 Tinker。该公司正在