首页 > 国际动态 > 正文
2024-08-21 16:20:02

GPT-4o 微调限时免费开放,每日百万训练 token 大放送

近日,OpenAI 传来令人振奋的消息,GPT-4o 正式上线微调功能,并且限时免费开放,每日还附赠百万训练 token,这一举措在开发者群体中引起了巨大的轰动。

据了解,每个组织每天都能免费获得 100 万个训练 token,此福利将持续到 9 月 23 日。这意味着开发人员现在可以使用自定义数据集微调 GPT-4o,从而以低成本构建自己的应用程序。OpenAI 在公告中透露,GPT-4o 微调训练成本为每 100 万 token 25 美元,这意味着每天都能为开发者节省 25 美元。

消息公布后,收到邮件的开发者们激动不已,纷纷奔走相告,如此大的“羊毛”怎能不薅?而且,OpenAI 还提到,只需训练数据集中的几十个示例就可以产生良好效果,并晒出了成功案例。

首先是一款代码助手 Genie,来自 AI 初创公司 Cosine,专为协助软件开发人员而设计。据 Cosine 官方介绍,Genie 的开发过程采用了一种专有流程,使用数十亿个高质量数据对非公开的 GPT-4o 变体进行了训练和微调。经过微调,Genie 在上周二 OpenAI 全新发布的代码能力基准测试 SWE-BenchVerified 上,取得了 43.8%的 SOTA 分数。与此同时,Genie 还在 SWE-BenchFull 上的 SOTA 分数达到了 30.08%,破了之前 19.27%的 SOTA 纪录。

另一个案例来自 Distyl,这是一家为财富 500 强企业提供 AI 解决方案的公司,最近在领先的文本到 SQL 基准测试 BIRD-SQL 中排名第一。经过微调,其模型在排行榜上实现了 71.83%的执行准确率,并在查询重构、意图分类、思维链和自我纠正等任务中表现出色,尤其是在 SQL 生成方面表现尤为突出。

除了提供案例,OpenAI 还在公告中特意强调了数据隐私和安全问题。开发者的业务数据(包括输入和输出)不会被共享或用于训练其他模型。针对微调模型实施了分层安全缓解措施,例如不断对微调模型运行自动安全评估并监控使用情况。

不过,在一片热闹之际,也有网友认为微调仍然比不上提示词缓存。提示词缓存具有速度更快、成本更低的优势,对开发者更友好。但也有人为微调打 call,认为微调在塑造响应方面更有效。

GPT-4o 微调限时免费开放这一举措为开发者们带来了巨大的机遇,相信在未来会有更多精彩的应用诞生。