转载

OpenAI GPT-3 微调

开发人员现在可以根据自己的数据微调 GPT-3,创建适合其应用程序的自定义版本。定制使 GPT-3 在更广泛的用例中变得可靠,并使模型的运行成本更低、速度更快。

您可以使用几乎任何形状和大小的现有数据集,或根据用户反馈逐步添加数据。通过微调,一位 API 客户能够将正确输出从 83% 提高到 95%。通过每周从他们的产品中添加新数据,另一个将错误率降低了 50%。

要开始使用,只需使用您提供的文件在 OpenAI 命令行工具中运行一个命令。您的自定义版本将开始训练,然后立即在我们的 API 中可用。

阅读文档

去年我们 训练了 GPT-3并在我们的 API 中提供了它 。只需几个示例,GPT-3 就可以执行各种 自然语言任务,这个概念称为少样本学习或提示设计。自定义 GPT-3 可以产生更好的结果,因为您可以提供比提示设计更多的示例。

您可以使用一个命令为您的应用程序自定义 GPT-3,并立即在我们的 API 中使用它:

openai api fine_tunes.create -t
怎么看

只需不到 100 个示例即可开始看到微调 GPT-3 的好处,并且随着您添加更多数据,性能会不断提高。在 去年 6 月发表的研究中,我们展示了使用少于 100 个示例进行微调如何提高 GPT-3 在某些任务上的性能。我们还发现,样本数量每增加一倍,质量就会线性提高。

借助我们最具挑战性的研究数据集之一, 小学数学问题,微调 GPT-3 可将准确度提高 2 到 4 倍,超过提示设计的可能性。

两种尺寸的 GPT-3 模型,Curie 和 Davinci,在来自我们最具挑战性的研究数据集之一小学数学问题的 8,000 个示例上进行了微调。我们比较了创建 10 个完成时模型解决问题的能力。

自定义 GPT-3 可提高输出的可靠性,提供更一致的结果,您可以在生产用例中使用这些结果。一位客户发现,定制 GPT-3 可将不可靠输出的频率从 17% 降低到 5%。由于 GPT-3 的自定义版本是为您的应用程序量身定制的,因此提示可以更短,从而降低成本并改善延迟。

无论是文本生成、摘要、分类,还是 GPT-3 能够执行的任何其他自然语言任务,自定义 GPT-3 都将提高性能。

由定制版 GPT-3 提供支持的应用

具有后定制 GPT-3 的 Keeper Tax 移动界面

Keeper Tax 帮助独立承包商和自由职业者纳税。在客户链接他们的财务账户后,Keeper Tax 使用各种模型来提取文本并对交易进行分类。使用分类数据,Keeper Tax 可以识别容易遗漏的税务注销,并帮助客户直接从应用程序中报税。通过定制 GPT-3,Keeper Tax 能够不断改进结果。Keeper Tax 每周添加一次大约 500 个新的训练示例来微调他们的模型,这导致每周准确率提高约 1%,准确率从 85% 提高到 93%。

具有后定制 GPT-3 的可行 Web 界面

Viable 帮助公司从客户反馈中获得洞察力。通过定制 GPT-3,Viable 能够将大量非结构化数据转换为可读的自然语言报告,突出显示最重要的客户投诉、赞美、请求和问题。定制 GPT-3 提高了 Viable 报告的可靠性。通过使用定制版的 GPT-3,总结客户反馈的准确率从 66% 提高到 90%。结果是客户在做出产品决策时需要的有形、直观的信息。

Sana Labs 网络界面,带有后定制的 GPT-3

Sana Labs 是人工智能学习开发和应用的全球领导者。Sana 学习平台利用最新的 ML 突破为每个人定制内容,为企业提供个性化学习体验。通过使用他们的数据定制 GPT-3,Sana 的问题和内容生成从语法正确但一般的回答到高度准确的输出。这产生了 60% 的改进,从根本上为他们的学习者提供了更加个性化和有效的体验。

发布自定义 Gpt3 引出

Elicit 是一个 AI 研究助手,可以帮助人们使用学术论文的发现直接回答研究问题。该工具从大量研究论文中找到最相关的摘要,然后应用定制版本的 GPT-3 生成论文对问题的声明(如果有的话)。GPT-3 的自定义版本在三个重要指标上优于提示设计:结果更易于理解(改进 24%)、更准确(改进 17%)和整体更好(改进 33%)。

今天,所有 API 客户都可以自定义 GPT-3。注册并开始使用 微调文档

如何为您的应用程序定制 GPT-3

设置

从终端安装基于 openai python 的客户端:

pip install --upgrade openai

将您的 API 密钥设置为环境变量:

export OPENAI_API_KEY=<api_key>

训练自定义模型

在演示数据集上微调 Ada 模型,以将帮助消息从西班牙语翻译成英语。

openai api fine_tunes.create -m ada --n_epochs 2 \
    -t https://cdn.openai.com/API/train-demo.jsonl

使用自定义模型

要求您的定制模型进行翻译。

openai api completions.create -m <model_ID> \
  --max-tokens 30 --temperature 0 --stop ”###” \
  -p $'Conecte la PS3 y vaya a Configuración>Configuraciones de Red, seleccione la red y escriba sus credenciales.\nEnglish translation:'