OpenAI 内容审核工具
为了帮助开发人员保护他们的应用程序免受可能的滥用,我们引入了更快、更准确的 审核端点。该端点为 OpenAI API 开发人员提供了免费访问 基于 GPT 的分类器的权限,这些分类器可以检测不需要的内容——这是使用 AI 系统 协助人工监督这些系统 的一个实例 。我们还发布了 描述我们的方法和 用于评估的数据集的技术论文。
当输入文本时,Moderation 端点会评估内容是色情的、仇恨的、暴力的,还是宣扬自残的内容——我们的 内容政策禁止的内容。该端点经过培训,可以快速、准确并在一系列应用程序中稳健运行。重要的是,这减少了产品“说”错话的可能性,即使是在大规模部署给用户时也是如此。因此,人工智能可以在教育等敏感环境中发挥优势,否则无法放心使用它。
输入文本
暴力
自我伤害
恨
性的审核端点 标记的
Moderation 端点可帮助开发人员从我们的基础设施投资中获益。与其构建和维护自己的分类器——正如我们在论文中记录的那样,这是一个广泛的过程 ——他们可以通过单个 API 调用访问准确的分类器。
作为 OpenAI 致力于使 AI 生态系统更安全的承诺的一部分 , 我们提供此端点以允许免费审核所有 OpenAI API 生成的内容。例如, OpenAI API 客户Inworld使用 Moderation 端点来帮助他们基于 AI 的虚拟角色保持适合他们的受众。通过利用 OpenAI 的技术,Inworld 可以专注于他们的核心产品:创造令人难忘的角色。我们目前不支持监测第三方流量。