作者|李欣帅邮箱| lixinshuai@pingwest.com
8月23日,OpenAI宣布推出基于GPT-3.5 Turbo的恐吓功能并更新API,让企业、开发人员能够使用自身的数据定制ChatGPT。调优(Fine-tuning)是一种利用已有的通用语言模型(如GPT-3.5)来训练一个特定模型的方法。通用语言模型虽然具有简短的语言理解和生成能力,但它们并不是针对特定的领域或任务。通过在自己的数据上对通用模型可以进行仿真优化,训练一个特定的模型,可以更好地适应特定的使用场景。在保留通用语言模型增强能力的同时,进一步提高模型的准确度等效果和效率。这就相当于在一个已经建好的房子上进行装修,从而更符合自己的需求和喜好,而不是从头开始建造一座新房子。因此,可以节省大量的时间和资源,也避免了一些技术问题。OpenAI此次推出的驱动功能,使更多开发者能够参与到GPT模型应用场景中,并深入实现了更多个性化和创新的应用场景,提高用户体验和粘性,这对开发者生态的建立也起到了积极的助推作用。同时也极大地拓展了通用模型的应用范围和潜力,加快了各行各业部署AI技术的策略。对于此次中提到的GPT-3.5 Turbo的安全性、使用效果、价格、未来更新、部署步骤等方面,重点说明如下。安全性:从配置API发送的数据归客户所有,OpenAI或任何其他组织不会使用数据来模型。同时,为了部署模型的安全,Op保障enAI通过审核API和GPT-4驱动的审核系统,检测与安全标准冲突的危害数据。(这样做有利于为用户提供更多个性化的服务,但也降低了技术比重,可能导致不负责任的使用)倾向效果:在实际测试过程中,GPT-3.5 Turbo的吨位版本在某些任务上,与基本型号的GPT-4能力相当甚至要更好。霸客户能够提高常见的模型性能,并持续提示时间。通过对模型本身的指令进行化妆,加速API调用并降低成本,提示词数量减少了90%。价格和令牌: GPT-3.5 Turbo的吨成本分为最终成本训练和使用两个部分。一个包含100K令牌训练文件的模型工作,预计成本为2.4美元。具体来说:
训练:$0.008 / 1K 代币; 使用输入:$0.012 / 1K 代币; 使用产出:$0.016 / 1K 代币。
训练:$0.008 / 1K 代币;
使用输入:$0.012 / 1K 代币;
使用产出:$0.016 / 1K 代币。
可处理的上下文为 4K 代币,是张力模型的倍数。张力步骤:只需经过准备数据、上传文件、创建张力模型步。一旦模型完成张力过程,就立即可以在生产中使用。未来更新: GPT-4 的预计将于秋季,而秋季将会推出对 GPT-3.5 函数调用和 16k 周边的后续支持。不久的将来即将推出张力模型 UI,可以更轻松地访问即将进行的张力模型作业等相关信息。GPT -3 更新: OpenAI目前正在提供babbage-002和davinci-002模型作为GPT-3基础模型或舵模型。最初的GPT-3基础模型(ada、babbage、curie、davinci)将于2024年1月4日关闭。总结来说,通过开放先进大模型的驱动功能,OpenAI能够吸引更多企业和开发者使用其平台和模型,从而扩容这有助于AI产品获得更广泛应用,推动大模型落地。同时,此次功能更新,也可进一步是对元开源模型并允许等外部竞争的一个目标举措。通过允许模型,OpenAI可以进一步扩大和巩固用户基础,确保自身加速在行业的领先。这或许可能会带动其他企业加速商业化步伐,行业竞争力进一步提升。
以下为OpenAI公告全文:
GPT-3.5 Turbo 的即将推出,GPT-4 将于今年秋天推出。此更新使开发人员能够更适合其示例的模型,并大规模运行这些自定义模型。早期的测试表明,GPT-3.5 Turbo 的版本可以在某些垂直的任务上与基础上的 GPT-4 功能相当,甚至要更好。与我们所有的 API 一样,从今晚 API 发送的数据归客户端,并且所有都使用 OpenAI 或任何组织来训练其他模型。 GPT-3.5涡轮 发布以来,开发人员和企业要求能够自定义模型,以便方便用户创造独特且差异化的体验。通过此次发布,开发人员现在可以监督运行参数,使该模型在其示例中表现得更好。在我们的私人测试版本中,自定义客户已经能够有效地提高常见示例的模型性能,举例来说:改进的可编写性:允许企业使模型更好地遵循指令,例如使简洁输出或始终以给定的语言响应。例如,开发人员可以使用参数来确保模型始终按要求以德语响应。可靠的输出格式:可提高模型一致响应的能力,这对于需要特定的响应格式(例如代码完成或编写) API )的应用程序说法调用关键。开发人员可以使用压力来更可靠地引导用户转换提示为可与自己的系统一起使用的高质量方法 JSON 代码段。自定义风格:压力是磨磨模型练习输出定性感觉的好,具有可识别品牌风格的企业可以使用伫来使模型交换基调更加一致。另外提高性能外,还可以使企业能够缩短提示时间,同时确保类似的性能。使用 GPT-3.5-Turbo 进行也可以处理 4K令牌——是我们之前配置模型的两倍。早期的测试人员通过将指令配置到模型本身,加快了每次 API 调用并降低成本,将提示大小减少了多达90%。当与其他技术提示如工程、信息搜索和函数调用相结合时,调节的效果是最强大的。对方面若想了解更多可查看我们的调节指南。另外,对函数调用和GPT-3.5-turbo-16k的适配器支持将在今年秋季进行。适配器步骤我们将在不久的将来启动UI,这让开发人员更容易访问演习作业、已完成的模型快照等相关信息。安全对我们来说,安全地配置配置是非常重要的。为了在演习过程中保留默认模型的安全功能,演习数据将通过我们的审核API和GPT-4支持的审核系统,检测与我们的安全标准冲突的不安全数据。定价分成两类:初始训练成本和使用成本。训练:$0.008 / 1K代币;使用输入:$0.012 / 1K 代币;使用输出:$0.016 / 1K 代币。例如,用 100,000 个代币进行扭矩工作,预计成本为 2.40 美元。今年 7 月更新 GPT-3 型号,我们宣布原始 GPT-3 基本型号将于 2024 年 1 月 4 日关闭。今天,我们正在制造这些模型的替代品,无论是作为基本模型还是升级模型。这些模型可以使用我们新的 API 接口进行升级。基本和升级的 GPT-3 型号的型号如下:
新的端点提供了分页和更多的可扩展性,以支持帐户API的未来发展,接口到更新的端点也非常简单,更多详细信息可参见我们的帐户指南。
*更多详细内容可参考OpenAI官网:
https://openai.com/blog/gpt-3-5-turbo-fine-tuning-and-api-updates
邮件:siyushenqi@gmail.com
工作时间:周一至周五,9:30-18:30,节假日休息