微软宣布开源 DeepSpeedChat:人人都能拥有自己的 ChatGPT


(资料图片)

编程客栈() 4月13日消息:微软日前宣布开源 Deep Speed Chat,(https://github.com/microsoft/DeepSpeed)可帮助用户轻松训练类 ChatGPT 等大语言模型。

据介绍,Deep Speed Chat 基于微软 Deep Speed 深度学习优化库开发,具备训练、强化推理等功能,使用 RLHF(人工反馈机制的强化学习)技术,可将训练速度提升 15 倍以上,并大幅降低成本。例如,一个 130 亿参数的类 ChatGPT 模型,只需 1.25 小时就能完成训练。

Deep Speed Chat 是一款能够解决训练类 ChatGPT 模型的资源和算法难题的技术,它能够轻松、高效的训练数千亿参数的最先进的类 ChatGPT 模型。使用 Deep SpVXOgngVAnMeed 编程客栈Chat,用户只需一个脚本即可实现多个训练步骤,包括使用 Huggingface 预训练的模型、使用 DeepSpeed-RLHF 系统运行 InstructGPT 训练的所有三个步骤,生成属于自己的类 ChatGPT 模型。

此外,Deep Speed Chat 还提供了一个易于使用的推理 API,用于在模型训练后测试对话性能。Deep Speed Chat 具有强化推理、RLHF 模块、RLHF 系统三大核心功能,能够支持训练拥有数千亿参数的模型,并在多节点多 GPU 系统上展现出卓越的扩展性。

Deep Speed Chat 在成本、效率、扩展性等方面非常优秀,在 Azure 云上只需花费不到 3VXOgngVAnM00 美元和 600 美元即可完成对 OPT-13B 模型和 OPT-30B 模型的训练。

微软此次开源 Deep Speed Chat 对整个 ChatGPT 生态发展起到了至关重要的推动作用,简单来说,用户通过 Deep Speed Chat 能以最短的时间、最高效的成本训练类 ChatGPT 大语言模型,这标志着一个人手一个 ChatGPT 的时代要来了。

推荐DIY文章
颜选生活家 | 掌上明珠家居5折购整家,送厨送门抽沙发!
森海塞尔真无线耳机诞生15周年,回溯时光聆听未来
电动牙刷冲牙器 这些洗手间必备|环球速读
预算充足!1-2万元电视怎么选?
桂花网蓝牙物联网在医疗健康领域迎来快速上升期
驰骋川藏天险,爱玛亮剑砺锋芒
精彩新闻

超前放送