据微软称,DeepSpeed Chat是一种新的开源解决方案,旨在为开发人员提供更实惠,更轻松的对话式AI访问。它基于微软开发的DeepSpeed优化库,用于训练MT-530B和BLOOM等大规模语言模型。
DeepSpeed Chat使用了一种称为人类反馈强化学习(RLHF)的新训练技术,该技术首次在InstructGPT论文中引入。RLHF允许模型从人类反馈中学习,并随着时间的推移提高其会话技能。该工具还支持数据混合,使模型能够从多个数据源学习并生成不同的响应。
微软指出,DeepSpeed Chat能够在一个GPU上训练多达13亿个参数,或者在利用Azure云时以300美元的价格训练。该工具还支持使用DeepSpeed的内存优化策略(如ZeRO和LoRA)的数千亿个参数的大型模型。
该解决方案的其他优势包括,与最先进的方法相比,吞吐量提高了 15 倍,同时还支持在相同硬件上最大 7.5 倍的模型大小。开发人员还可以访问训练模型和界面,该模型和界面提供简单的功能来帮助构建 ChatGPT 风格的 AI 模型。
例如,DeepSpeed Chat可以使用预先训练的Huggingface模型,并通过DeepSpeed-RLHF将其通过InstructGPT。这将生成自定义对话 AI。
尽管关注日益增加,但仍持续发展
微软正在全力推进其人工智能开发,尽管最近对ChatGPT等大型语言模型进行了抵制。昨天我报道了美国财政部寻求制定监管人工智能的法规和法律。此举是在意大利已经阻止ChatGPT之后,德国正在探索这样做。
意大利数据保护局已下令OpenAI停止在该国提供聊天机器人。据报道,德国也在考虑禁止ChatGPT,其他国家很可能会效仿。OpenAI联合创始人埃隆·马斯克(Elon Musk)也在领导FutureOfLife计划,该项目希望对人工智能开发进行更多控制,而不是对通用人工智能(AGI)出现的担忧。
该组织还包括苹果联合创始人史蒂夫·沃兹尼亚克(Steve Wozniak),他们写了一封公开信,呼吁停止人工智能开发六个月。