跳动百科

360智脑团队成功复现Deepseek强化学习效果,发布开源模型Light-R1-14B-DS

应娅鸿   来源:网易

近日,360智脑团队宣布成功复现了Deepseek大语言模型的强化学习效果,并正式发布了开源模型Light-R1-14B-DS。这一成果标志着国产AI技术在大模型领域迈出了重要一步。

Light-R1-14B-DS是一款参数量为140亿的大规模语言模型,基于深度学习框架PyTorch开发。该模型通过引入Deepseek的核心技术与优化策略,在对话理解、代码生成、多语言支持等方面表现出色。此外,它还具备强大的上下文记忆能力,能够处理复杂的长文本任务,满足多样化的应用场景需求。

360智脑团队表示,此次发布的Light-R1-14B-DS不仅实现了对国外领先技术的有效追赶,更体现了中国企业在人工智能领域的创新能力。未来,团队将继续深耕大模型领域,推动更多高质量的开源项目落地,助力行业生态繁荣发展。

值得一提的是,Light-R1-14B-DS的开源意味着开发者可以自由下载使用并进行二次开发,这将极大降低中小企业和个人开发者进入大模型领域的门槛,促进技术创新和应用普及。同时,这也为中国乃至全球的开源社区贡献了一份力量。