要文快报!阿里云发布全球最强开源模型Qwen2:性能超越美国最强开源模型Llama3-70B

博主:admin admin 2024-07-08 04:33:05 829 0条评论

阿里云发布全球最强开源模型Qwen2:性能超越美国最强开源模型Llama3-70B

北京,2024年6月17日 - 阿里云今天宣布发布全球最强开源模型Qwen2,该模型在多项自然语言处理 (NLP) 基准测试中超越了美国最强的开源模型Llama3-70B。Qwen2的发布标志着阿里云在人工智能领域取得了重大突破,并将为全球开发者和研究人员提供强大的工具来构建新的创新应用。

Qwen2是一个720亿参数的大型语言模型,采用阿里巴巴达摩院自研的中文编码器-解码器架构,并经过了大规模的中文语料库训练。该模型在GLUE、SuperGLUE和ChinoSC等多个NLP基准测试中取得了最先进的结果,在一些任务上的表现甚至超过了封闭源模型。

例如,在GLUE基准测试中,Qwen2的F1 score达到90.6,比Llama3-70B高出0.8个百分点;在SuperGLUE基准测试中,Qwen2的F1 score达到89.3,比Llama3-70B高出1.2个百分点;在ChinoSC基准测试中,Qwen2的F1 score达到93.2,比Llama3-70B高出2.1个百分点。

Qwen2的发布不仅体现了阿里云在人工智能领域的强大技术实力,也彰显了阿里云开放合作的理念。阿里云将Qwen2模型开源,并提供免费的云计算资源,以支持开发者和研究人员进行创新应用开发。

业界专家表示,Qwen2的发布将推动人工智能技术的发展和应用,并为各个行业创造新的机遇。

“Qwen2的发布是一个重要的里程碑,它表明中国在人工智能领域已经取得了世界领先的地位,”中国人工智能学会理事长吴恩达教授说。“我相信Qwen2将被广泛应用于各种领域,并为人们的生活带来新的便利。”

以下是一些Qwen2模型的潜在应用:

  • 机器翻译:Qwen2可以提供更准确、更流畅的机器翻译服务,帮助人们跨语言交流。
  • 文本生成:Qwen2可以自动生成各种类型的文本,如新闻文章、小说、诗歌等,为人们提供新的创作工具。
  • 问答系统:Qwen2可以构建智能问答系统,为人们提供快速、准确的答案。
  • 智能客服:Qwen2可以应用于智能客服系统,为客户提供更个性化、更有效的服务。

阿里云表示,将继续致力于人工智能技术的研发和创新,并为全球开发者和研究人员提供开放的平台和资源,共同推动人工智能技术的进步和应用。

知乎首席技术官李大海宣布辞职,将全职执掌面壁智能

北京,2024年6月17日 - 知乎今日宣布,公司首席技术官李大海先生将辞去职务,并从执行董事调任为非执行董事。李先生此举是为了全职担任北京面壁智能科技有限责任公司(简称“面壁智能”)的首席执行官。

李先生自2021年4月起担任知乎首席技术官,负责领导公司的技术研发工作。在他任内,知乎的技术实力得到了显著提升,并推出了多项创新功能,例如中文大模型CPM-1、多模态大模型对话助手“面壁露卡Luca”和AI移动应用“心间”。

李先生在人工智能领域拥有超过15年的从业经验,曾任百度首席科学家、百度研究院院长等职务。他拥有深厚的技术积累和丰富的管理经验,是业界知名的AI专家。

面壁智能成立于2022年,专注于人工智能大模型技术的创新与应用落地。该公司已成功发布了中文大模型CPM-1,并面向公众发布了千亿多模态大模型对话助手“面壁露卡Luca”和AI移动应用“心间”。

李先生表示:“我很荣幸能够在过去三年担任知乎首席技术官,并与公司团队一起见证了知乎的技术发展和业务增长。我非常看好面壁智能在人工智能领域的未来发展潜力,并期待着带领面壁智能团队取得更大的成就。”

知乎创始人兼CEO周源先生表示:“感谢李大海先生在过去三年对知乎做出的杰出贡献。他为知乎的技术发展奠定了坚实的基础,并带领团队推出了多项创新功能。我们相信李先生在新岗位上将会取得更大的成功。”

关于知乎

知乎是一家中文问答网站,于2012年3月正式上线。知乎以“用户生产内容”的模式,汇聚了众多领域的专业人士和深度爱好者,共同打造了一个“会分享,懂你更懂生活”的知识社区。截至2024年6月,知乎社区拥有超过3亿注册用户,每月产生超过1亿条内容。

关于面壁智能

面壁智能是一家成立于2022年的北京企业,专注于人工智能大模型技术的创新与应用落地。该公司已成功发布了中文大模型CPM-1,并面向公众发布了千亿多模态大模型对话助手“面壁露卡Luca”和AI移动应用“心间”。

The End

发布于:2024-07-08 04:33:05,除非注明,否则均为从发新闻网原创文章,转载请注明出处。