漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-18 talkingdev

xAI公开发布Grok-1模型权重与架构

人工智能领域的领先企业xAI近日宣布,已将其拥有3140亿参数的Mixture-of-Experts模型——Grok-1的权重和架构公开。Grok-1采用JAX编写,并融入了现代Transformer架构,包括GeGLU、ROPE、三明治范数等先进技术。此次公开...

Read More
2024-03-13 talkingdev

Meta建设GenAI基础设施

本文介绍了Meta的两个版本的24,576 GPU数据中心规模集群的详细信息。这些集群支持公司当前和下一代AI模型以及GenAI和其他领域的AI研究和开发。Meta的长期愿景是建立一种人工智能,这种人工智能是开放的,建立在可负...

Read More
2024-03-06 talkingdev

如何成为AI研究实习生?

本文为您提供AI研究实习生的招聘流程。文章提供了编码和研究类型问题的有用准备信息。

Read More
2024-02-09 talkingdev

人工智能的商业化之路

近期,人工智能研究的重点从单纯的准确性和广度转向了效率和深度。英伟达的H100销售和AI能源的不断增长凸显了该行业的规模。投资要求盈利,将研究重点转向了像Phi 2这样更小、更高效的模型,并强调从模型架构到部署...

Read More
2024-01-22 talkingdev

OpenAI公布新团队:整合公众意见为其AI模型搭建‘众包’治理机制

人工智能公司OpenAI宣布组建新的“集体协调”团队,将公共意见整合到其AI模型中。该团队将与OpenAI的研究员和工程师合作,以确保其模型符合公众利益。OpenAI表示,他们希望能够通过这种方式为AI研究和应用建立一种“众...

Read More
2024-01-01 talkingdev

苹果发布最新AI研究成果:或将彻底改变iPhone

苹果公司近日发布了两篇论文,介绍了新的三维头像和高效语言模型推断技术。这些技术的引入或将允许人工智能系统在iPhone和iPad上运行,极大提高智能设备的性能和用户体验。苹果的新技术为三维头像的生成提供了更为高...

Read More
2023-12-25 talkingdev

苹果最新AI研究或将完全改变您的iPhone

苹果公司发布了两篇论文,介绍了新的三维头像和高效语言模型推理技术,这些技术可以让AI系统在iPhone和iPad上运行。这些技术的引入将使iPhone和iPad变得更加智能,更加个性化。这意味着用户可以在他们的设备上运行更...

Read More
2023-12-12 talkingdev

StripedHyena模型:新AI模型让上下文长度变更长

近来,Transformer模型在AI领域占据统治地位。它们是强大的序列学习器,但也存在一些缺点。这项新工作基于状态空间模型,展示了新的架构可以带来巨大的好处,如增加上下文长度。

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page