漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-11 talkingdev

Meta发布新一代AI加速芯片,专注芯片内存与吞吐量提升

Meta公司近日宣布了其人工智能加速器芯片的下一代产品。该芯片的研发重点集中在芯片内存和吞吐量上,采用了128GB的5nm内存和11 TFLOPs的int8吞吐量。这一进步意味着Meta在AI硬件领域的竞争力得到了显著增强。新一代A...

Read More
2024-04-11 talkingdev

英伟达推出特殊奖励,员工股票奖励增加25%

英伟达近日宣布,公司将为员工提供一项名为“Jensen特别奖励”的福利,该奖励计划将使员工的股票奖励总额增加25%。此举旨在激励员工,提高团队的凝聚力和工作效率。该奖励计划将在四年内逐步兑现,首批奖励将于今年九...

Read More
2024-04-10 talkingdev

使用Colab在H100上训练超过20万上下文窗口的新梯度累积卸载技术

Longcontext Alpaca训练技术最近取得了重大突破,通过在H100硬件上使用新的梯度累积卸载技术,成功训练了超过200,000个上下文窗口。这种创新方法使得大规模深度学习模型的训练变得更加高效,显著提高了计算资源的利...

Read More
2024-04-10 talkingdev

英特尔发布Gaudi 3 AI处理器,性能超越英伟达H100

英特尔公司近日宣布推出新一代Gaudi 3 AI处理器,该处理器在性能上实现了重大突破。据官方数据显示,Gaudi 3在训练性能上提升高达1.7倍,推理性能提升50%,同时在效率上也比英伟达的H100处理器高出40%,而成本却更低...

Read More
2024-04-10 talkingdev

Chemistry Bench:针对语言模型的化学问题测试基准

近日,GitHub上发布了一项新的基准测试工具——化学工作台(Chemistry Bench),旨在评估大型语言模型在处理化学问题方面的能力。该工具与Big-Bench兼容,能够对语言模型的科学素养进行有效衡量。化学工作台通过一系列...

Read More
2024-04-10 talkingdev

Meta即将发布全新大型语言模型Llama 3

Meta公司近日确认,其最新一代大型语言模型Llama 3将于下月推出。Llama 3是Meta为其生成式人工智能助手而开发的先进技术,旨在提供更加精准、自然的对话体验。该模型经过深入的优化和升级,预计将为用户带来更加丰富...

Read More
2024-04-10 talkingdev

谷歌Gemma扩展模型提升性能与效率

谷歌近期成功训练了一套名为Gemma的代码模型和循环Gemma模型。这些新模型展现出了与现有技术相媲美的性能,并且已经集成了FIM(查找插入记忆)功能。值得注意的是,循环Gemma模型在运行速度和内存效率方面都有显著提...

Read More
2024-04-10 talkingdev

Automattic收购Beeper,重塑消息传递未来

Beeper,一家曾尝试为Android用户推出使用iMessage的应用程序的公司,近日被WordPress的所有者Automattic收购。根据协议,Beeper将其消息应用程序对所有平台用户开放,该应用程序旨在将所有消息服务整合到一个收件箱...

Read More
  1. Prev Page
  2. 60
  3. 61
  4. 62
  5. Next Page