漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-10 talkingdev

使用Colab在H100上训练超过20万上下文窗口的新梯度累积卸载技术

Longcontext Alpaca训练技术最近取得了重大突破,通过在H100硬件上使用新的梯度累积卸载技术,成功训练了超过200,000个上下文窗口。这种创新方法使得大规模深度学习模型的训练变得更加高效,显著提高了计算资源的利...

Read More
2024-04-10 talkingdev

英特尔发布Gaudi 3 AI处理器,性能超越英伟达H100

英特尔公司近日宣布推出新一代Gaudi 3 AI处理器,该处理器在性能上实现了重大突破。据官方数据显示,Gaudi 3在训练性能上提升高达1.7倍,推理性能提升50%,同时在效率上也比英伟达的H100处理器高出40%,而成本却更低...

Read More
2024-04-10 talkingdev

Chronon平台发布:简化AI/ML项目数据处理与服务

Chronon是一个全新的平台,旨在帮助组织轻松推进AI/ML项目,无需关注复杂的数据计算和服务编排问题。该平台通过抽象化处理,能够执行批处理和流计算、可伸缩的回填、低延迟服务等功能,从而最大化组织内部数据的利用...

Read More
2024-04-08 talkingdev

Qwen团队发布32B参数模型,实现强大性能并适应中等内存系统

Qwen团队最新力作——一个具备32B参数的AI模型,现已成功训练并对外发布。该模型在各类任务中展现出卓越的性能表现,同时其设计考虑到了内存的局限性,能够适配更为普遍的中等内存硬件系统。这意味着,即便是在资源有...

Read More
2024-04-08 talkingdev

Groq CEO宣布公司转型:不再销售硬件,全面拥抱AI云服务

近日,Groq公司的首席执行官宣布了一个重大战略转变,Groq将不再从事硬件销售业务,转而专注于提供AI云服务。这家曾以高性能硬件著称的科技公司,现在将精力集中在云计算和人工智能领域,旨在为客户提供更加先进的数...

Read More
2024-04-08 talkingdev

特斯拉将于8月8日发布新一代自动驾驶“机器人出租车”

特斯拉计划在8月8日公布其新一代自动驾驶‘机器人出租车’车型。这一公告似乎加快了机器人出租车项目的进度,该项目旨在为无人驾驶共享出行量身打造一款全新车型。一些特斯拉车主对该项目表示担忧,因为这意味着特斯拉...

Read More
2024-04-05 talkingdev

Lambda宣布5亿美元GPU云服务扩张计划

Lambda公司近日宣布,已获得5亿美元的特别债务融资,用于扩大其GPU云服务。此前,Lambda在年初已经完成了2.3亿美元的C轮融资。该扩张计划预计将进一步增强Lambda在GPU云计算市场的影响力,为客户提供更加强大的计算...

Read More
2024-04-04 talkingdev

AI基础设施解析:支撑人工智能发展的关键技术

AI基础设施是部署和扩展AI技术的基础,它由GPU、专业软件和云服务构成。GPU作为AI计算的核心,提供了强大的并行处理能力,使得机器学习和深度学习算法得以高效运行。专业软件则为AI开发提供了必要的工具和库,简化了...

Read More
2024-04-03 talkingdev

AutoQuant 笔记本:将 HuggingFace 模型转换为五种不同的量化格式

AutoQuant 笔记本是一个新的工具,它可以将 HuggingFace 上的模型导出为五种不同的量化格式,包括 GGUF、GPTQ、EXL2、AWQ 和 HQQ。这些量化格式旨在优化模型的性能和效率,以便在不同的硬件和平台上部署。通过使用 A...

Read More
2024-04-01 talkingdev

微软与OpenAI合作打造价值千亿美元的超级计算机

据报道,微软和OpenAI正在计划合作建立一个联合数据中心项目,该项目的总投资可能达到1000亿美元,旨在到2028年推出一款名为“星际之门”的巨型AI超级计算机。这一举措将进一步推动人工智能领域的发展,并可能改变云计...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page