漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-15 talkingdev

Meta如何优化广告推理服务以提高尾部利用率

近日,Meta在其机器学习推理服务的尾部利用率方面进行了优化,这些优化使得失败率减少了三分之二,计算效率提高了35%,并将p99延迟减半。这些增强功能确保Meta的广告投放系统可以在不需要额外资源的情况下处理增加的...

Read More
2024-07-12 talkingdev

AiEditor开源:AI驱动的富文本编辑器发布

近日,一款名为AiEditor的全新产品正式发布。这是一款开源的AI驱动的富文本编辑器。它的出现将极大地改变文本编辑的方式,使用者可以利用它进行更高效、更精确的编辑工作。AI的加入使得这款富文本编辑器具有了前所未...

Read More
2024-07-12 talkingdev

FlashAttention 3:现代快速语言模型的基础升级

FlashAttention是现代快速语言模型的基础,而最新的FlashAttention 3版本则是其重要的升级。与以前的版本相比,新版本使用了75%的H100容量(相比之前的35%有了显著的提升)。这次的能力提升归因于一系列重要的系统改...

Read More
2024-07-10 talkingdev

深度了解Tinygrad:AI编译器的全新引领者

Tinygrad是一款用于训练深度学习模型的工具包。这套笔记是AI编译器的极佳入门读物,更是为深入了解Tinygrad内部机制做好准备。Tinygrad以其精简的设计和高效的性能,为AI领域带来了新的可能性。无论你是AI领域的专家...

Read More
2024-07-10 talkingdev

MobileLLM:专为移动设备优化的超千万参数语言模型

MobileLLM 是一款新的技术工具,专为设备使用情景优化具有数亿参数的语言模型。这款工具的出现,将大大提高设备上语言模型的效率和性能。其优化能力强大,可以处理具有高达数十亿参数的语言模型,这对于需要在设备上...

Read More
2024-07-10 talkingdev

论文:将系统2精炼为系统1:COT新思维链模型提升计算和推理效率

系统2模型是一种使用类似于思维链的方法,通过更多的测试时间计算来提升推理的模型。最新的研究发现,我们可以将这种行为提炼为一个系统1模型,使其运行速度更快,而准确性相似。系统1模型的主要优势在于其高效的运...

Read More
2024-07-09 talkingdev

Doti:AI驱动的健康生活管理助手新品发布

Doti,一款由人工智能驱动的健康生活管理助手,近日正式发布。Doti的主要功能在于协助用户有效管理其健康和生活目标。通过使用先进的AI技术,Doti能深度学习用户的生活习惯和健康状况,然后提供个性化的建议和解决方...

Read More
2024-07-09 talkingdev

EleutherAI发布训练的SAE和Llama 3 8B的权重和库代码

EleutherAI已为Llama 3 8B训练出新的SAEs,并发布了它们的权重和库代码。这一突破性的技术进步显示出EleutherAI对于研发和推动技术进步的强大能力。SAE的训练和优化是一项复杂的任务,需要大量的知识和专业技能。Ele...

Read More
  1. Prev Page
  2. 78
  3. 79
  4. 80
  5. Next Page