漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-09-26 talkingdev

Llama 3.2:开创边缘AI与视觉革新之路

Llama 3.2 是一款全新的开源可定制模型,旨在推动边缘AI和计算机视觉的发展。该模型的设计能够灵活适应多种应用场景,从智能监控到无人驾驶汽车,Llama 3.2 提供了强大的支持。其核心优势在于可定制性,使开发者能够...

Read More
2024-05-29 talkingdev

深度学习框架Tinygrad 0.9.0正式发布

深度学习框架Tinygrad 0.9.0正式发布。Tinygrad是一个轻量级的深度学习框架,支持Python和JavaScript。Tinygrad 0.9.0增加了对自定义函数的支持,以及其他一些性能和稳定性的改进。它的设计使其非常适合在边缘设备上...

Read More
2024-05-01 talkingdev

Meta发布ExecuTorch框架,为边缘设备上的LLM提供支持

Meta发布了一款名为ExecuTorch的框架,这是一个后训练量化工具包,能够支持在各种iPhone和Galaxy设备上运行Llama模型。该框架能够在运行7B大小语言模型的手机上,每秒获取多达11个令牌。ExecuTorch框架的发布,进一...

Read More
2024-04-30 talkingdev

Moondream 2模型驱动的llamafile全功能VLM可执行文件

Moondream 2模型作为一种高效的AI模型,其性能强大且体积小巧,现已发布其全功能的VLM可执行文件,名为llamafile。这款全功能的VLM可执行文件是一种完全自包含的程序,可以在边缘设备上运行。这意味着,即使在没有网...

Read More
2024-01-09 talkingdev

AI现状及2024年预测

本文分享了关于AI现状的思考,以及对该技术发展方向的一些预测。文章主要关注AI模型的产品、市场和人才现状,而并未涉及AI架构和基础设施的技术细节。今年,开源模型将赶上专有模型,并帮助推动边缘设备的推理。

Read More
2023-12-18 talkingdev

Nous Research发布新的多模态模型

Nous Research (Hugging Face Hub)发布了一种名为Capybara的新的语言基础模型和Obsidian的多模态扩展模型,该模型拥有30亿参数,可以在手机等边缘设备上运行。

Read More
2023-10-18 talkingdev

PyTorch团队推出轻量级runtime,支持在边缘设备上运行

近日,PyTorch团队推出了一款新的轻量级运行时和模型转换工具,以支持在资源受限的边缘设备上运行。此次推出的PyTorch Lite运行时,具有轻量级、高效、低延迟等特点,可以在边缘设备上运行深度学习模型,解决传统云...

Read More
2023-10-12 talkingdev

开源系统OpenLLMetry:基于OpenTelemetry的LLM观测性能分析

近日,由一群开发者共同开发的开源系统OpenLLMetry正式发布。OpenLLMetry基于OpenTelemetry,旨在提供对LLMs的观测性能分析。LLMs是轻量级的微服务,可以在边缘设备上运行,OpenLLMetry的发布将为开发人员提供更好的...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page