漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-16 talkingdev

SqueezeTime-移动视频理解的新进展

SqueezeTime是一款为移动视频理解设计的轻量级网络,其独特之处在于,它能够将视频的时间轴压缩到频道维度中,从而增强了时间分析的能力。SqueezeTime网络的设计理念是,通过压缩时间轴,可以在不牺牲视频内容质量的...

Read More
2024-05-01 talkingdev

Meta发布ExecuTorch框架,为边缘设备上的LLM提供支持

Meta发布了一款名为ExecuTorch的框架,这是一个后训练量化工具包,能够支持在各种iPhone和Galaxy设备上运行Llama模型。该框架能够在运行7B大小语言模型的手机上,每秒获取多达11个令牌。ExecuTorch框架的发布,进一...

Read More
2024-04-27 talkingdev

SVG Viewer——查看、编辑和优化SVG

近日,一个名为SVG Viewer的全新工具正式上线。该工具能够帮助用户更好地查看、编辑和优化SVG文件。SVG是一种基于XML的图形格式,可用于创建浏览器和移动设备中使用的矢量图形。它是一种非常流行的格式,因为它可以...

Read More
2024-04-10 talkingdev

苹果新AI模型助力Siri理解iOS应用界面

苹果公司开发了一款名为Ferret-UI的多模态大型语言模型(LLM),该模型具备理解移动设备用户界面的能力,有望让Siri更有效地理解并与屏幕上的元素进行互动。Ferret-UI的出现预示着Siri将能够更加直观地与iOS应用进行...

Read More
2024-04-05 talkingdev

前Snap AI主管推出Diffuse,挑战OpenAI的Sora视频生成器

由前Snap高管Alex Mashrabov创立的Higgsfield AI公司,最近推出了Diffuse,这是一款面向创作者和社交媒体市场营销人员的移动优先AI视频创作和编辑应用程序。Diffuse的推出,直接挑战了OpenAI的Sora视频生成器。与Sor...

Read More
2024-04-03 talkingdev

3D + 2D: 测试我的跨平台WASM图形引擎

一位开发者最近测试了他的跨平台WASM图形引擎,该引擎结合了3D和2D技术,能够在各种设备上运行。他表示,这个引擎采用了WebAssembly技术,可以在浏览器中运行,同时也适用于桌面和移动设备。他还称,这个引擎支持多...

Read More
2024-04-02 talkingdev

论文:Transformer-Lite,在手机GPU上运行大型语言模型

移动设备上运行语言模型面临着延迟、带宽和功耗等多方面的挑战。本研究通过采用量化技术、移除键值缓存以及其他优化手段,成功实现了在手机上以每秒30个令牌的速度运行强大的Gemma 2B模型。这一成果比其他框架快约...

Read More
2024-03-04 talkingdev

PL2Map-轻量级神经网络实现3D建图

该项目介绍了一种新的3D建图和定位方法,使用轻量级神经网络处理点和线特征,显著提高了姿态准确性,同时占用更少的内存和计算要求。为了实现更快的姿态估计和更准确的3D建图,该方法使用了一种新的神经网络结构,该...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page