SqueezeTime是一款为移动视频理解设计的轻量级网络,其独特之处在于,它能够将视频的时间轴压缩到频道维度中,从而增强了时间分析的能力。SqueezeTime网络的设计理念是,通过压缩时间轴,可以在不牺牲视频内容质量的...
Read MoreMeta发布了一款名为ExecuTorch的框架,这是一个后训练量化工具包,能够支持在各种iPhone和Galaxy设备上运行Llama模型。该框架能够在运行7B大小语言模型的手机上,每秒获取多达11个令牌。ExecuTorch框架的发布,进一...
Read More近日,一个名为SVG Viewer的全新工具正式上线。该工具能够帮助用户更好地查看、编辑和优化SVG文件。SVG是一种基于XML的图形格式,可用于创建浏览器和移动设备中使用的矢量图形。它是一种非常流行的格式,因为它可以...
Read More苹果公司开发了一款名为Ferret-UI的多模态大型语言模型(LLM),该模型具备理解移动设备用户界面的能力,有望让Siri更有效地理解并与屏幕上的元素进行互动。Ferret-UI的出现预示着Siri将能够更加直观地与iOS应用进行...
Read More由前Snap高管Alex Mashrabov创立的Higgsfield AI公司,最近推出了Diffuse,这是一款面向创作者和社交媒体市场营销人员的移动优先AI视频创作和编辑应用程序。Diffuse的推出,直接挑战了OpenAI的Sora视频生成器。与Sor...
Read More一位开发者最近测试了他的跨平台WASM图形引擎,该引擎结合了3D和2D技术,能够在各种设备上运行。他表示,这个引擎采用了WebAssembly技术,可以在浏览器中运行,同时也适用于桌面和移动设备。他还称,这个引擎支持多...
Read More在移动设备上运行语言模型面临着延迟、带宽和功耗等多方面的挑战。本研究通过采用量化技术、移除键值缓存以及其他优化手段,成功实现了在手机上以每秒30个令牌的速度运行强大的Gemma 2B模型。这一成果比其他框架快约...
Read More该项目介绍了一种新的3D建图和定位方法,使用轻量级神经网络处理点和线特征,显著提高了姿态准确性,同时占用更少的内存和计算要求。为了实现更快的姿态估计和更准确的3D建图,该方法使用了一种新的神经网络结构,该...
Read More