边缘设备的相关内容 - 漫话开发者

2026-06-05 talkingdev

开源| QVAC SDK震撼更新：本地运行大模型，上下文容量暴增5倍，TurboQuant技术加持

Tether团队近日发布了QVAC SDK的最新版本，这是一款面向本地设备、专注于构建跨平台P2P应用的开源工具包。此次更新的核心亮点在于集成了名为TurboQuant的全新优化技术。通过这一技术，开发者在相同硬件条件下，能够...

2026-05-04 talkingdev

在大型语言模型（LLM）和视觉语言模型（VLM）部署中，模型量化是降低计算和存储成本的关键技术。然而，传统量化方法往往需要在模型大小和推理精度之间做出艰难取舍，尤其是在超低位宽（如2-bit、3-bit）下，精度损失...

2026-04-21 talkingdev

近日，GitHub上一个名为‘soulplayer-c64’的开源项目引发了技术社区的广泛关注。该项目成功地在仅有1MHz主频、内存极其有限的经典计算机Commodore 64上，部署并运行了一个拥有25,000个参数的真实Transformer神经网络...

2026-04-06 talkingdev

近日，GitHub上出现了一个名为Gemma Gem的开源项目，它是一个Chrome浏览器扩展，能够将谷歌最新发布的Gemma 4大型语言模型完全在用户本地设备上运行。该项目最大的技术亮点在于，它通过新兴的WebGPU API来实现高性能...

2026-03-11 talkingdev

近日，GitHub上开源项目RCLI引发开发者社区关注。该项目是一款专为搭载Apple Silicon芯片的macOS设备设计的全本地化语音AI助手。其核心价值在于构建了一个完整的端侧AI处理流水线，集成了语音识别（Speech-to-Text）...

2026-02-25 talkingdev

一家名为Moonshine AI的小型初创公司（团队仅六人，月GPU预算低于10万美元）近日在GitHub上开源了其自动语音识别（ASR）项目Moonshine。该项目针对边缘设备优化，提供了快速且高精度的语音转文本（STT）模型。据开发...

2026-02-17 talkingdev

阿里巴巴开源社区近日发布了ZVEC项目，这是一个轻量级、闪电速度的进程内向量数据库。该项目基于阿里巴巴自研的PROXIMA向量检索引擎，旨在为开发者提供一种能够快速、可扩展地进行相似性搜索的解决方案。ZVEC支持稠...

2026-01-23 talkingdev

谷歌研究团队近日发布了一项关于提升智能体意图理解能力的技术成果。核心观点指出，要让AI智能体真正发挥作用，其底层模型必须精准理解用户交互时的真实意图。当前，大型多模态大语言模型虽已在此任务上表现不俗，但...