漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-08 talkingdev

开源|TriAttention:基于三角函数的KV缓存压缩技术,助力大模型长上下文推理在内存受限GPU上本地部署

近日,GitHub上开源了一个名为TriAttention的项目,其核心是一种创新的KV(键值)缓存压缩技术。该技术旨在解决大语言模型在处理长上下文任务时,因KV缓存占用内存巨大而难以在消费级或内存受限的GPU上高效部署的行...

Read More
2026-04-07 talkingdev

开源|Hippo Memory:受海马体启发的AI记忆系统,让智能体告别“健忘症”

近日,一个名为Hippo Memory的开源项目在GitHub上发布,旨在为AI智能体构建一个受生物学启发的记忆系统,以解决其在长期交互中遗忘关键上下文信息的核心难题。该项目灵感来源于人类大脑中的海马体,通过模拟记忆衰减...

Read More
2026-04-07 talkingdev

开源|Defuddle:一键净化网页,精准提取核心内容为Markdown

近日,一款名为Defuddle的开源工具在GitHub上发布,旨在解决网页信息过载的痛点。该工具能够智能识别并剥离网页中的侧边栏、广告、导航菜单等干扰性元素,精准提取出文章或页面的核心正文内容,并将其转换为结构清晰...

Read More
2026-04-07 talkingdev

开源|Ghost Pepper:macOS本地长按语音转文字工具,基于WhisperKit与本地LLM,数据不出设备

开发者matthartman近日在GitHub上开源了名为Ghost Pepper的macOS应用,它是一款完全在本地运行的“长按说话”语音转文字工具。该工具的核心技术栈结合了OpenAI开源的WhisperKit语音识别模型与本地运行的大型语言模型(...

Read More
2026-04-06 talkingdev

开源|Caveman:以“原始人”风格压缩75%令牌,Claude代码技能实现高效LLM通信

近日,GitHub上出现了一个名为Caveman的创新项目,它作为Claude Code技能和Codex插件,旨在通过一种极简的“原始人”沟通风格,显著提升大型语言模型(LLM)代理间的交互效率。该技术的核心在于,它能够智能地剥离对话...

Read More
2026-04-06 talkingdev

开源|Gemma Gem:首个完全在设备端通过WebGPU运行谷歌Gemma 4模型的浏览器扩展

近日,GitHub上出现了一个名为Gemma Gem的开源项目,它是一个Chrome浏览器扩展,能够将谷歌最新发布的Gemma 4大型语言模型完全在用户本地设备上运行。该项目最大的技术亮点在于,它通过新兴的WebGPU API来实现高性能...

Read More
2026-04-06 talkingdev

开源|LLM Wiki:利用大语言模型构建动态知识库的新框架

近日,一项名为“LLM Wiki”的创新框架在开发者社区引发关注。该框架的核心是一个可被复制并粘贴到大语言模型(LLM)智能体中的“想法文件”,旨在为利用LLM构建和维护知识库提供一套系统化模式。在这一协作框架下,人类...

Read More
2026-04-05 talkingdev

开源|Hindsight:赋予AI智能体“学会记忆”的能力,向量化记忆库开源发布

近日,由vectorize-io团队在GitHub上开源的项目Hindsight引发了人工智能领域,特别是智能体(Agent)开发社区的广泛关注。该项目旨在解决当前AI智能体在长期任务和复杂交互中面临的核心挑战——记忆管理。Hindsight的...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page