漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-07 talkingdev

开源|Hippo Memory:受海马体启发的AI记忆系统,让智能体告别“健忘症”

近日,一个名为Hippo Memory的开源项目在GitHub上发布,旨在为AI智能体构建一个受生物学启发的记忆系统,以解决其在长期交互中遗忘关键上下文信息的核心难题。该项目灵感来源于人类大脑中的海马体,通过模拟记忆衰减...

Read More
2026-04-05 talkingdev

开源|Hindsight:赋予AI智能体“学会记忆”的能力,向量化记忆库开源发布

近日,由vectorize-io团队在GitHub上开源的项目Hindsight引发了人工智能领域,特别是智能体(Agent)开发社区的广泛关注。该项目旨在解决当前AI智能体在长期任务和复杂交互中面临的核心挑战——记忆管理。Hindsight的...

Read More
2026-03-04 talkingdev

GPT-5.3 Instant发布:更流畅实用的日常对话AI助手

OpenAI近日发布了其最新对话模型GPT-5.3 Instant,该版本在Hacker News社区引发了广泛关注,获得了319个点赞和254条评论。作为GPT系列的最新迭代,GPT-5.3 Instant的核心升级在于显著提升了日常对话的流畅度和实用性...

Read More
2025-11-24 talkingdev

揭秘大语言模型推理机制:从输入到输出的技术全流程

大语言模型(LLM)作为基于Transformer架构的神经网络,通过并行分析完整序列并计算词语间的全局关联性,实现了自然语言处理的突破性进展。在推理过程中,模型首先将输入文本转化为数字化的词元嵌入向量,随后通过Tr...

Read More
2025-10-13 talkingdev

开源|微软推出Edge AI入门课程:从模型优化到智能代理开发

微软近日在GitHub开源社区正式发布《Edge AI for Beginners》系列课程,该项目专为人工智能初学者设计,系统性地介绍了边缘计算与AI结合的完整技术栈。课程内容涵盖边缘AI基础架构、主流轻量级模型(如MobileNet、Ti...

Read More
2025-09-01 talkingdev

Weaviate发布8位旋转量化技术:向量搜索速度提升4倍同时优化精度

Weaviate团队最新提出的8位旋转量化技术(8-bit Rotational Quantization)突破了向量搜索领域的性能瓶颈。该技术通过创新性地采用随机旋转算法,将原始向量数据压缩至原大小的1/4,在显著减少存储空间和内存占用的...

Read More
2025-08-29 talkingdev

开源|oLLM:轻量级Python库实现消费级GPU运行100K上下文大模型

近日,GitHub上开源项目oLLM引发开发者社区广泛关注。该项目是一个专为大上下文语言模型推理设计的轻量级Python库,其核心突破在于仅需8GB显存的消费级GPU即可运行Llama-3.1-8B-Instruct等模型处理长达10万token的上...

Read More
2025-07-11 talkingdev

Cactus:支持手机部署LLM/VLM/TTS跨平台框架

开发者Henry和Roman近日推出开源项目Cactus,这是一个专为智能手机设计的跨平台框架,支持本地部署大型语言模型(LLM)、视觉语言模型(VLM)和文本转语音(TTS)模型。与Ollama专注于笔记本和边缘服务器不同,Cactu...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page