漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-20 talkingdev

开源|Gemini Voyager:为谷歌Gemini打造的全能增强套件,集成对话导航与提示库管理

近日,一个名为Gemini Voyager的开源浏览器扩展项目在GitHub上发布,旨在显著提升用户与谷歌Gemini大语言模型交互的体验与效率。该项目并非简单的界面美化工具,而是一个集成了多项高级组织与实用功能的增强套件,直...

Read More
2026-01-01 talkingdev

开源|LMCache:为LLM服务注入极速KV缓存层,响应速度提升3-10倍

近日,一个名为LMCache的开源项目在GitHub上发布,旨在通过创新的键值(KV)缓存加速层,显著提升大型语言模型(LLM)的服务性能。该项目专为LLM推理服务设计,其核心在于能够跨GPU、CPU、本地磁盘和Redis等多种存储...

Read More
2025-12-10 talkingdev

开源|智谱AI发布GLM-4.6V系列多模态大模型:原生工具调用与128K上下文窗口

智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本:GLM-4.6V(106B)和GLM-4.6V-Flash(9B)。前者是面向云端和高性能集群场景设计的基础模型,后者则是为本地部署和低延迟应用优化...

Read More
2025-10-28 talkingdev

开源|TOON:专为LLM设计的轻量级数据结构表示法,令牌成本减半

近日,GitHub上开源项目TOON(Token-Oriented Object Notation)引发开发者社区广泛关注。这一由开发者johannschopplich推出的新型数据格式,专为大语言模型(LLM)输入优化设计,通过精简的结构化数据表示方式,显...

Read More
2025-10-07 talkingdev

开源|OpenAI发布ChatKit-JS客户端库,加速AI对话应用开发

OpenAI近日在GitHub平台正式开源了ChatKit-JS项目,这是一个专为JavaScript开发者设计的对话界面开发工具包。该库封装了与OpenAI API交互的核心能力,支持实时对话流、上下文管理和多轮对话等企业级功能,可显著降低...

Read More
2025-08-10 talkingdev

实测Alexa+:多轮对话流畅但漏洞频出,基础功能反而不如旧版?

《纽约时报》科技专栏作者Kevin Roose对亚马逊最新推出的智能语音助手Alexa+进行了深度体验。这款被寄予厚望的升级版展现出两大技术特性:采用更先进的自然语言处理架构,实现了接近人类对话的交互流畅度;在多步骤...

Read More
2025-08-06 talkingdev

开源|OpenAI发布Harmony响应格式渲染器,助力gpt-oss开源模型结构化输出

OpenAI近日在GitHub上开源了Harmony响应格式的渲染器项目,该项目专为其gpt-oss系列开源权重模型设计,旨在实现对话输出的结构化处理。Harmony格式通过Rust编写的核心模块与Python绑定,提供了高效的格式解析与渲染...

Read More
2025-07-24 talkingdev

[论文推荐]Voxtral:多模态音频聊天模型新突破

Voxtral团队最新发布了Voxtral Mini和Voxtral Small两款多模态音频聊天模型,在语音理解和文本处理方面均达到业界领先水平。这两款模型能够同时处理语音音频和文本文档,在多项音频基准测试中取得了最先进的性能表现...

Read More
  1. Next Page