漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-20 talkingdev

开源|Gemini Voyager:为谷歌Gemini打造的全能增强套件,集成对话导航与提示库管理

近日,一个名为Gemini Voyager的开源浏览器扩展项目在GitHub上发布,旨在显著提升用户与谷歌Gemini大语言模型交互的体验与效率。该项目并非简单的界面美化工具,而是一个集成了多项高级组织与实用功能的增强套件,直...

Read More
2026-01-19 talkingdev

开源|AionUi:本地化开源AI工具协作平台,统一管理Gemini CLI、Claude Code等多模型

近日,GitHub上出现了一个名为AionUi的开源项目,它旨在解决当前分散的AI命令行工具在协作与使用体验上的痛点。AionUi本质上是一个统一的图形用户界面(GUI),扮演着“协同工作”(Cowork)平台的角色。它能够自动检...

Read More
2026-01-11 talkingdev

开源|Trails项目:用Claude Code挖掘百本非虚构书籍的深层思想关联,探索LLM阅读新范式

近日,一位开发者利用Claude Code构建了一个名为“Trails”的创新系统,旨在突破大型语言模型(LLM)仅用于文本摘要的常规应用,转而探索其帮助人类进行深度阅读与知识关联的潜力。该系统让Claude Code自主浏览了100本...

Read More
2026-01-10 talkingdev

开源|QuickQuack:像刷TikTok一样浏览维基百科,体验全生成式UI与实时流式渲染

近日,一款名为QuickQuack的创新项目在开发者社区引发关注。该项目旨在彻底改变用户获取维基百科信息的方式,将其从传统的静态页面浏览,转变为类似TikTok的沉浸式、流式信息消费体验。其技术核心在于采用了前沿的“...

Read More
2026-01-01 talkingdev

2025年大语言模型回顾:推理能力突破、AI智能体普及与格局重塑

根据年度回顾分析,2025年是大语言模型(LLM)发展史上具有里程碑意义的一年。核心技术突破体现在模型获得了真正的“推理”能力,使其能够处理复杂的多步骤任务,这直接推动了高性能AI智能体的广泛应用。其中,“编码智...

Read More
2025-12-12 talkingdev

谷歌发布Gemini深度研究交互API,AI代理自主驾驭复杂信息搜索

谷歌近日正式向开发者开放了其强大的Gemini深度研究(Gemini Deep Research)功能,通过全新的交互API(Interactions API)提供服务。这一举措标志着AI在复杂信息处理与综合能力方面迈出了重要一步。Gemini深度研究...

Read More
2025-11-30 talkingdev

NanoPDF:用Gemini Nano Banana模型通过自然语言编辑PDF演示文稿

开发者gavrielc基于谷歌最新Gemini 3 Pro Image模型(代号Nano Banana)推出开源CLI工具Nano PDF,实现了通过自然语言指令直接编辑PDF文档的技术突破。该工具将指定PDF页面转换为图像,结合用户文本提示调用多模态AI...

Read More
2025-11-27 talkingdev

开源|Gemini CLI 30个专业技巧:解锁终端AI助手高效工作流

谷歌Gemini模型近日通过开源项目Gemini CLI正式登陆终端环境,这一进展标志着AI助手在开发者工作流中的深度集成迈入新阶段。该项目由谷歌工程总监Addy Osmani主导,系统性地发布了30个专业级使用技巧,涵盖持久化上...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page