Gemini的相关内容 - 漫话开发者

2026-01-20 talkingdev

开源|Gemini Voyager：为谷歌Gemini打造的全能增强套件，集成对话导航与提示库管理

近日，一个名为Gemini Voyager的开源浏览器扩展项目在GitHub上发布，旨在显著提升用户与谷歌Gemini大语言模型交互的体验与效率。该项目并非简单的界面美化工具，而是一个集成了多项高级组织与实用功能的增强套件，直...

2026-01-19 talkingdev

近日，GitHub上出现了一个名为AionUi的开源项目，它旨在解决当前分散的AI命令行工具在协作与使用体验上的痛点。AionUi本质上是一个统一的图形用户界面（GUI），扮演着“协同工作”（Cowork）平台的角色。它能够自动检...

2026-01-11 talkingdev

近日，一位开发者利用Claude Code构建了一个名为“Trails”的创新系统，旨在突破大型语言模型（LLM）仅用于文本摘要的常规应用，转而探索其帮助人类进行深度阅读与知识关联的潜力。该系统让Claude Code自主浏览了100本...

2026-01-10 talkingdev

近日，一款名为QuickQuack的创新项目在开发者社区引发关注。该项目旨在彻底改变用户获取维基百科信息的方式，将其从传统的静态页面浏览，转变为类似TikTok的沉浸式、流式信息消费体验。其技术核心在于采用了前沿的“...

2026-01-01 talkingdev

根据年度回顾分析，2025年是大语言模型（LLM）发展史上具有里程碑意义的一年。核心技术突破体现在模型获得了真正的“推理”能力，使其能够处理复杂的多步骤任务，这直接推动了高性能AI智能体的广泛应用。其中，“编码智...

2025-12-12 talkingdev

谷歌近日正式向开发者开放了其强大的Gemini深度研究（Gemini Deep Research）功能，通过全新的交互API（Interactions API）提供服务。这一举措标志着AI在复杂信息处理与综合能力方面迈出了重要一步。Gemini深度研究...

2025-11-30 talkingdev

开发者gavrielc基于谷歌最新Gemini 3 Pro Image模型（代号Nano Banana）推出开源CLI工具Nano PDF，实现了通过自然语言指令直接编辑PDF文档的技术突破。该工具将指定PDF页面转换为图像，结合用户文本提示调用多模态AI...

2025-11-27 talkingdev

谷歌Gemini模型近日通过开源项目Gemini CLI正式登陆终端环境，这一进展标志着AI助手在开发者工作流中的深度集成迈入新阶段。该项目由谷歌工程总监Addy Osmani主导，系统性地发布了30个专业级使用技巧，涵盖持久化上...