漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-15 talkingdev

独家爆料:OpenAI即将推出基于Chromium的浏览器,由ChatGPT Agent模式驱动

据最新消息,OpenAI正在开发一款基于Chromium的浏览器,该浏览器将采用Agent模式来控制用户操作。Agent模式正在升级,可选择在远程云/虚拟浏览器或第一方本地浏览器上运行。值得注意的是,云浏览器功能似乎仅作为备...

Read More
2025-08-14 talkingdev

苹果开源Embedding Atlas:交互式大模型嵌入可视化工具

苹果公司近日在GitHub开源了Embedding Atlas项目,这是一款专为大规模嵌入数据设计的交互式可视化工具。该工具通过WebGPU加速实现高性能渲染,支持自动数据聚类标注、实时交叉筛选和元数据搜索三大核心功能。其技术...

Read More
2025-08-14 talkingdev

iMessage MCP:让LLM本地读取你的iMessage信息

开发者Wyatt Joh近日在JSR平台发布了两个开源工具包@wyattjoh/imessage和@wyattjoh/imessage-mcp,这些工具允许大型语言模型(LLM)如Claude在macOS系统上以只读方式访问用户的iMessage数据库。这一创新技术使用户能...

Read More
2025-08-14 talkingdev

谷歌Deep Research API即将问世,AI驱动的复杂研究任务自动化时代来临

谷歌Gemini Deep Research团队正在开发名为Deep Research API的创新工具,该技术将彻底改变传统研究模式。这一API具备强大的自动化研究能力,可在几分钟内完成数百个网站的智能浏览、信息深度分析及生成多页洞察报告...

Read More
2025-08-14 talkingdev

AI流量激增527%,搜索引擎优化(SEO)面临重大变革

最新数据显示,从1月到5月,由人工智能驱动的网络流量激增527%,以ChatGPT和Perplexity为代表的大型语言模型(LLMs)正在重塑用户与互联网的互动方式。法律、金融和健康行业在AI来源的会话中处于领先地位,这表明用...

Read More
2025-08-14 talkingdev

谷歌Gemini AI将支持自动记忆功能,个性化体验再升级

谷歌近日宣布为其AI聊天机器人Gemini推出重大更新,新增自动记忆功能。该功能默认开启,允许Gemini无需用户提示即可记住过往对话内容,自动识别关键细节和用户偏好,并据此提供个性化输出。目前,该功能已开始向部分...

Read More
2025-08-13 talkingdev

Claude Sonnet 4上下文窗口突破100万tokens,开启大规模代码分析与文档合成新纪元

Anthropic公司宣布其Claude Sonnet 4模型现已支持高达100万tokens的上下文窗口,这一重大升级使其处理能力提升了5倍。这一突破性进展意味着该模型能够胜任更复杂、数据密集型的任务,如大规模代码库的深度分析和长文...

Read More
2025-08-13 talkingdev

AI2发布MolmoAct:首个支持3D空间推理的动作理解模型

艾伦人工智能研究所(AI2)近日开源了MolmoAct模型,这是首个基于Molmo框架构建的、专注于三维空间推理的动作理解系统。该模型通过创新的三维空间表征学习方法,实现了对复杂指令的精准环境交互能力,在SpatialQA等...

Read More
  1. Prev Page
  2. 25
  3. 26
  4. 27
  5. Next Page