漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-18 talkingdev

ChatGPT Agent正式发布:连接研究与行动的全新智能助手

OpenAI最新推出的ChatGPT Agent标志着人工智能助手能力的重大飞跃。该产品深度融合了Operator的网页浏览功能和Deep Research的分析能力,并配备专属虚拟计算机系统,能够自主完成多步骤复杂任务。从技术架构来看,Ch...

Read More
2025-07-16 talkingdev

Mistral AI推出开源音频模型Voxtral,开启语音理解新纪元

Mistral AI近日发布了其首个开源音频模型套件Voxtral,标志着开源语音理解技术迈入新阶段。该套件包含两个关键版本:24B参数的大规模应用模型和3B参数的边缘计算优化版本。24B模型凭借庞大参数规模,可处理复杂语音...

Read More
2025-07-10 talkingdev

Perplexity推出Comet:一款面向研究场景的AI浏览器

人工智能公司Perplexity近日发布了名为Comet的创新浏览器产品,该产品专为研究工作场景设计,深度整合了Perplexity自主研发的搜索与推理引擎技术。Comet浏览器通过AI能力重构了传统浏览器的交互范式,可同时支持工作...

Read More
2025-06-12 talkingdev

The Browser Company推出AI优先浏览器Dia,将AI深度集成至地址栏

The Browser Company正式发布其AI优先浏览器Dia,标志着浏览器技术迈入新阶段。Dia通过将AI深度集成至URL地址栏,实现了多项突破性功能:用户可直接通过自然语言查询已打开的标签页内容、基于页面内容生成草稿文本,...

Read More
2025-06-09 talkingdev

微软推出GUI-Actor:AI代理无需坐标即可操作屏幕界面

微软研究院最新提出的GUI-Actor技术,彻底改变了AI代理与图形用户界面(GUI)的交互方式。这项突破性技术摒弃了传统依赖像素坐标预测的方法,转而采用注意力机制直接解析屏幕截图内容,使AI能够像人类一样'理解'界面...

Read More
2025-05-26 talkingdev

Hugging Face推出基于MCP协议的Python微型智能体,仅需70行代码实现工具集成

Hugging Face近期将其Tiny Agent设计理念扩展至Python领域,通过创新的模型上下文协议(Model Context Protocol, MCP)显著简化了大语言模型(LLMs)的工具集成流程。这一突破性进展使开发者仅需约70行代码即可构建...

Read More
2025-05-13 talkingdev

本地化构建专属Siri:无需云端,隐私无忧

近日,一篇题为《Build your own Siri. Locally. On-Device. No Cloud.》的技术文章引发广泛关注。文章详细介绍了如何在本地设备上构建类似Siri的语音助手,完全脱离云端服务,从而确保用户隐私安全。这一技术方案利...

Read More
2025-04-24 talkingdev

xAI聊天机器人Grok新增视觉识别功能,iOS用户可体验

马斯克旗下人工智能公司xAI推出的Grok聊天机器人近日迎来重要升级,新增了视觉识别能力。这一功能允许iOS用户上传图片或通过摄像头捕捉画面,随后向Grok提问关于所看到内容的问题。该功能与OpenAI的ChatGPT和谷歌的G...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page