漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-28 talkingdev

Meta任命ChatGPT联合创始人赵盛佳为超级智能实验室首席科学家

Meta近日宣布任命ChatGPT联合创始人赵盛佳(Shengjia Zhao)为其新成立的超级智能实验室(Superintelligence Lab)的首席科学家,以加强其在人工智能领域的布局。赵盛佳将负责主导实验室的研究方向,并与Meta首席执...

Read More
2025-07-26 talkingdev

中国宇树科技发布R1人形机器人:搭载多模态AI,售价仅5900美元大幅降低行业门槛

中国宇树科技(Unitree Robotics)近日推出革命性产品R1人形机器人,以5900美元(约合人民币4.2万元)的定价震撼业界,创下同类产品最低售价记录。这款重25公斤的机器人搭载先进的多模态人工智能系统,能够实现环境感...

Read More
2025-07-24 talkingdev

TimeScope:你的视频大模型能处理多长的视频?

TimeScope是一个全新的开源基准测试工具,专门用于评估视觉大模型在处理长视频方面的能力。它不仅测试模型的检索能力,还涵盖了视频合成、时间定位以及细粒度运动分析等多个维度,从而提供对模型时间理解能力的全面...

Read More
2025-07-24 talkingdev

[论文推荐]Voxtral:多模态音频聊天模型新突破

Voxtral团队最新发布了Voxtral Mini和Voxtral Small两款多模态音频聊天模型,在语音理解和文本处理方面均达到业界领先水平。这两款模型能够同时处理语音音频和文本文档,在多项音频基准测试中取得了最先进的性能表现...

Read More
2025-07-18 talkingdev

ChatGPT Agent正式发布:连接研究与行动的全新智能助手

OpenAI最新推出的ChatGPT Agent标志着人工智能助手能力的重大飞跃。该产品深度融合了Operator的网页浏览功能和Deep Research的分析能力,并配备专属虚拟计算机系统,能够自主完成多步骤复杂任务。从技术架构来看,Ch...

Read More
2025-07-18 talkingdev

苹果发布2025技术报告:揭秘驱动Apple Intelligence的多语言多模态基础模型

苹果公司近期在其机器学习研究官网发布了《Apple Intelligence Foundation Language Models Tech Report 2025》技术报告,正式公开了支撑Apple Intelligence功能的两大核心基础模型。报告显示,这两个模型具备多语言...

Read More
2025-07-16 talkingdev

OpenAI正开发ChatGPT智能体功能,支持生成PPT/Excel文件及自动化网站任务

据The Information记者Stephanie Palazzolo独家报道,OpenAI正在为ChatGPT开发新型智能体(agent)功能,旨在将其打造为白领工作的核心工具。这些功能将允许用户直接通过ChatGPT创建兼容Microsoft PowerPoint和Excel...

Read More
2025-07-11 talkingdev

Cactus:支持手机部署LLM/VLM/TTS跨平台框架

开发者Henry和Roman近日推出开源项目Cactus,这是一个专为智能手机设计的跨平台框架,支持本地部署大型语言模型(LLM)、视觉语言模型(VLM)和文本转语音(TTS)模型。与Ollama专注于笔记本和边缘服务器不同,Cactu...

Read More
  1. Prev Page
  2. 12
  3. 13
  4. 14
  5. Next Page