多模态的相关内容 - 漫话开发者

2025-07-31 talkingdev

Ollama发布全新应用，简化语言模型交互体验

近日，Ollama正式推出了全新的macOS和Windows应用程序，旨在为用户提供更加便捷的语言模型交互体验。该应用不仅支持用户轻松下载和与多种语言模型进行对话，还引入了创新的文件拖放功能，允许用户直接上传文件进行分...

2025-07-28 talkingdev

Meta近日宣布任命ChatGPT联合创始人赵盛佳（Shengjia Zhao）为其新成立的超级智能实验室（Superintelligence Lab）的首席科学家，以加强其在人工智能领域的布局。赵盛佳将负责主导实验室的研究方向，并与Meta首席执...

2025-07-26 talkingdev

中国宇树科技(Unitree Robotics)近日推出革命性产品R1人形机器人，以5900美元（约合人民币4.2万元）的定价震撼业界，创下同类产品最低售价记录。这款重25公斤的机器人搭载先进的多模态人工智能系统，能够实现环境感...

2025-07-24 talkingdev

TimeScope是一个全新的开源基准测试工具，专门用于评估视觉大模型在处理长视频方面的能力。它不仅测试模型的检索能力，还涵盖了视频合成、时间定位以及细粒度运动分析等多个维度，从而提供对模型时间理解能力的全面...

2025-07-24 talkingdev

Voxtral团队最新发布了Voxtral Mini和Voxtral Small两款多模态音频聊天模型，在语音理解和文本处理方面均达到业界领先水平。这两款模型能够同时处理语音音频和文本文档，在多项音频基准测试中取得了最先进的性能表现...

2025-07-18 talkingdev

OpenAI最新推出的ChatGPT Agent标志着人工智能助手能力的重大飞跃。该产品深度融合了Operator的网页浏览功能和Deep Research的分析能力，并配备专属虚拟计算机系统，能够自主完成多步骤复杂任务。从技术架构来看，Ch...

2025-07-18 talkingdev

苹果公司近期在其机器学习研究官网发布了《Apple Intelligence Foundation Language Models Tech Report 2025》技术报告，正式公开了支撑Apple Intelligence功能的两大核心基础模型。报告显示，这两个模型具备多语言...

2025-07-16 talkingdev

据The Information记者Stephanie Palazzolo独家报道，OpenAI正在为ChatGPT开发新型智能体（agent）功能，旨在将其打造为白领工作的核心工具。这些功能将允许用户直接通过ChatGPT创建兼容Microsoft PowerPoint和Excel...