漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-22 talkingdev

Gemini Deep Think 模型在国际数学奥林匹克竞赛中达到金牌标准

继OpenAI在周六宣布其模型获得金牌后,Google也宣布其Gemini Deep Think模型在国际数学奥林匹克竞赛(IMO)中解决了六道题目中的五道,并获得了赛事官方认证的金牌标准。这一突破标志着Google在人工智能领域的重大进...

Read More
2025-07-18 talkingdev

AI模型或将趋同:柏拉图表示假说揭示通用嵌入的可能性

最新研究发现,随着AI模型规模的扩大和智能的提升,它们正在向信息的通用表示方式收敛。这一现象被称为'柏拉图表示假说',认为由于现实的单一性,模型会学习到越来越相似的数据特征和关系。该假说的一个实际应用是开...

Read More
2025-07-10 talkingdev

Biomni:斯坦福团队开源通用生物医学AI智能体

斯坦福大学SNAP实验室在GitHub开源了Biomni项目,这是一种通用型生物医学AI智能体,通过结合大语言模型(LLM)的推理能力、检索增强规划技术以及代码执行功能,能够自主完成跨生物医学领域的研究任务。该系统突破了...

Read More
2025-07-10 talkingdev

Perplexity推出Comet:一款面向研究场景的AI浏览器

人工智能公司Perplexity近日发布了名为Comet的创新浏览器产品,该产品专为研究工作场景设计,深度整合了Perplexity自主研发的搜索与推理引擎技术。Comet浏览器通过AI能力重构了传统浏览器的交互范式,可同时支持工作...

Read More
2025-07-07 talkingdev

agent-squad:构建协作式多智能体AI系统框架

AWS实验室推出的开源项目agent-squad为构建协作式多智能体AI系统提供了全新框架。该技术突破性地实现了多智能体之间的任务规划、工作委派和协同问题解决能力,标志着分布式人工智能向复杂任务处理迈出重要一步。其核...

Read More
2025-06-11 talkingdev

[论文推荐]上海研究团队推出DiTorch与DiComm框架,实现异构芯片集群高效训练百亿级AI模型

上海科研团队最新发布的DiTorch和DiComm技术框架,突破了AI训练对同构硬件的依赖。该创新通过统一编程接口整合NVIDIA、AMD等异构芯片架构,在1,024块规格差异显著的芯片集群上训练千亿参数模型时实现116%的超线性效...

Read More
2025-06-05 talkingdev

[开源]科学推理基准测试(GitHub Repo):239个问题挑战大语言模型科学推理能力

该GitHub仓库发布了一个包含239个科学推理问题的基准测试集,专门用于评估大语言模型(LLMs)在科学推理任务中的表现,特别是超越简单记忆的方程发现能力。这一基准测试的推出标志着AI领域对模型深层科学理解能力的量...

Read More
2025-05-23 talkingdev

谷歌I/O 2025大会AI亮点回顾:Gemini 2.5 Pro Deep Think与Veo 3重磅发布

谷歌最新一期Release Notes播客深度解析了I/O 2025大会的AI技术突破,重点介绍了三大核心创新:1) Gemini 2.5 Pro Deep Think作为下一代多模态AI系统,通过增强的递归神经网络架构实现复杂逻辑推理,其万亿级参数规...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page