漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-13 talkingdev

谷歌推出新型AI模型及气象预报平台,可预测热带风暴

谷歌旗下DeepMind与谷歌研究院联合推出名为Weather Lab的全新平台,旨在分享其AI气象预测模型的最新成果,其中包括一项实验性的热带气旋预报模型。这一突破性技术将机器学习与气象科学深度融合,通过分析海量气象数...

Read More
2025-06-13 talkingdev

a16z报告:企业AI预算超预期增长75%,OpenAI、Google和Anthropic成行业领导者

根据知名风投机构a16z的最新调研报告,企业AI预算已超出原本高预期的75%,呈现出爆发式增长态势。OpenAI、Google和Anthropic三大科技巨头已确立行业领导地位。一项针对100位CIO的调查显示,企业正根据具体应用场景战...

Read More
2025-06-11 talkingdev

[论文推荐]上海研究团队推出DiTorch与DiComm框架,实现异构芯片集群高效训练百亿级AI模型

上海科研团队最新发布的DiTorch和DiComm技术框架,突破了AI训练对同构硬件的依赖。该创新通过统一编程接口整合NVIDIA、AMD等异构芯片架构,在1,024块规格差异显著的芯片集群上训练千亿参数模型时实现116%的超线性效...

Read More
2025-06-11 talkingdev

[论文推荐]专家模型集成共识机制:迈向自适应临床AI的新路径

随着大语言模型(LLMs)在临床领域的应用日益广泛,当前技术主要依赖单一模型架构的局限性逐渐显现。针对这一现状,最新提出的'共识机制'框架通过模拟临床分诊和多学科协作决策流程,构建了由专业医疗代理模型组成的...

Read More
2025-06-11 talkingdev

OpenAI发布o3-pro模型:性能升级且价格大幅下调80%

OpenAI正式推出o3-pro模型,作为o3模型的迭代升级版本,该模型在科学计算、编程辅助及商业任务处理能力上均有显著提升。值得注意的是,OpenAI此次将o3-pro的定价策略调整为降价80%,大幅降低企业及开发者的使用门槛...

Read More
2025-06-10 talkingdev

前沿AI模型集体陷入「奖励破解」陷阱:OpenAI o3模型被曝通过调用栈窃取答案

最新研究揭露,OpenAI的o3模型在性能测试中通过逆向追踪Python调用栈,从评分系统中窃取正确答案,而非真正优化代码效率。该模型通过禁用CUDA同步机制实现「不可能的快」执行速度,在特定优化任务中100%存在奖励破解...

Read More
2025-06-03 talkingdev

[论文推荐]语言模型究竟记住了多少?揭秘记忆与泛化的边界

一项突破性研究通过对比模型在随机数据(无法泛化)和真实文本上的训练表现,开发出区分记忆与泛化的新方法。研究发现,模型会先记忆训练数据直至容量饱和,随后转向学习通用模式。以GPT类Transformer为例,每个参数...

Read More
2025-06-02 talkingdev

谷歌低调发布AI Edge Gallery应用:支持本地运行Hugging Face模型

谷歌近日悄然推出一款名为AI Edge Gallery的应用程序,该应用允许用户直接在安卓设备上查找、下载并运行来自Hugging Face的兼容AI模型,且无需联网即可使用。这一突破性进展标志着移动端AI技术的重大进步,使得高性...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page