漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-16 talkingdev

英伟达CEO黄仁勋盛赞DeepSeek、阿里、腾讯AI模型为“世界级”,并称H20芯片美国许可“将很快获批”

英伟达(NVIDIA)CEO黄仁勋在近日的北京科技博览会上高度评价了中国企业DeepSeek、阿里巴巴和腾讯的人工智能模型,称它们已达到“世界级”水平。黄仁勋还透露,美国对英伟达H20芯片的出口许可审批“将很快完成”。这一表...

Read More
2025-07-07 talkingdev

德国TNG实验室发布DeepSeek-TNG R1T2 Chimera模型,速度提升200%

德国知名技术咨询公司TNG Technology Consulting GmbH近日发布了其最新研发的DeepSeek-TNG R1T2 Chimera模型。这一突破性进展在人工智能领域引起广泛关注,该模型不仅显著提升了处理速度达200%,同时大幅减少了输出t...

Read More
2025-07-04 talkingdev

前沿AI推理时间扩展与集体智能:新方法在ARC-AGI-2基准测试中提升30%性能

一项创新的推理时间扩展方法通过结合o4-mini、Gemini-2.5-Pro和DeepSeek-R1三种AI模型,在ARC-AGI-2基准测试中实现了30%的性能提升,显著优于单个模型的表现。该技术采用动态选择机制,根据问题特性自动分配最适合的...

Read More
2025-06-24 talkingdev

小模型逆袭!7B参数模型通过强化学习教师机制超越671B大模型

一项突破性研究展示了小模型通过创新训练方法战胜巨型模型的可能。日本Sakana.AI团队开发的"教师模型"采用全新范式——这些模型不需要自行解决问题,而是被直接提供问题和正确答案,专注于生成清晰易懂的解决方案解释...

Read More
2025-06-18 talkingdev

MiniMax开源推理模型M1:混合专家架构+闪电注意力

人工智能公司MiniMax在GitHub开源了其4560亿参数规模的推理模型M1,该模型采用创新的混合专家架构(MoE)并引入'闪电注意力'技术,实现百万token级别的超长上下文处理能力(相当于DeepSeek R1的8倍)。特别值得注意...

Read More
2025-06-17 talkingdev

DeepSeek R1-0528与FLUX.1 Kontext图像编辑模型登陆Together AI平台,推理API与聊天应用免费体验

Together AI宣布在其Serverless Inference API和专用端点服务中集成两大前沿AI模型:DeepSeek R1-0528语言模型与FLUX.1 Kontext图像生成系统。DeepSeek R1-0528通过升级的推理能力、函数调用支持及代码生成优化,显...

Read More
2025-06-16 talkingdev

Featherless AI登陆Hugging Face平台,提供无服务器模型推理服务

人工智能领域迎来重要进展,Featherless AI近日正式成为Hugging Face平台的推理服务提供商。这一合作将为开发者带来革命性的无服务器(serverless)模型访问体验,用户无需管理底层基础设施即可直接调用包括Meta、Qw...

Read More
2025-05-29 talkingdev

DeepSeek发布升级版R1推理AI模型,现已登陆Hugging Face平台

人工智能研究公司DeepSeek近日宣布对其R1推理模型进行重大升级,并将最新版本发布于Hugging Face平台。这一进展标志着自然语言处理领域的重要突破,R1模型以其卓越的推理能力和高效的参数利用在业界备受关注。此次更...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page