漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-14 talkingdev

InferenceMAX开源推理基准发布:NVIDIA与AMD芯片性能正面交锋

业界瞩目的开源AI推理基准测试工具InferenceMAX正式亮相,该工具通过夜间自动化测试对Llama 70B、DeepSeek R1等主流大模型进行持续性能评估。其核心价值在于量化AI推理中的关键权衡:吞吐量(每GPU每秒处理令牌数)...

Read More
2025-09-30 talkingdev

DeepSeek-V3.2-Exp发布:稀疏注意力机制突破长序列处理瓶颈

深度求索公司最新推出的DeepSeek-V3.2-Exp模型引入了创新的稀疏注意力机制,这一技术突破专门针对长上下文序列的训练和推理效率进行了深度优化。该机制通过智能选择关键注意力区域,显著降低了计算复杂度,使得模型...

Read More
2025-09-29 talkingdev

深度求索发布DeepSeek-V3.1 Terminus:智能体工具调用能力全面升级

深度求索(DeepSeek)最新推出的DeepSeek-V3.1 Terminus模型标志着AI智能体技术迈入新阶段。该版本在工具调用(Tool Use)能力上实现重大突破,通过优化推理架构和指令遵循机制,显著提升了复杂任务执行的准确性和效...

Read More
2025-08-18 talkingdev

中国开源大模型研发机构排名:DeepSeek领跑,Moonshot AI与智谱AI紧追其后

近日,一份针对中国19家人工智能实验室的排名报告引发行业关注。该排名并非基于模型原始性能,而是聚焦各机构对AI研究的贡献度。长期领跑的DeepSeek实验室虽近期相对低调,仍保持领先地位。值得注意的是,新兴力量如...

Read More
2025-08-15 talkingdev

Baseten推出高性能开源大模型API服务,支持Kimi K2、GPT-OSS等前沿模型

Baseten近日推出其Model APIs服务,旨在为开发者提供高性能的开源大语言模型部署解决方案。该服务支持包括Kimi K2、GPT-OSS、DeepSeek、Qwen 3等在内的多款前沿开源模型,承诺提供行业领先的性能表现和极具竞争力的...

Read More
2025-07-16 talkingdev

英伟达CEO黄仁勋盛赞DeepSeek、阿里、腾讯AI模型为“世界级”,并称H20芯片美国许可“将很快获批”

英伟达(NVIDIA)CEO黄仁勋在近日的北京科技博览会上高度评价了中国企业DeepSeek、阿里巴巴和腾讯的人工智能模型,称它们已达到“世界级”水平。黄仁勋还透露,美国对英伟达H20芯片的出口许可审批“将很快完成”。这一表...

Read More
2025-07-07 talkingdev

德国TNG实验室发布DeepSeek-TNG R1T2 Chimera模型,速度提升200%

德国知名技术咨询公司TNG Technology Consulting GmbH近日发布了其最新研发的DeepSeek-TNG R1T2 Chimera模型。这一突破性进展在人工智能领域引起广泛关注,该模型不仅显著提升了处理速度达200%,同时大幅减少了输出t...

Read More
2025-07-04 talkingdev

前沿AI推理时间扩展与集体智能:新方法在ARC-AGI-2基准测试中提升30%性能

一项创新的推理时间扩展方法通过结合o4-mini、Gemini-2.5-Pro和DeepSeek-R1三种AI模型,在ARC-AGI-2基准测试中实现了30%的性能提升,显著优于单个模型的表现。该技术采用动态选择机制,根据问题特性自动分配最适合的...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page