漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-29 talkingdev

DeepSeekMath-V2模型在IMO 2025与中国奥数2024斩获金牌级表现

中国AI初创公司深度求索(DeepSeek)最新发布的DeepSeekMath-V2数学模型在国际数学奥林匹克竞赛(IMO)2025及中国数学奥林匹克2024中达到金牌级水平,标志着AI在复杂数学推理领域的重大突破。该模型通过创新的推理架...

Read More
2025-11-28 talkingdev

开源|DeepSeekMath-V2:迈向可自我验证的数学推理新突破

深度求索公司最新发布的DeepSeekMath-V2研究论文在GitHub平台引发广泛关注,该研究标志着数学推理AI模型向自我验证能力迈出了重要一步。这项前沿技术通过引入自我验证机制,使模型能够自动检查数学推导过程的正确性...

Read More
2025-10-21 talkingdev

开源|DeepSeek-OCR:突破长上下文压缩瓶颈,日生成20万页训练数据

DeepSeek-AI团队最新开源的DeepSeek-OCR项目在长上下文压缩技术领域实现重要突破。该项目通过创新的光学二维映射技术,探索将长文本上下文进行高效压缩的可行性。系统由DeepEncoder核心引擎和DeepSeek3B-Moe-A570M解...

Read More
2025-10-14 talkingdev

InferenceMAX开源推理基准发布:NVIDIA与AMD芯片性能正面交锋

业界瞩目的开源AI推理基准测试工具InferenceMAX正式亮相,该工具通过夜间自动化测试对Llama 70B、DeepSeek R1等主流大模型进行持续性能评估。其核心价值在于量化AI推理中的关键权衡:吞吐量(每GPU每秒处理令牌数)...

Read More
2025-09-30 talkingdev

DeepSeek-V3.2-Exp发布:稀疏注意力机制突破长序列处理瓶颈

深度求索公司最新推出的DeepSeek-V3.2-Exp模型引入了创新的稀疏注意力机制,这一技术突破专门针对长上下文序列的训练和推理效率进行了深度优化。该机制通过智能选择关键注意力区域,显著降低了计算复杂度,使得模型...

Read More
2025-09-29 talkingdev

深度求索发布DeepSeek-V3.1 Terminus:智能体工具调用能力全面升级

深度求索(DeepSeek)最新推出的DeepSeek-V3.1 Terminus模型标志着AI智能体技术迈入新阶段。该版本在工具调用(Tool Use)能力上实现重大突破,通过优化推理架构和指令遵循机制,显著提升了复杂任务执行的准确性和效...

Read More
2025-08-18 talkingdev

中国开源大模型研发机构排名:DeepSeek领跑,Moonshot AI与智谱AI紧追其后

近日,一份针对中国19家人工智能实验室的排名报告引发行业关注。该排名并非基于模型原始性能,而是聚焦各机构对AI研究的贡献度。长期领跑的DeepSeek实验室虽近期相对低调,仍保持领先地位。值得注意的是,新兴力量如...

Read More
2025-08-15 talkingdev

Baseten推出高性能开源大模型API服务,支持Kimi K2、GPT-OSS等前沿模型

Baseten近日推出其Model APIs服务,旨在为开发者提供高性能的开源大语言模型部署解决方案。该服务支持包括Kimi K2、GPT-OSS、DeepSeek、Qwen 3等在内的多款前沿开源模型,承诺提供行业领先的性能表现和极具竞争力的...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page