DeepSeek的相关内容 - 漫话开发者

2025-05-02 talkingdev

OpenAI计划推出开源AI模型，支持云端大模型协同计算

OpenAI宣布将于今夏发布一款可自由下载的开源AI系统，旨在性能上超越Meta、DeepSeek等竞争对手。该模型拟引入革命性的'任务转交'功能，当遭遇复杂查询时可无缝衔接云端部署的更大规模OpenAI模型进行联合计算。这一技...

2025-05-01 talkingdev

DeepSeek团队近日在GitHub开源了其第二代自动定理证明框架DeepSeek-Prover-V2，该项目迅速获得326个Hacker News点赞和63条技术讨论，显示出学术界和工业界对AI形式化验证工具的高度关注。作为当前最前沿的AI推理系统...

2025-04-28 talkingdev

DeepSeek公司近日宣布将于2025年正式推出新一代人工智能模型DeepSeek-R2，这一重大进展标志着大语言模型技术进入全新发展阶段。根据官方技术博客透露，R2模型将采用创新的混合架构设计，整合了稀疏专家模型(MoE)与密...

2025-04-25 talkingdev

惠普AI Studio推出创新技术方案，通过模型蒸馏技术将前沿大语言模型DeepSeek-R1的推理能力压缩至可在本地设备运行的轻量级版本。该技术突破实现了大模型从云端到本地的迁移，用户可通过Ollama框架进行本地推理部署，...

2025-04-24 talkingdev

最新研究表明，采用混合专家模型（MoE）架构的DeepSeek-V3/R1在多节点GPU部署中展现出显著性能优势。该模型通过创新的资源分配机制，在绝大多数应用场景下同步实现了更高吞吐量和更低延迟的双重突破。技术分析显示，...

2025-04-18 talkingdev

斯坦福大学研究团队最新推出的JudgeLRM模型家族，通过强化学习训练机制在复杂推理评判任务中展现出突破性性能。该技术采用与标准监督微调（SFT）截然不同的训练范式，在需要深度逻辑分析的评估场景下，其综合表现显...

2025-04-18 talkingdev

DeepSeek近期推出的分布式文件系统（DFS）凭借其高性能、高可靠性和可扩展性，成为业界关注的焦点。该系统采用先进的分布式存储架构，支持海量数据的高效管理与快速访问，特别适用于AI训练、大数据分析等场景。DeepS...

2025-04-15 talkingdev

近日，DeepSeek宣布将逐步推进其推理引擎的开源计划，这一举措旨在推动AI技术的普及与创新。DeepSeek推理引擎以其高效的模型推理能力和低延迟特性，在业界广受关注。开源后，开发者将能够自由访问和优化该引擎，进一...