DeepSeek的相关内容 - 漫话开发者

2026-07-27 talkingdev

美企AI策略急转弯：从“烧Token”到“极致省钱”，混合中国模型冲击OpenAI等实验室IPO估值

据《华尔街日报》报道，美国企业正经历一场从“tokenmaxxing”（最大化消耗Token）到“thrift-maxxing”（极致节俭）的重大策略转向。越来越多的公司不再单纯依赖 OpenAI 和 Anthropic 的高端模型，而是开始将更便宜的中...

2026-07-22 talkingdev

彭博社报道揭示了一个正在重塑全球AI竞争格局的关键数据：在主流大模型路由平台OpenRouter上，来自中国的AI模型已经贡献了美国企业约60%的Token使用量。这意味着，无论从模型调用频次还是实际算力消耗来看，中国大模...

2026-07-20 talkingdev

阿里巴巴通义千问团队正式公布Qwen3.8，这是一款参数规模高达2.4万亿的超大规模语言模型，并明确表示将以开放权重（Open-Weight）的方式面向全球发布。这不仅是Qwen系列模型参数的又一次飞跃，也反映出阿里巴巴在开...

2026-07-15 talkingdev

据TechCrunch报道，国内大语言模型开发商DeepSeek正在与投资者洽谈约15亿美元的新一轮融资，投前估值已高达710亿美元。与此同时，该公司被曝正为2027年首次公开募股（IPO）做准备。这一动作标志着DeepSeek在经历模型...

2026-07-15 talkingdev

据The Information援引知情人士消息，中国开源AI明星企业DeepSeek的年度经常性收入近期已达到4亿至5亿美元区间，展现出强劲的商业化增长势头。在这一业绩支撑下，公司正积极推进第二轮融资，计划筹集约74亿美元资金...

2026-06-30 talkingdev

DeepSeek近日正式开源了一款名为DSpark的创新框架，旨在显著加速大型语言模型（LLM）的推理过程，据称最高能将解码速度提升85%。这一突破性进展直接针对当前AI大模型在实际应用中普遍存在的响应延迟痛点。与传统模型...

2026-05-29 talkingdev

在人工智能领域，开源模型的性能与顶尖闭源模型之间的差距一直是业界关注的焦点。最近一篇来自LessWrong平台的深入分析指出，尽管开源模型在整体能力上仍不及GPT-4、Claude等最先进的闭源模型，但实际差距并没有想象...

2026-05-04 talkingdev

在AI大模型应用领域，成本与性能的平衡一直是开发者关注的焦点。近日，一款名为DeepClaude的开源工具在开发者社区引发热议。该项目巧妙地将DeepSeek V4 Pro模型与Claude Code的代理循环（Agent Loop）进行结合，旨在...