R1的相关内容 - 漫话开发者

2025-06-20 talkingdev

LLM时代推荐与搜索系统的革新：语义ID与生成式检索的崛起

在大型语言模型（LLM）时代，推荐与搜索系统正经历从传统物品ID到丰富'语义ID'（Semantic IDs）的重大转型。这一变革引入了生成式检索和多模态嵌入技术，显著提升了系统处理冷启动覆盖、长尾内容发现的能力，并实现...

2025-06-18 talkingdev

人工智能公司MiniMax在GitHub开源了其4560亿参数规模的推理模型M1，该模型采用创新的混合专家架构（MoE）并引入'闪电注意力'技术，实现百万token级别的超长上下文处理能力（相当于DeepSeek R1的8倍）。特别值得注意...

2025-06-17 talkingdev

Together AI宣布在其Serverless Inference API和专用端点服务中集成两大前沿AI模型：DeepSeek R1-0528语言模型与FLUX.1 Kontext图像生成系统。DeepSeek R1-0528通过升级的推理能力、函数调用支持及代码生成优化，显...

2025-05-29 talkingdev

人工智能研究公司DeepSeek近日宣布对其R1推理模型进行重大升级，并将最新版本发布于Hugging Face平台。这一进展标志着自然语言处理领域的重要突破，R1模型以其卓越的推理能力和高效的参数利用在业界备受关注。此次更...

2025-05-29 talkingdev

在数字化转型浪潮中，企业合规流程的自动化已成为不可逆转的趋势。Delve公司最新推出的AI合规代理解决方案，彻底改变了传统合规审计的作业模式。该技术突破不仅能够自动填写表单，更能深度理解企业的技术架构，实现...

2025-05-29 talkingdev

DeepSeek团队在Hugging Face平台发布了最新的大语言模型DeepSeek-R1-0528，引发了技术社区的广泛关注。该模型在Hacker News上获得了330个点赞和148条评论，显示出业界对其技术价值的认可。作为开源大模型领域的重要...

2025-05-27 talkingdev

GitHub开源项目ConvSearch-R1提出了一种创新的自监督对话搜索技术，通过强化学习和基于检索的奖励机制，实现了无需外部监督的对话查询重构。该技术利用强化学习框架，将用户对话中的模糊查询自动转化为精准的搜索语...

2025-05-20 talkingdev

GitHub最新开源项目展示了一种针对Qwen2.5B大语言模型的创新微调方案，该方案采用SFT（监督微调）结合GRPO（梯度反向传播优化）的混合训练框架，其技术路线受到DeepSeek R1架构启发，并针对AWS云平台进行了专项优化...