大语言模型的相关内容 - 漫话开发者

2025-11-29 talkingdev

DeepSeekMath-V2模型在IMO 2025与中国奥数2024斩获金牌级表现

中国AI初创公司深度求索（DeepSeek）最新发布的DeepSeekMath-V2数学模型在国际数学奥林匹克竞赛（IMO）2025及中国数学奥林匹克2024中达到金牌级水平，标志着AI在复杂数学推理领域的重大突破。该模型通过创新的推理架...

2025-11-29 talkingdev

近日，开源社区迎来一款突破性的图数据库FalkorDB，该数据库底层采用GraphBLAS技术实现稀疏邻接矩阵图表示，展现出卓越的性能表现。作为专门针对大语言模型优化的知识图谱解决方案，FalkorDB旨在为GraphRAG（图检索...

2025-11-28 talkingdev

近日，GitHub开源项目Better Agents推出了一款专注于AI智能体开发领域的CLI工具及标准化体系。该工具通过交互式命令行界面，逐步引导开发者选择编程语言、智能体框架、编码助手、大语言模型供应商及API密钥配置，显...

2025-11-26 talkingdev

最新行业分析指出，尽管OpenAI和Anthropic等前沿大语言模型开发商将持续进行模型训练，但其训练成本的爆炸式增长并非永久态势。当前这些企业因巨额训练投入处于严重亏损状态，但关键转折点在于年度训练支出增速的放...

2025-11-26 talkingdev

OpenAI联合创始人兼首席科学家Ilya Sutskever在最新访谈中提出重大行业判断：人工智能发展正在经历从‘规模扩张时代’到‘研究驱动时代’的战略转向。他指出当前大语言模型存在根本性局限——‘这些模型在泛化能力上远逊于...

2025-11-25 talkingdev

过去三年间，大语言模型（LLM）的扩展技术经历了显著的技术路线调整。早期以ChatGPT Plugins和模型上下文协议（MCP）为代表的复杂扩展方案，由于模型本身的能力限制和实现复杂度，逐渐被更简洁高效的解决方案取代。...

2025-11-25 talkingdev

Gemini 3的发布标志着人工智能领域的重要转折——从基础对话系统升级为具备自主行动能力的智能体模型。该模型已能独立完成复杂编程任务、设计用户界面及开展学术研究，其能力达到博士级研究水平。虽然仍需人类指导，但...

2025-11-25 talkingdev

人工智能安全与研究公司Anthropic正式发布Claude Opus 4.5模型，标志着可信AI系统建设迈入新阶段。作为专注于构建可靠、可解释与可操控AI系统的先锋企业，Anthropic此次更新延续了其在前沿AI安全技术领域的深度布局...