语言模型的相关内容 - 漫话开发者

2025-07-18 talkingdev

苹果发布2025技术报告：揭秘驱动Apple Intelligence的多语言多模态基础模型

苹果公司近期在其机器学习研究官网发布了《Apple Intelligence Foundation Language Models Tech Report 2025》技术报告，正式公开了支撑Apple Intelligence功能的两大核心基础模型。报告显示，这两个模型具备多语言...

2025-07-17 talkingdev

谷歌宣布为其AI Pro和AI Ultra订阅用户推出搜索功能的重大升级，集成Gemini 2.5 Pro模型并引入深度搜索（Deep Search）技术。这一更新标志着搜索引擎正式进入多轮复杂交互时代，支持用户提交更长查询语句及连续追问...

2025-07-16 talkingdev

当前，以大型语言模型（LLM）为核心的AI技术正在引发新一轮产业变革。最新技术分析指出，AI代理系统通过LLM实现三大核心功能：情境评估、工具建议与调用、以及工具使用的流程控制。在客户支持和故障分类等实际场景中...

2025-07-16 talkingdev

Block公司近日在GitHub开源了Goose AI代理项目，这是一个突破性的开源AI开发工具。与传统代码建议工具不同，Goose作为可扩展的AI代理，支持包括本地模型在内的任意大型语言模型（LLM）作为后端，提供桌面和命令行（C...

2025-07-15 talkingdev

一项名为'基于能量的Transformer'（Energy-Based Transformers）的新型架构在机器学习领域取得突破性进展。该技术摒弃了传统的直接预测方式，转而采用学习验证函数来评估输入与候选输出之间的兼容性得分。这种创新架...

2025-07-14 talkingdev

近期，一篇关于强化学习（RL）如何扩展至惊人10^26 FLOPs（每秒浮点运算次数）的探讨引起了业界广泛关注。文章指出，强化学习被视为构建前沿AI模型，尤其是大型语言模型（LLMs）的下一个核心训练技术。传统观点认为...

2025-07-14 talkingdev

深度学习领域知名专家安德鲁·卡帕西（Andrej Karpathy）近日就强化学习（RL）的规模化应用趋势发表了深刻见解，指出RL的扩展性已成为当前AI研究的焦点。他强调，强化学习在得当的运用下，能够展现出远超监督式微调的...

2025-07-13 talkingdev

月之暗面（Moonshot AI）近日在GitHub上重磅开源了其Kimi K2系列大型语言模型。作为国内领先的AI公司，月之暗面此举不仅展示了其在大模型研发领域的深厚实力，也为全球开源社区贡献了一股重要的力量。Kimi K2系列旨...