大型语言模型的相关内容 - 漫话开发者

2025-07-18 talkingdev

苹果发布2025技术报告：揭秘驱动Apple Intelligence的多语言多模态基础模型

苹果公司近期在其机器学习研究官网发布了《Apple Intelligence Foundation Language Models Tech Report 2025》技术报告，正式公开了支撑Apple Intelligence功能的两大核心基础模型。报告显示，这两个模型具备多语言...

2025-07-16 talkingdev

当前，以大型语言模型（LLM）为核心的AI技术正在引发新一轮产业变革。最新技术分析指出，AI代理系统通过LLM实现三大核心功能：情境评估、工具建议与调用、以及工具使用的流程控制。在客户支持和故障分类等实际场景中...

2025-07-16 talkingdev

Block公司近日在GitHub开源了Goose AI代理项目，这是一个突破性的开源AI开发工具。与传统代码建议工具不同，Goose作为可扩展的AI代理，支持包括本地模型在内的任意大型语言模型（LLM）作为后端，提供桌面和命令行（C...

2025-07-14 talkingdev

近期，一篇关于强化学习（RL）如何扩展至惊人10^26 FLOPs（每秒浮点运算次数）的探讨引起了业界广泛关注。文章指出，强化学习被视为构建前沿AI模型，尤其是大型语言模型（LLMs）的下一个核心训练技术。传统观点认为...

2025-07-14 talkingdev

深度学习领域知名专家安德鲁·卡帕西（Andrej Karpathy）近日就强化学习（RL）的规模化应用趋势发表了深刻见解，指出RL的扩展性已成为当前AI研究的焦点。他强调，强化学习在得当的运用下，能够展现出远超监督式微调的...

2025-07-13 talkingdev

月之暗面（Moonshot AI）近日在GitHub上重磅开源了其Kimi K2系列大型语言模型。作为国内领先的AI公司，月之暗面此举不仅展示了其在大模型研发领域的深厚实力，也为全球开源社区贡献了一股重要的力量。Kimi K2系列旨...

2025-07-11 talkingdev

React Native RAG 是一款新库，旨在将检索增强生成（RAG）能力引入 React Native 应用，从而提升大型语言模型（LLM）生成更精确和相关响应的能力。这一库通过两大关键阶段进行操作：首先是文档索引阶段，该阶段涉及...

2025-07-11 talkingdev

随着大型语言模型(LLM)和谷歌AI模式等AI搜索接口的兴起，传统的搜索引擎优化（SEO）方法正逐渐失去效力。在这样一个快速变化的科技环境中，品牌需要将注意力转向生成引擎优化（GEO），以应对不断变化的市场需求。GEO...