思维机器实验室最新研究揭示了低秩适配技术(LoRA)在大语言模型微调领域的突破性表现。这项发表于权威平台的研究表明,当LoRA应用于模型所有层(尤其是MLP层)且不受数据集规模限制时,其性能可完全媲美传统全参数...
Read More科技巨头IBM近日正式推出Granite 4.0大语言模型系列,该开源方案采用创新的混合架构设计,宣称相比传统LLM可大幅降低内存占用。作为拥有114年历史的科技企业,IBM此次发布的模型特别强调“企业就绪”特性,通过结合Mam...
Read More当前多智能体AI系统面临的核心瓶颈在于缺乏有效的共享记忆基础设施。尽管上下文工程通过‘在正确时间提供正确信息’提升了单智能体性能,但当多个智能体需要协同工作时,这种架构就会失效。最新研究提出‘内存工程’解决...
Read MoreSlack正通过创新技术架构彻底改变AI代理访问企业数据的方式。该平台最新推出的实时搜索API和模型上下文协议服务器,允许第三方开发者在获得权限的前提下,直接接入Slack渠道中的对话流、消息记录及文件资源。这一突...
Read More谷歌开发者博客最新推出开源项目Tunix,这是一个基于JAX框架原生设计的专业化工具库,致力于简化大型语言模型从预训练到完全对齐、生产就绪的完整流程。该库为开发者提供了一套全面且友好的工具集,支持大规模模型对...
Read MoreThinking Machines实验室近日正式发布Tinker API,这一创新平台为开源权重语言模型的精细化调优提供了灵活接口。该技术通过抽象化底层基础设施复杂度,显著降低了开发者部署大型语言模型的技术门槛。特别值得关注的...
Read More近日,科技社区针对三大AI编程助手——Codex、Claude Code和Cursor展开深度横评,从功能特性、定价策略到用户体验进行多维度剖析。作为OpenAI推出的代码生成模型,Codex凭借其与GitHub生态系统的深度整合脱颖而出,能...
Read More智谱AI正式推出新一代开源权重模型GLM-4.6,该模型最突出的特性是支持高达200K tokens的上下文窗口,使其能够处理更长的文档和复杂任务链。官方宣称在编程与逻辑推理任务上已接近Anthropic公司发布的Claude Sonnet 4...
Read More