谷歌DeepMind近日正式发布了Gemma 4系列开源模型,标志着其在开放人工智能模型领域迈出了重要一步。该系列模型基于其旗舰Gemma 3技术构建,核心优化方向是“单位参数智能效率”,即在保持模型参数规模相对可控的同时,...
Read More阿里云通义千问团队近日发布了其最新旗舰模型Qwen3.6-Plus,标志着其在构建面向真实世界的智能体(Agents)道路上迈出了关键一步。该模型在多模态感知与推理能力上实现了显著提升,能够更精准地理解世界,为开发者生...
Read More在ChatGPT于2022年底掀起生成式AI浪潮后,开源大模型的接力棒在多家公司间传递。近日,美国AI初创公司Arcee AI正式发布了其重量级开源模型——Trinity-Large-Thinking。该模型采用混合专家架构,参数量高达3990亿,是...
Read More富士通研究院近日开源了名为“OneCompression”(简称OneComp)的Python库,这是一个专门用于大语言模型后训练量化的工具。该库集成了当前最先进的量化算法,包括GPTQ和DBF,旨在帮助开发者和研究人员高效地将庞大的LL...
Read More近日,GitHub上出现了一个名为‘claude-token-efficient’的开源项目,其核心是引入一个名为‘Universal CLAUDE.md’的配置文件方案。该项目宣称,通过简单的‘即插即用’方式,无需对现有代码进行任何修改,即可将Anthrop...
Read More近日,开源AI智能体项目AutoBe发布了一项突破性技术成果,其开发的‘函数调用约束框架’将大型语言模型在生成复杂后端API数据类型时的成功率,从原始的6.75%大幅提升至超过99.8%。这一进展标志着AI在自动化软件开发,...
Read More随着大语言模型(LLM)应用场景的不断拓展,越来越多的现代工作负载,如大规模内容生成、数据清洗和批量分析等,其核心诉求已从追求单个请求的低延迟,转向了优先保障整体吞吐量。然而,当前许多LLM系统和部署方案仍...
Read More近日,GitHub上出现了一个名为Project N.O.M.A.D.(Node for Offline Media, Archives, and Data)的开源项目,它是一款自包含、优先离线的知识服务器,旨在为用户提供无需互联网连接的工具、教育资源和人工智能能力...
Read More