漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-03 talkingdev

谷歌DeepMind发布Gemma 4:基于Gemma 3技术构建,支持140种语言的多模态推理

谷歌DeepMind近日正式发布了Gemma 4系列开源模型,标志着其在开放人工智能模型领域迈出了重要一步。该系列模型基于其旗舰Gemma 3技术构建,核心优化方向是“单位参数智能效率”,即在保持模型参数规模相对可控的同时,...

Read More
2026-04-03 talkingdev

通义千问Qwen3.6-Plus发布:迈向原生多模态智能体,开启“氛围编程”新体验

阿里云通义千问团队近日发布了其最新旗舰模型Qwen3.6-Plus,标志着其在构建面向真实世界的智能体(Agents)道路上迈出了关键一步。该模型在多模态感知与推理能力上实现了显著提升,能够更精准地理解世界,为开发者生...

Read More
2026-04-03 talkingdev

开源巨作!Arcee AI发布3990亿参数MoE模型Trinity-Large-Thinking,Apache 2.0许可商用无忧

在ChatGPT于2022年底掀起生成式AI浪潮后,开源大模型的接力棒在多家公司间传递。近日,美国AI初创公司Arcee AI正式发布了其重量级开源模型——Trinity-Large-Thinking。该模型采用混合专家架构,参数量高达3990亿,是...

Read More
2026-04-02 talkingdev

开源|富士通发布OneComp:面向大语言模型的后训练量化开源库

富士通研究院近日开源了名为“OneCompression”(简称OneComp)的Python库,这是一个专门用于大语言模型后训练量化的工具。该库集成了当前最先进的量化算法,包括GPTQ和DBF,旨在帮助开发者和研究人员高效地将庞大的LL...

Read More
2026-03-31 talkingdev

开源|Universal Claude.md:无需修改代码,即可将Claude输出Token削减63%

近日,GitHub上出现了一个名为‘claude-token-efficient’的开源项目,其核心是引入一个名为‘Universal CLAUDE.md’的配置文件方案。该项目宣称,通过简单的‘即插即用’方式,无需对现有代码进行任何修改,即可将Anthrop...

Read More
2026-03-30 talkingdev

开源|AutoBe革命性突破:函数调用成功率从6.75%跃升至99.8%,AI自动生成后端代码迈入新阶段

近日,开源AI智能体项目AutoBe发布了一项突破性技术成果,其开发的‘函数调用约束框架’将大型语言模型在生成复杂后端API数据类型时的成功率,从原始的6.75%大幅提升至超过99.8%。这一进展标志着AI在自动化软件开发,...

Read More
2026-03-25 talkingdev

性能翻倍!Ray Data LLM实现生产级大模型批量推理吞吐量超越vLLM同步引擎

随着大语言模型(LLM)应用场景的不断拓展,越来越多的现代工作负载,如大规模内容生成、数据清洗和批量分析等,其核心诉求已从追求单个请求的低延迟,转向了优先保障整体吞吐量。然而,当前许多LLM系统和部署方案仍...

Read More
2026-03-23 talkingdev

开源|Project N.O.M.A.D.:一款集成AI与离线知识库的生存级便携服务器

近日,GitHub上出现了一个名为Project N.O.M.A.D.(Node for Offline Media, Archives, and Data)的开源项目,它是一款自包含、优先离线的知识服务器,旨在为用户提供无需互联网连接的工具、教育资源和人工智能能力...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page