开源模型的相关内容 - 漫话开发者

2026-04-13 talkingdev

AI网络安全新格局：神话之后，迎来“锯齿状前沿”

近期一项针对2026年重大漏洞的测试揭示，人工智能在网络安全领域的应用能力正呈现一种“锯齿状前沿”现象。测试结果表明，小型开源权重模型在漏洞发现与逻辑推理方面的表现，常常能与Anthropic的Mythos等大型专有模型...

2026-04-10 talkingdev

据《金融时报》报道，阿里巴巴集团近期进行了一次重要的人事与战略调整。集团已任命阿里云首席技术官周靖人兼任其人工智能（AI）部门的负责人。这一变动紧随公司AI战略的重大转向而发生：阿里巴巴正将其通义千问（Qw...

2026-04-07 talkingdev

Meta公司正加速推进其新一代人工智能模型的发布进程。据最新报道，该公司即将推出的一系列AI模型中，部分将最终以开源许可证的形式向公众开放。这一举措延续了Meta此前通过Llama系列模型所践行的开源路线。公司首席...

2026-04-03 talkingdev

谷歌DeepMind近日正式发布了Gemma 4系列开源模型，标志着其在开放人工智能模型领域迈出了重要一步。该系列模型基于其旗舰Gemma 3技术构建，核心优化方向是“单位参数智能效率”，即在保持模型参数规模相对可控的同时，...

2026-04-03 talkingdev

谷歌DeepMind正式推出了新一代开源模型系列Gemma 4，该系列模型基于其旗舰模型Gemini 3的研究成果构建，被官方称为“迄今为止最智能的开源模型”。Gemma 4的核心优化方向聚焦于复杂的推理能力和智能体（Agent）工作流...

2026-04-03 talkingdev

在ChatGPT于2022年底掀起生成式AI浪潮后，开源大模型的接力棒在多家公司间传递。近日，美国AI初创公司Arcee AI正式发布了其重量级开源模型——Trinity-Large-Thinking。该模型采用混合专家架构，参数量高达3990亿，是...

2026-04-02 talkingdev

近日，OpenMed团队在Hugging Face平台发布了一项重要成果，展示了其构建的端到端蛋白质AI全流程。该流程涵盖了蛋白质结构预测、序列设计以及关键的密码子优化环节。研究团队对多种Transformer架构进行了深入的密码子...

2026-04-02 talkingdev

富士通研究院近日开源了名为“OneCompression”（简称OneComp）的Python库，这是一个专门用于大语言模型后训练量化的工具。该库集成了当前最先进的量化算法，包括GPTQ和DBF，旨在帮助开发者和研究人员高效地将庞大的LL...