清华大学知识工程组(KEG)与智谱AI联合推出的CogView 4最新一代生成式图像模型近日在Hugging Face平台正式发布。作为采用宽松许可协议的开源项目,该模型在图像质量、生成效率和多模态理解等核心指标上显著超越当前...
Read More来自arXiv的最新研究论文提出ReLearn框架,通过创新的数据增强和微调技术,解决了大语言模型(LLMs)中的关键挑战——'遗忘学习'(Unlearning)。该技术可精准移除模型训练数据中的特定信息,同时保持整体性能,对数据...
Read MoreNari Labs最新发布的Dia-1.6B开源AI模型在情绪语音合成领域取得突破性进展。这款仅1.6B参数的微型模型在测试中展现出超越ElevenLabs和Sesame等行业领导者的表现,尤其擅长模拟极端情绪状态,如歇斯底里的恐怖尖叫。...
Read MoreDeepSeek公司近日宣布将于2025年正式推出新一代人工智能模型DeepSeek-R2,这一重大进展标志着大语言模型技术进入全新发展阶段。根据官方技术博客透露,R2模型将采用创新的混合架构设计,整合了稀疏专家模型(MoE)与密...
Read More网络安全公司HiddenLayer最新研究揭示了一种影响GPT-4、Claude、Gemini等主流大语言模型(LLM)的通用提示注入绕过技术,该发现暴露了当前LLM安全架构中的重大缺陷。这项被称为'策略木偶提示'(Policy Puppetry Prompt)...
Read More最新研究表明,生成式AI模型已具备在漏洞披露后极短时间内生成概念验证攻击代码的能力。以GPT-4为例,该模型成功针对Erlang SSH关键漏洞生成了有效攻击代码,整个过程仅需数小时。这一突破性进展凸显了网络安全领域...
Read More新加坡国立大学SAIL实验室推出的FlowReasoner项目,开创性地将强化学习与外部反馈机制相结合,构建了一个可自主生成定制化多智能体系统的元推理框架。该技术突破性地实现了三大创新:1) 通过动态推理引擎解析用户查...
Read More大型语言模型(LLM)在训练、评估或实施阶段常因被忽视的问题而表现不佳。图灵公司推出的5分钟快速评估工具,可帮助企业精准定位所处发展阶段,并明确后续优先事项。该工具提供三大核心价值:快速诊断组织的AI准备成熟...
Read More