漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-29 talkingdev

DeepMind发布AlphaFold 3升级版:可预测DNA、RNA及分子结构,精度全面提升

DeepMind最新推出的AlphaFold 3在分子结构预测领域实现重大突破,新增了对DNA、RNA及各类分子结构的预测能力,同时显著提升了复杂分子间相互作用的预测精度。这一突破性工具现通过欧洲分子生物学实验室(EMBL-EBI)...

Read More
2025-04-29 talkingdev

[论文推荐]ReLearn:大语言模型高效遗忘学习的数据增强与微调方案

来自arXiv的最新研究论文提出ReLearn框架,通过创新的数据增强和微调技术,解决了大语言模型(LLMs)中的关键挑战——'遗忘学习'(Unlearning)。该技术可精准移除模型训练数据中的特定信息,同时保持整体性能,对数据...

Read More
2025-04-28 talkingdev

[论文推荐]华为提出轻量级神经应用控制新方法

华为研究人员在arXiv最新论文中提出了一种创新性的轻量级神经应用控制技术,该技术利用视觉语言模型(VLMs)实现Android设备的应用控制,且仅需极少的额外系统配置。这一突破性进展标志着多模态AI在移动终端交互领域的...

Read More
2025-04-28 talkingdev

DeepSeek发布2025年新一代AI模型R2,引领大语言模型技术革新

DeepSeek公司近日宣布将于2025年正式推出新一代人工智能模型DeepSeek-R2,这一重大进展标志着大语言模型技术进入全新发展阶段。根据官方技术博客透露,R2模型将采用创新的混合架构设计,整合了稀疏专家模型(MoE)与密...

Read More
2025-04-26 talkingdev

MILS开源-无需训练即可实现视觉与听觉感知

Facebook研究团队近日在GitHub开源了MILS项目代码,其核心突破在于证明大型语言模型(LLMs)无需额外训练即可具备跨模态感知能力。该项目论文《LLMs can see and hear without any training》提出创新方法,通过重构...

Read More
2025-04-25 talkingdev

重大安全漏洞曝光:HiddenLayer发现影响GPT-4等主流大语言模型的通用提示注入绕过技术

网络安全公司HiddenLayer最新研究揭示了一种影响GPT-4、Claude、Gemini等主流大语言模型(LLM)的通用提示注入绕过技术,该发现暴露了当前LLM安全架构中的重大缺陷。这项被称为'策略木偶提示'(Policy Puppetry Prompt)...

Read More
2025-04-25 talkingdev

[论文推荐] 无损压缩大模型:动态长度浮点技术实现70%体积缩减,GPU推理效率飞跃

来自arXiv的最新研究论文提出了一种名为DFloat11的动态长度浮点无损压缩框架,通过创新性地利用LLM权重中BFloat16格式的低熵特性,实现了30%的模型体积缩减,同时保持输出结果与原始模型的比特级一致性。该技术采用...

Read More
2025-04-25 talkingdev

HP AI Studio助力本地化部署:将DeepSeek-R1大模型蒸馏至个人设备

惠普AI Studio推出创新技术方案,通过模型蒸馏技术将前沿大语言模型DeepSeek-R1的推理能力压缩至可在本地设备运行的轻量级版本。该技术突破实现了大模型从云端到本地的迁移,用户可通过Ollama框架进行本地推理部署,...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page