漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-28 talkingdev

Pippo开源:单张图生成高分辨率多视角3D模型

Meta研究院推出的Pippo项目突破传统三维重建技术限制,开发了一套无需预训练模型的虚拟人体生成系统。该系统仅需输入单张二维人像,即可输出具有高保真细节的多视角3D人体表征,其核心技术可能涉及神经辐射场(NeRF...

Read More
2025-04-28 talkingdev

DeepSeek发布2025年新一代AI模型R2,引领大语言模型技术革新

DeepSeek公司近日宣布将于2025年正式推出新一代人工智能模型DeepSeek-R2,这一重大进展标志着大语言模型技术进入全新发展阶段。根据官方技术博客透露,R2模型将采用创新的混合架构设计,整合了稀疏专家模型(MoE)与密...

Read More
2025-04-26 talkingdev

围观o3模型猜测照片拍摄地:超现实、反乌托邦且令人着迷

OpenAI最新发布的o3模型展示了其通过照片猜测拍摄地点的惊人能力,这一技术突破仿佛将科幻小说中的场景带入了现实。用户只需上传一张照片,o3便能基于图像中的视觉线索(如建筑风格、植被类型、车牌信息等)进行地理...

Read More
2025-04-26 talkingdev

MILS开源-无需训练即可实现视觉与听觉感知

Facebook研究团队近日在GitHub开源了MILS项目代码,其核心突破在于证明大型语言模型(LLMs)无需额外训练即可具备跨模态感知能力。该项目论文《LLMs can see and hear without any training》提出创新方法,通过重构...

Read More
2025-04-25 talkingdev

重大安全漏洞曝光:HiddenLayer发现影响GPT-4等主流大语言模型的通用提示注入绕过技术

网络安全公司HiddenLayer最新研究揭示了一种影响GPT-4、Claude、Gemini等主流大语言模型(LLM)的通用提示注入绕过技术,该发现暴露了当前LLM安全架构中的重大缺陷。这项被称为'策略木偶提示'(Policy Puppetry Prompt)...

Read More
2025-04-25 talkingdev

[开源] Magnitude:基于视觉大模型的Web应用测试框架,开源发布

开发者Anders和Tom近日在Hacker News上宣布推出Magnitude,一个完全开源的、基于视觉大模型(VLM)的端到端Web应用测试框架。该框架旨在解决传统浏览器代理测试工具速度慢、成本高且结果不一致的问题。Magnitude采用...

Read More
2025-04-25 talkingdev

[论文推荐] 无损压缩大模型:动态长度浮点技术实现70%体积缩减,GPU推理效率飞跃

来自arXiv的最新研究论文提出了一种名为DFloat11的动态长度浮点无损压缩框架,通过创新性地利用LLM权重中BFloat16格式的低熵特性,实现了30%的模型体积缩减,同时保持输出结果与原始模型的比特级一致性。该技术采用...

Read More
2025-04-25 talkingdev

HP AI Studio助力本地化部署:将DeepSeek-R1大模型蒸馏至个人设备

惠普AI Studio推出创新技术方案,通过模型蒸馏技术将前沿大语言模型DeepSeek-R1的推理能力压缩至可在本地设备运行的轻量级版本。该技术突破实现了大模型从云端到本地的迁移,用户可通过Ollama框架进行本地推理部署,...

Read More
  1. Prev Page
  2. 19
  3. 20
  4. 21
  5. Next Page