漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-27 talkingdev

围观o3模型猜测照片拍摄地:超现实、反乌托邦且令人着迷

OpenAI最新发布的o3模型展示了其通过照片猜测拍摄地点的惊人能力,这一技术突破仿佛将科幻小说中的场景带入了现实。用户只需上传一张照片,o3便能基于图像中的视觉线索(如建筑风格、植被类型、车牌信息等)进行地理...

Read More
2025-04-27 talkingdev

MILS开源-无需训练即可实现视觉与听觉感知

Facebook研究团队近日在GitHub开源了MILS项目代码,其核心突破在于证明大型语言模型(LLMs)无需额外训练即可具备跨模态感知能力。该项目论文《LLMs can see and hear without any training》提出创新方法,通过重构...

Read More
2025-04-27 talkingdev

[开源] Stuffed-Na(a)N:为NaN填充数据的创新JavaScript库

近日,GitHub上出现了一个名为Stuffed-Na(a)N的开源项目,该项目旨在解决JavaScript中NaN(Not a Number)值的处理问题。NaN在数值计算中经常出现,但传统的处理方法往往不够灵活。Stuffed-Na(a)N通过提供一种创新的...

Read More
2025-04-26 talkingdev

开发者利用OpenAI图像API打造个性化涂色书服务

一位开发者长期以来的创意构想终于得以实现——通过OpenAI最新发布的图像API,将家庭照片转化为可爱的涂色书图案,并整合印刷服务完成个性化定制。该项目最初尝试使用OpenAI的Sora工具手动处理图片,但单本书籍需耗时...

Read More
2025-04-26 talkingdev

GCC 15.1正式发布:开源编译器迎来重大更新

GNU编译器集合(GCC)15.1版本已正式发布,标志着这一开源编译器工具链的重要里程碑。作为Linux生态系统的基础组件,GCC的更新将直接影响全球数百万开发者的工作流程。本次更新包含了对C++23标准的全面支持、Rust语...

Read More
2025-04-26 talkingdev

重大安全漏洞曝光:HiddenLayer发现影响GPT-4等主流大语言模型的通用提示注入绕过技术

网络安全公司HiddenLayer最新研究揭示了一种影响GPT-4、Claude、Gemini等主流大语言模型(LLM)的通用提示注入绕过技术,该发现暴露了当前LLM安全架构中的重大缺陷。这项被称为'策略木偶提示'(Policy Puppetry Prompt)...

Read More
2025-04-26 talkingdev

[开源] Magnitude:基于视觉大模型的Web应用测试框架,开源发布

开发者Anders和Tom近日在Hacker News上宣布推出Magnitude,一个完全开源的、基于视觉大模型(VLM)的端到端Web应用测试框架。该框架旨在解决传统浏览器代理测试工具速度慢、成本高且结果不一致的问题。Magnitude采用...

Read More
2025-04-26 talkingdev

[论文推荐] 无损压缩大模型:动态长度浮点技术实现70%体积缩减,GPU推理效率飞跃

来自arXiv的最新研究论文提出了一种名为DFloat11的动态长度浮点无损压缩框架,通过创新性地利用LLM权重中BFloat16格式的低熵特性,实现了30%的模型体积缩减,同时保持输出结果与原始模型的比特级一致性。该技术采用...

Read More
  1. Prev Page
  2. 136
  3. 137
  4. 138
  5. Next Page