漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-15 talkingdev

Meta发布DINOv3:可扩展的自监督视觉模型,多领域实现SOTA性能

Meta公司最新推出的DINOv3是一种可扩展的自监督学习模型,在包括网络图像和卫星图像在内的多种图像领域均实现了最先进的性能表现。这一突破性技术采用自监督学习范式,无需依赖大量标注数据即可从海量无标签图像中学...

Read More
2025-08-05 talkingdev

开源|Qwen-Image:突破性图像基础模型实现原生文本渲染

Qwen-Image作为一款200亿参数的MMDiT架构图像基础模型,在复杂文本渲染和精准图像生成领域取得重大突破。该模型不仅能实现多语言(包括字母文字和表意文字)的多行文本布局和段落级语义生成,还能保持编辑过程中的语...

Read More
2025-07-18 talkingdev

苹果发布2025技术报告:揭秘驱动Apple Intelligence的多语言多模态基础模型

苹果公司近期在其机器学习研究官网发布了《Apple Intelligence Foundation Language Models Tech Report 2025》技术报告,正式公开了支撑Apple Intelligence功能的两大核心基础模型。报告显示,这两个模型具备多语言...

Read More
2025-07-16 talkingdev

React Native Apple LLM:让React Native应用接入苹果设备端基础模型

近日,GitHub上出现了一个名为`react-native-apple-llm`的开源插件,该插件允许React Native开发者直接调用苹果设备端的Foundation Models(基础模型)来完成AI任务。这一技术突破为移动应用开发者提供了更便捷的AI...

Read More
2025-07-04 talkingdev

强化学习优化代码合并:Osmosis-Apply-1.7B以低成本超越大型基础模型

Osmosis-Apply-1.7B是基于Qwen3-1.7B模型通过强化学习微调而成的专用模型,在代码合并任务中表现出色,其奖励分数高达0.9893,甚至超越了OpenAI o3等更大规模的基础模型,同时显著降低了成本。该模型在CommitPackFT...

Read More
2025-07-03 talkingdev

谷歌Veo 3视频生成模型:迈向可交互世界模型的第一步?

谷歌最新发布的视频生成模型Veo 3展现出突破性潜力,其技术路线可能为游戏开发领域带来革新。与传统视频生成模型不同,世界模型(World Models)的核心在于模拟真实环境的动态交互机制,而Veo 3虽尚未达到完整世界模...

Read More
2025-06-12 talkingdev

[开源]Weak-to-Strong Decoding:小模型引导大模型实现高效对齐的新方法

近日,GitHub上开源了一项名为Weak-to-Strong Decoding(WSD)的创新技术,该方法通过让小型的对齐模型(aligned model)生成回答的开头部分,再由大型基础模型(base model)继续完成后续内容,从而在保持模型性能...

Read More
2025-06-10 talkingdev

顶级AI创始人如何构建与SaaS时代完全相反的产品

在人工智能领域,一场颠覆传统软件开发范式的变革正在悄然发生。与SaaS时代'客户需求导向'的产品开发模式截然不同,新一代AI创始人正采用全新的方法论——他们不再被动询问客户需求,而是主动探索如何将AI能力和模型深...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page