漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-25 talkingdev

无需训练的个性化图像生成技术SISO问世

近日,一项名为SISO的突破性技术引发了业界广泛关注。该技术通过在图像生成和编辑过程中迭代优化相似性损失,实现了无需训练的个性化处理。这一创新意味着用户可以在不进行复杂模型训练的情况下,快速生成或编辑出符...

Read More
2025-03-25 talkingdev

[论文推荐] LLaVA-MORE:多模态大语言模型的系统性评估框架

LLaVA-MORE 是一项关于多模态大语言模型(Multimodal Large Language Models, MLLMs)的系统性研究,旨在评估不同语言模型和视觉骨干网络在 MLLMs 中的表现,并提供一个可复现的框架来比较这些架构。通过该研究,研...

Read More
2025-03-25 talkingdev

Reve图像生成器以低价挑战MidJourney和Flux,每张仅需1美分

Reve Image 1.0 是一款AI图像生成器,其定价策略和生成质量在市场上具有显著竞争力,甚至可能超越Midjourney和Ideogram等行业巨头。该工具以5美元提供500次生成额度,每张图像的成本仅为1美分,使得高质量图像生成变...

Read More
2025-03-25 talkingdev

Roblox开源Cube 3D AI模型,文本生成3D对象助力创作效率提升

Roblox近日开源了其最新的AI模型Cube 3D,该模型能够通过文本提示生成3D对象,旨在提升创作效率。Cube 3D采用了先进的标记化技术,并通过授权和公开可用的数据集,以及Roblox自身的体验数据进行训练。未来,Cube 3D...

Read More
2025-03-24 talkingdev

[开源]LHM模型:单张图像秒速生成可动画的3D人体模型

近日,GitHub上发布了一个名为LHM(Large Animatable Human Reconstruction Model)的开源项目,该项目展示了如何通过单张图像快速生成一个完全可动画的3D人体模型。这一技术突破不仅展示了计算机视觉领域的重大进展...

Read More
2025-03-24 talkingdev

Hugging Face 实时终端分析功能全新升级

Hugging Face近期对其分析仪表盘进行了重大升级,新增了实时更新的AI推理终端监控功能。这一改进不仅显著加快了数据加载速度,还提供了关于请求延迟、错误率和性能指标的即时洞察。此次升级将使开发者能够更高效地监...

Read More
2025-03-20 talkingdev

Stability发布沉浸式3D视频生成技术:Stable Virtual Camera

近日,Stability推出了一项名为Stable Virtual Camera的创新技术,该技术基于一种多视角扩散模型,能够从单张或多张2D图像中生成沉浸式3D视频。这一技术允许用户自定义或预设相机轨迹,从而实现对3D场景的灵活控制。...

Read More
2025-03-20 talkingdev

[论文推荐]AI完成长任务能力的“摩尔定律”:任务时长每7个月翻倍

近期,一项关于智能体任务时长能力的研究揭示了一个新的“摩尔定律”现象:智能体能够完成的任务长度每7个月翻倍。这一发现意味着,在未来的两年内,智能体将能够完成包含多个复杂步骤、时长达到数小时的任务。这一进...

Read More
  1. Prev Page
  2. 63
  3. 64
  4. 65
  5. Next Page