漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-20 talkingdev

Stability发布沉浸式3D视频生成技术:Stable Virtual Camera

近日,Stability推出了一项名为Stable Virtual Camera的创新技术,该技术基于一种多视角扩散模型,能够从单张或多张2D图像中生成沉浸式3D视频。这一技术允许用户自定义或预设相机轨迹,从而实现对3D场景的灵活控制。...

Read More
2025-03-20 talkingdev

[开源]AAPM 2025挑战赛:开源代码助力剂量预测模型开发

在医疗技术不断进步的今天,精准的剂量预测模型对于放射治疗至关重要。AAPM 2025挑战赛(GDP-HMM Challenge)旨在推动这一领域的发展,而最近在GitHub上发布的开源代码库为参赛者提供了宝贵的资源。该代码库不仅包含...

Read More
2025-03-20 talkingdev

[开源] Hugging Face的R1项目复现(GitHub仓库)

Hugging Face的Open-R1项目旨在提供一个更为稳健和功能完备的解决方案,同时保持其最小化和可扩展性。该项目通过增加监督微调(SFT)步骤和数据蒸馏技术,进一步提升了模型的性能和适应性。这些改进使得Open-R1在处...

Read More
2025-03-20 talkingdev

Concierge AI:用自然语言与你的应用程序对话

随着人工智能技术的飞速发展,Concierge AI 提供了一个创新的解决方案,使用户能够通过自然语言无缝连接和操作各种应用程序。无论是电子邮件、日历、文件管理还是支付系统,用户只需选择其偏好的 AI 模型(如 GPT、C...

Read More
2025-03-19 talkingdev

无需额外训练,通过Diffusion Transformer实现图像个性化

最新的技术突破使得我们几乎可以通过在Diffusion Transformer中使用token替换来实现对任何图像的个性化,而无需进行额外的微调或训练。这一创新方法不仅大大简化了个性化图像的生成过程,还显著提高了效率。Diffusio...

Read More
2025-03-19 talkingdev

谷歌新型机器人AI实现精细折纸与拉链袋无损操作

谷歌DeepMind近日发布了Gemini Robotics和Gemini Robotics-ER两款AI模型,显著提升了机器人的精细运动技能和现实应用中的适应性。Gemini Robotics整合了视觉、语言与行动能力,使机器人能够完成如折纸等复杂任务。初...

Read More
2025-03-19 talkingdev

[开源] Stability AI发布多视角虚拟相机系统,支持新颖视图合成

Stability AI近日发布了一款强大的多视角虚拟相机系统,该系统能够实现新颖视图合成(Novel View Synthesis),为用户提供了一种高效且非商业化的解决方案。虽然该技术尚未达到行业最先进水平,但其优势在于仅需两次...

Read More
2025-03-19 talkingdev

Roblox开源其生成式3D模型Cube,革新虚拟世界创作

Roblox近日宣布开源其生成式AI系统Cube,该系统专注于3D和4D模型的生成。Cube的Beta版本将被集成到Roblox Studio中,并作为Lua API供开发者使用。这一重大技术突破不仅展示了Roblox在生成式AI领域的深厚积累,更预示...

Read More
  1. Prev Page
  2. 81
  3. 82
  4. 83
  5. Next Page