漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-04 talkingdev

LightningDiT:通过潜在空间对齐提升扩散模型性能

近日,GitHub上的开源项目LightningDiT引起了广泛关注。该项目通过将潜在空间与视觉模型对齐,成功解决了扩散模型中的一些关键挑战。LightningDiT不仅在ImageNet-256数据集上取得了最先进的成果,还显著加快了训练速...

Read More
2025-02-28 talkingdev

CoT-UQ框架:为大型语言模型引入链式思维不确定性量化

近日,GitHub上发布了一个名为CoT-UQ的创新框架,该框架旨在为大型语言模型(LLM)提供响应层面的不确定性量化。CoT-UQ通过集成链式思维(Chain-of-Thought, CoT)推理,能够更精确地评估模型在生成响应时的置信度。...

Read More
2025-02-28 talkingdev

ModelScope推出Diffusion Studio:为扩散模型提供高效抽象平台

ModelScope近日发布了Diffusion Studio,这是一个基于GitHub的开源平台和代码库,旨在为多种类型的扩散模型及其相关的自动编码器提供高效的抽象支持。Diffusion Studio通过简化复杂模型的开发流程,帮助研究人员和开...

Read More
2025-02-28 talkingdev

DeepSeek开源DualPipe:创新并行策略提升模型计算与通信效率

近日,DeepSeek在GitHub上发布了名为DualPipe的开源项目,展示了其在模型并行计算领域的最新研究成果。DualPipe采用了一种新颖的并行策略,旨在优化模型的计算与通信重叠,从而显著提升整体性能。这一策略通过高效的...

Read More
2025-02-27 talkingdev

AISafetyLab:全面AI安全框架开源,涵盖攻击、防御与评估

近日,AISafetyLab在GitHub上发布了一个全面的AI安全框架,旨在为研究人员和开发者提供一套完整的工具集,以应对AI系统中的安全问题。该框架不仅包含了多种模型和数据集,还提供了实用的工具和一系列与AI安全相关的...

Read More
2025-02-26 talkingdev

基于DiNO 2的视线估计算法在GitHub开源,助力商业与安全应用

近日,一款基于DiNO 2的视线估计算法在GitHub上开源,该算法能够高效地估计人们的视线方向,为商业、制造业和安全领域提供了重要的技术支持。视线估计技术通过分析人眼的注视点,可以广泛应用于零售场景中的消费者行...

Read More
2025-02-26 talkingdev

R1-OneVision:多模态推理模型在复杂视觉任务中的突破

近日,R1-OneVision作为一种多功能的大型多模态模型,正式在GitHub上发布。该模型通过整合视觉与文本数据,在数学、科学、深度图像理解及逻辑推理等复杂任务中表现出色。R1-OneVision的设计旨在解决传统单一模态模型...

Read More
2025-02-26 talkingdev

LightningDiT:高效模块化扩散模型工具包助力生成式AI应用

近日,一款名为LightningDiT的高效模块化扩散模型工具包在GitHub上发布,旨在为生成式AI应用提供可扩展且多功能的解决方案。LightningDiT通过优化模型架构和训练流程,显著提升了生成式AI的性能和效率。该工具包支持...

Read More
  1. Prev Page
  2. 54
  3. 55
  4. 56
  5. Next Page