漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-04 talkingdev

[论文推荐]CLIP模型存在后门攻击漏洞:仅需少量数据即可实现近100%攻击成功率

最新研究发现,当前广泛应用的CLIP(Contrastive Language-Image Pretraining)多模态模型存在严重的安全隐患。根据arXiv最新论文披露,攻击者通过数据投毒(poisoning)方式植入后门,仅需污染0.5%的训练数据即可实...

Read More
2025-03-31 talkingdev

[论文推荐]Test-Time Visual In-Context Tuning:一种仅需测试样本即可实现视觉模型自适应调优的新方法

近日,一项名为Test-Time Visual In-Context Tuning(TT-VICT)的创新性研究在计算机视觉领域引发广泛关注。该技术突破性地提出仅利用测试样本即可实现视觉上下文学习模型(VICL)的自适应调优,有效解决了传统方法...

Read More
2025-03-26 talkingdev

SISO技术:单张图像驱动的迭代生成与编辑

SISO(Single Image Iterative Subject-driven Generation and Editing)是一种无需训练的推理时优化方法,能够从单张图像中个性化生成或编辑图像内容。该技术通过高效的优化算法,直接在推理阶段实现对图像主体的个...

Read More
2025-03-11 talkingdev

视频修复模型VideoPainter

最新发布的视频修复模型VideoPainter,通过高效结合背景信息,能够处理任意长度的视频。该模型使用了专用的数据集和基准进行训练和评估,不仅在基础修复任务上表现出色,还展现了在高级视频处理和生成相关训练数据方...

Read More
2025-03-02 talkingdev

o1、o3与Sonnet 3.7集体幻觉现象引发技术界关注

近期,技术界对o1、o3以及Sonnet 3.7的集体幻觉现象展开了深入讨论。这一现象不仅引发了广泛关注,还促使研究人员重新审视这些技术的潜在问题。o1、o3和Sonnet 3.7作为当前领先的技术模型,其表现出的幻觉行为可能对...

Read More
2025-02-21 talkingdev

Open Reasoner Zero开源项目发布,推动零推理范式发展

近日,Open Reasoner Zero项目在GitHub上正式发布,该项目旨在复现零推理(Zero Reasoning)范式,并提供了完整的开源资源,包括训练数据、脚本和模型权重。零推理是一种新兴的人工智能推理方法,旨在通过简化推理过...

Read More
2025-02-13 talkingdev

DeepMind突破视觉语言模型预训练规模,1000亿图像助力全球任务性能提升

DeepMind近期在视觉语言模型(VLM)预训练领域取得了重大突破,将训练数据规模提升至前所未有的1000亿张图像。这一规模远超以往尝试,显著提升了模型在多样化全球任务中的表现。尽管在西方中心化任务上的性能已趋于...

Read More
2025-01-01 talkingdev

2024年关于LLMs的三大发现

2024年对于LLM(大型语言模型)而言是充满突破的一年。在这一年中,我们学到了关于LLMs的许多新知识,这不仅推动了人工智能的发展,也为未来的技术应用奠定了基础。首先,我们发现LLMs的参数规模和训练数据量显著增...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page