漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-12 talkingdev

DeepMind推出革命性图像-文本模型TIPS,刷新多领域性能标杆

DeepMind近日发布了名为TIPS的新型图像-文本模型,专为密集型和全局视觉任务设计。该模型通过结合对比学习与掩码图像建模技术,并利用合成字幕进行训练,显著提升了空间感知能力。在多项基准测试中,TIPS的表现均超...

Read More
2025-03-12 talkingdev

感知高效重建(GitHub Repo):文本查询与3D重建的融合

在计算机视觉和人工智能领域,3D重建技术一直是一个重要的研究方向。最近,GitHub上出现了一个名为“Perception Efficient Reconstruction”(PE3R)的项目,该项目将文本查询功能与从图像中进行3D重建的技术相结合,...

Read More
2025-03-12 talkingdev

YoloE:实现实时开放词汇检测的小型视觉模型

YoloE 是一种创新的小型视觉模型,能够通过多种方式进行提示,以实现开放词汇检测。这意味着用户可以使用类别、图像和文本来决定模型应该检测的内容。特别值得一提的是,YoloE 的运行速度高达 300 帧每秒(fps),使...

Read More
2025-03-12 talkingdev

[论文推荐] 广义离散扩散: 提升文本数据去噪效率与自校正能力

在最新的研究进展中,科学家提出了一种广义离散扩散方法,该方法显著改进了在文本等离散数据上的扩散过程。这一创新通过引入一种广义的去噪过程和略微改进的掩码方案,使得训练过程更加高效,并赋予了模型自我校正输...

Read More
2025-03-12 talkingdev

[论文推荐] 基于硬负样本加权的对比学习构建大规模语言和视觉嵌入模型

近年来,随着多模态学习的发展,构建能够同时处理视觉和语言任务的嵌入模型成为研究热点。然而,传统基于对比损失的方法在处理硬负样本时往往表现不佳,导致模型在复杂检索任务中效果受限。近期,一项研究提出了一种...

Read More
2025-03-11 talkingdev

NIST选定HQC作为后量子加密第五种算法

美国国家标准与技术研究院(NIST)近日宣布,已将HQC(Hamming Quasi-Cyclic)算法选为后量子加密标准化进程中的第五种算法。这一决定标志着NIST在后量子密码学领域的进一步推进,旨在应对未来量子计算机可能带来的...

Read More
2025-03-11 talkingdev

AI生成语音证据在法庭中引发安全隐患

随着人工智能技术的快速发展,AI生成的语音证据逐渐进入司法领域,但其潜在的安全隐患也引发了广泛关注。专家指出,AI生成的语音可以高度模仿真实人声,甚至达到以假乱真的程度,这可能导致法庭在审理案件时误判。尤...

Read More
2025-03-11 talkingdev

无人机避障新突破:基于深度强化学习的轻量级系统发布

近日,一个基于深度强化学习的轻量级避障系统在GitHub上发布,专为固定翼无人机(UAVs)设计。该系统结合了AirSim和JSBSim两大仿真平台,旨在提升无人机在高速飞行中的避障能力。通过深度强化学习算法,无人机能够在...

Read More
  1. Prev Page
  2. 13
  3. 14
  4. 15
  5. Next Page