漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-23 talkingdev

Mamba在视觉任务中的必要性探讨

Mamba作为一种强大的Transformer替代方案,因其能够在保持性能的同时使用更少的FLOPs而备受关注。然而,最新研究表明,对于某些应用来说,Mamba可能并非必需。该研究通过实验表明,一个经过精心调优的CNN基线在一系...

Read More
2024-05-23 talkingdev

论文:新神经网络架构Wav-KAN显著提升训练速度与稳健性

研究人员开发了一种名为Wav-KAN的神经网络框架,该框架采用小波函数来提升模型的可解释性和性能。与传统模型不同,Wav-KAN能够同时捕捉高频和低频数据成分,从而实现更快的训练速度和更高的稳健性。这一创新方法不仅...

Read More
2024-05-22 talkingdev

微软Surface新设备挑战MacBook Air,性能领先

微软近日发布了全新Surface设备,旨在挑战苹果MacBook Air的市场地位。这款Surface设备搭载了高通的Snapdragon X Elite芯片,与苹果的顶级笔记本电脑相比,在性能测试中取得了领先。微软的Copilot Plus系列PC配备了...

Read More
2024-05-22 talkingdev

LeMeViT:通过可学习元令牌加速视觉Transformer

LeMeViT是一种新的方法,通过使用可学习元令牌来降低视觉Transformer的计算成本。这些元令牌能够高效地捕捉关键信息,从而显著提高推理速度。与传统的视觉Transformer相比,LeMeViT在保持高精度的同时,大幅减少了计...

Read More
2024-05-22 talkingdev

OpenAI暂停ChatGPT-4o“Sky”语音模式

OpenAI近日宣布暂停ChatGPT-4o的“Sky”语音模式,此举是因为该模式被指涉嫌模仿2013年电影《Her》中斯嘉丽·约翰逊的声音。斯嘉丽·约翰逊本人也正在对这家人工智能公司采取法律行动。这一事件引发了广泛关注,许多人质...

Read More
2024-05-21 talkingdev

研究人员发现针对视觉变换器(Vision Transformers)的新型后门攻击手法

近日,研究人员发现了一种针对视觉变换器(Vision Transformers)的新型安全威胁。这种被命名为“SWARM”的攻击手法,利用一个“切换令牌”秘密激活模型中的后门行为,使其对用户具有高度的隐蔽性和危险性。视觉变换器是...

Read More
2024-05-21 talkingdev

PSG-4D全景场景图生成,让AI理解时空世界的技术开源

PSG-4D是一种全新的表示法,帮助AI理解空间和时间的四维世界。这种技术的GitHub Repo已经开源。该技术能够生成4D全景场景图,通过这种场景图,AI不仅能够理解物体的三维空间位置,还能理解物体随时间的变化。这是一...

Read More
2024-05-20 talkingdev

让LoRA学习更少遗忘更少,优化模型微调调优的新方法

LoRA(Learning of Rate Adjustor)是一种被广泛应用于模型微调的方法,用于注入风格或知识。近期的一篇研究论文深入探讨了在使用LoRA时,学习能力和遗忘之间的权衡关系。研究发现,LoRA相比于全面微调,虽然学习的...

Read More
  1. Prev Page
  2. 25
  3. 26
  4. 27
  5. Next Page