最近的一项研究中,研究人员利用名为'Evil Geniuses'的虚拟团队测试了LLMs的安全性。他们发现这些人工智能代理对恶意攻击的鲁棒性较差,提供更复杂的回复,使不当回复更难以检测。
Read More来自加州大学圣地亚哥分校(UCSD)的研究人员训练了人形机器人的动作,使其更具表现力、社交倾向和鲁棒性。他们在草地上的非编排舞蹈视频非常令人印象深刻。该研究团队使用了深度强化学习,让机器人能够快速学习和适应...
Read More近日,研究人员提出了一种新的文本识别方法——类别感知的掩膜引导特征细化(CAM feature refinement),该方法可以有效提高文本在复杂场景下的识别能力。该方法通过对文本图像进行类别感知的特征细化,达到更好的文本...
Read MoreHugging Face Hub推出了新的基准数据集,名为Anime Bench,该数据集包含有关各种动漫角色以及引用的事实,旨在评估语言模型的性能。该数据集包含了来自动漫作品的超过10,000个引用,可以用于测试语言模型的能力,评...
Read More对于视觉转换器(ViTs)的显著进展,研究人员使用一种新的自我涌现令牌标记(STL)框架,提高了完全注意力网络(FAN)模型的鲁棒性。这种方法涉及训练FAN令牌标记器来创建有意义的补丁令牌标记,然后训练FAN学生模型。
Read More谷歌研究人员提出了一种名为Self-Play Preference Optimization (SPO) 的自我对弈优化算法。该算法相比传统的强化学习对齐方式更加简单。研究人员运用博弈论,找到了对噪声干扰鲁棒性强、性能表现优异的单人自我对弈...
Read MoreODTrack是一个新的视频追踪系统,改进了我们在视频中跟踪物体的方式。与老旧系统在连接过去和未来的视频帧时存在困难不同,ODTrack使用一种称为'在线令牌传播'的方法来更好地连接连续的视频帧。通过这种方法,ODTrac...
Read More我们推出了一种多模式视觉提示跟踪模型,通过动态利用各种模态(如RGB和红外线)的优势,克服了单模式物体跟踪的局限性。该模型可适应各种环境下的跟踪任务,具有较高的跟踪精度和鲁棒性。
Read MoreGiskard是一个开源的测试框架,用于测试从表格到LLMs的机器学习模型。它通过检查模型的输出和真实值之间的差异来评估模型的性能。Giskard不仅可以测试模型的预测能力,还可以测量它的稳定性、可解释性和鲁棒性。Gisk...
Read More