近日,一项名为UV-SAM的新技术通过GitHub仓库公开,该技术是对视觉基础模型和Segment Anything模型的改进,利用卫星图像可以准确识别出城市村庄的边界。与传统的现场调查相比,UV-SAM提供了一种高效的替代方案,结合...
Read MoreWhisperSpeech是一种倒置Whisper技术实现的文本转语音系统。该系统目前仅在英语LibreLight数据集上进行了训练,但未来的版本将面向多种语言。在该仓库中提供了合成语音的示例。
Read More本文探讨了评估LLM的挑战,将其与人类员工评估进行比较。文章讨论了衡量LLM智能和实用性的困难,突出了当前评估方法的局限性和需要更有效方法的必要性。在人工智能领域,评估是至关重要的,因为它决定了LLM的质量和...
Read MoreAlphaCodium推出了一种新颖的方法来增强LLMs的代码生成能力。这种多阶段、基于测试的迭代过程显著提高了像GPT-4这样的模型在解决复杂编程问题时的准确性,如在CodeContests数据集上所展示的。
Read MoreLMSYS发布了两项语言模型推理的新技术。第一项是对后端进行的改进,提高了每秒的标记总数性能。第二项是嵌入式领域特定语言,用于复杂提示技术,允许并行提示。
Read More最近,一种名为DoraemonGPT的新型AI系统基于大型语言模型取得了重要进展,它聚焦于视频任务,提升了对于动态现实场景的理解。DoraemonGPT将视频转换为符号记忆,以进行高效的时空查询,并利用专门的工具和新颖的规划...
Read More本文探讨了开发自动驾驶汽车视觉基础模型(VFMs)所面临的挑战。通过分析超过250篇研究论文,它提供了有关数据准备,预训练和AI任务适应的见解,重点介绍了NeRF和3D高斯点渲染等前沿技术。
Read MoreDeepMind的新数学模型AlphaGeometry在规定的时间内解决了25个奥林匹克问题,优于之前的最先进技术解决的10个问题。重要的是,它是在1亿个合成问题的训练下训练的,这消除了现有的数据瓶颈。DeepMind已经开源了代码和...
Read More