漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-22 talkingdev

UV-SAM-探测城市村庄边界的新方法开源

近日,一项名为UV-SAM的新技术通过GitHub仓库公开,该技术是对视觉基础模型和Segment Anything模型的改进,利用卫星图像可以准确识别出城市村庄的边界。与传统的现场调查相比,UV-SAM提供了一种高效的替代方案,结合...

Read More
2024-01-22 talkingdev

WhisperSpeech: 倒置Whisper技术实现的文本转语音系统

WhisperSpeech是一种倒置Whisper技术实现的文本转语音系统。该系统目前仅在英语LibreLight数据集上进行了训练,但未来的版本将面向多种语言。在该仓库中提供了合成语音的示例。

Read More
2024-01-21 talkingdev

LLM评估方法的局限性,需要更有效方法

本文探讨了评估LLM的挑战,将其与人类员工评估进行比较。文章讨论了衡量LLM智能和实用性的困难,突出了当前评估方法的局限性和需要更有效方法的必要性。在人工智能领域,评估是至关重要的,因为它决定了LLM的质量和...

Read More
2024-01-21 talkingdev

Codium开源基于AI的代码生成模型

AlphaCodium推出了一种新颖的方法来增强LLMs的代码生成能力。这种多阶段、基于测试的迭代过程显著提高了像GPT-4这样的模型在解决复杂编程问题时的准确性,如在CodeContests数据集上所展示的。

Read More
2024-01-21 talkingdev

LMSYS发布SGLang和Radix Attention,提高提示和推理速度

LMSYS发布了两项语言模型推理的新技术。第一项是对后端进行的改进,提高了每秒的标记总数性能。第二项是嵌入式领域特定语言,用于复杂提示技术,允许并行提示。

Read More
2024-01-21 talkingdev

DoraemonGPT:基于LLM的AI系统在视频理解方面迈出重要一步

最近,一种名为DoraemonGPT的新型AI系统基于大型语言模型取得了重要进展,它聚焦于视频任务,提升了对于动态现实场景的理解。DoraemonGPT将视频转换为符号记忆,以进行高效的时空查询,并利用专门的工具和新颖的规划...

Read More
2024-01-21 talkingdev

论文:自动驾驶汽车视觉基础模型前沿技术分析

本文探讨了开发自动驾驶汽车视觉基础模型(VFMs)所面临的挑战。通过分析超过250篇研究论文,它提供了有关数据准备,预训练和AI任务适应的见解,重点介绍了NeRF和3D高斯点渲染等前沿技术

Read More
2024-01-21 talkingdev

DeepMind新数学模型获得IMO金牌,不需要任何人类样本数据

DeepMind的新数学模型AlphaGeometry在规定的时间内解决了25个奥林匹克问题,优于之前的最先进技术解决的10个问题。重要的是,它是在1亿个合成问题的训练下训练的,这消除了现有的数据瓶颈。DeepMind已经开源了代码和...

Read More
  1. Prev Page
  2. 518
  3. 519
  4. 520
  5. Next Page