漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-21 talkingdev

CPO策略提高翻译语言模型的能力

该项目提出了对比优化策略(CPO),以提高机器翻译中中等规模语言模型的性能。将该方法应用于13B参数ALMA模型,解决了监督微调的局限性,并取得了改进。CPO策略通过对模型的预训练进行增量式微调,有助于提高机器翻译...

Read More
2024-01-21 talkingdev

自动化流程Agent让博客转视频播客

Nathan Lambert最近发布了Interconnect Tools,它允许您使用文本转语音、图像合成和整个工作流程自动化他的多模式博客流程。它允许创作者专注于写作,而工具将事物格式化为易于消费的媒体,以便他们的受众。此工具可...

Read More
2024-01-21 talkingdev

LMSYS发布SGLang和Radix Attention,提高提示和推理速度

LMSYS发布了两项语言模型推理的新技术。第一项是对后端进行的改进,提高了每秒的标记总数性能。第二项是嵌入式领域特定语言,用于复杂提示技术,允许并行提示。

Read More
2024-01-21 talkingdev

DoraemonGPT:基于LLM的AI系统在视频理解方面迈出重要一步

最近,一种名为DoraemonGPT的新型AI系统基于大型语言模型取得了重要进展,它聚焦于视频任务,提升了对于动态现实场景的理解。DoraemonGPT将视频转换为符号记忆,以进行高效的时空查询,并利用专门的工具和新颖的规划...

Read More
2024-01-21 talkingdev

论文:自动驾驶汽车视觉基础模型前沿技术分析

本文探讨了开发自动驾驶汽车视觉基础模型(VFMs)所面临的挑战。通过分析超过250篇研究论文,它提供了有关数据准备,预训练和AI任务适应的见解,重点介绍了NeRF和3D高斯点渲染等前沿技术。

Read More
2024-01-21 talkingdev

OpenAI在未能打赢诽谤官司后必须为ChatGPT的虚构辩护

最近,乔治亚州的一位法官驳回了OpenAI驳回了由电台主持人马克·沃尔特斯提起的诽谤诉讼的动议。沃尔特斯指控ChatGPT的“幻觉”产生了关于他的错误和可能损害他职业生涯的主张。这一裁决允许探究和决定案件的实质,挑战...

Read More
2024-01-21 talkingdev

DeepMind新数学模型获得IMO金牌,不需要任何人类样本数据

DeepMind的新数学模型AlphaGeometry在规定的时间内解决了25个奥林匹克问题,优于之前的最先进技术解决的10个问题。重要的是,它是在1亿个合成问题的训练下训练的,这消除了现有的数据瓶颈。DeepMind已经开源了代码和...

Read More
2024-01-21 talkingdev

Nightshade:艺术家对抗AI艺术生成器的攻击工具

一些艺术家对人工智能艺术生成器的威胁感到担忧,因为这些生成器可以在几秒钟内创造出令人惊叹的艺术作品。为了应对这种威胁,一些艺术家开发了一种名为Nightshade的工具,以对抗AI艺术生成器。Nightshade是一种攻击...

Read More
  1. Prev Page
  2. 788
  3. 789
  4. 790
  5. Next Page