这是一份关于使用LLMs进行注释的精选论文列表,LLMs是一种基于机器学习的语言模型,能够自动预测文本中的下一个单词或字符。使用LLMs进行注释可以提高注释的准确性和效率,目前在自然语言处理和计算机视觉领域被广泛...
Read MoreAlphaFold被用于预测蛋白质折叠后的状态。通过添加可逆的流匹配,您可以在整个蛋白质领域显著提高建模能力。在蛋白质结构预测领域,AlphaFold目前是最先进的计算机程序之一,它使用深度学习技术来预测蛋白质的三维结...
Read More世界体积感知多摄像头驾驶场景生成器(WoVoGen)是一个创新系统,旨在为自动驾驶创建逼真的街景视频。该系统使用机器学习和计算机视觉技术来生成高质量的街景视频,以帮助自动驾驶车辆更好地识别和适应不同的路况。W...
Read More最近在《自然》杂志上介绍了一种名为FunSearch的方法,它使用大型语言模型在数学和计算机科学中进行新的发现。该方法将创造性的LLM与评估器配对,以产生可验证的解决方案,并在难以解决的cap set 和bin-packing问题...
Read MoreGitHub上发布了一个名为“Flexible Vision Transformer”的仓库,该架构设计用于创建任意分辨率和纵横比的图像。与传统模型不同,FiT将图像视为变量大小的标记序列,在训练和推理过程中更有效地适应不同的图像大小。这...
Read MoreSasha Rush发布了一份注释教程,介绍了如何使用自定义Triton内核加速Mamba。由于Triton编译器中的一个错误,它目前无法扩展,但它是技术的极端演示,并适合那些想要深入了解状态空间变换器替代品的人。Mamba是一种用...
Read More据报道,软银集团创始人孙正义正在推出Izanagi,一个旨在与Nvidia竞争并专注于人工智能应用的1000亿美元芯片创业公司。Izanagi的目标是利用孙正义在AI和5G技术领域的经验来打造出一种全新的芯片,以满足未来的需求。...
Read MoreHuggingFace Hub最近发布了全新的视频模型Sora,现在提供了30篇相关的论文。这些论文包括了从模型架构到训练技巧等方面的研究,为研究人员和开发者提供了很好的参考。此外,这些论文还包括了Sora model在计算机视觉...
Read More据报道,OpenAI已经开发了两种类型的AI Agent软件超过一年。第一种类型可以通过接管客户设备来自动化复杂的任务。第二种AI代理类处理基于Web的任务并可以收集公共数据。目前尚不清楚公司计划何时发布这些代理。
Read More