LMSYS发布了两项语言模型推理的新技术。第一项是对后端进行的改进,提高了每秒的标记总数性能。第二项是嵌入式领域特定语言,用于复杂提示技术,允许并行提示。
Read More一项新的研究通过解决图像编辑中存在的挑战,例如不明确的指令和识别需要修改的图像部分,大幅提高了使用自然语言指令编辑图像的效率。该研究使用了深度学习和自然语言处理技术,将自然语言指令转换为可执行的图像编...
Read MoreGitHub Actions可以用于批处理作业。开发人员可以将工作提交到服务中,稍后异步地接收结果。actions-batch是一个命令行工具,本质上是将GitHub Actions转换为分时计算机的API。它创建新的GitHub存储库,编写在提交时...
Read More研究人员开发了一种新的多学科协作框架,以提高大型语言模型在医学领域的理解和推理能力。这种方法涉及到AI代理,扮演一起分析、讨论和达成共识的医学主题的角色扮演游戏。
Read More本文分享了关于AI现状的思考,以及对该技术发展方向的一些预测。文章主要关注AI模型的产品、市场和人才现状,而并未涉及AI架构和基础设施的技术细节。今年,开源模型将赶上专有模型,并帮助推动边缘设备的推理。
Read More随着视觉问答技术的不断发展,大多数模型只涉及2D推理,忽略了3D视觉场景的复杂性。这项研究提出了3D感知的视觉问答技术。通过对3D场景的理解和分析,模型可以更精准地回答问题,具有更高的准确率和可解释性。该技术...
Read More据报道,谷歌正在开发“Bard Advanced”,这是其Bard AI工具的增强版本,将通过付费的Google One订阅提供。这个升级版由谷歌的顶级大型语言模型Gemini Ultra提供支持,相比于目前运行在Gemini Pro上的Bard,它提供了先...
Read More本项目介绍了对Google的Gemini进行深入分析的研究,Gemini是一种多模态大型语言模型,评估其在各种任务中的常识推理性能。该研究与其他模型进行了比较,揭示了其在跨模态知识整合方面的竞争能力。
Read MoreLlamafile是一个将模型和推理代码嵌入单个便携式可执行文件的项目。此博客探讨了如何将命令行输出导入语言模型以进行进一步处理。
Read More本文提供了一份长而广泛的调查,介绍了让大型语言模型运行更快的不同方法。列表不是完全穷尽的,但可以用作学习有趣主题的跳板。在可能的情况下,它包括相关论文和博客文章的链接。本文介绍了不同的方法来优化大型语...
Read More