Google的旗舰机型Gemini是一款原生多模态模型,其文本能力达到了GPT4的水平,同时还能够处理许多其他数据序列。此外,它还训练了Alpha Code 2,这是一个在代码力量比赛中排名前15%的编码器。Alpha Code 2将在12月13...
Read More该项目探索了视觉转换器在基于扩散的生成学习中的有效性,揭示了Diffusion Vision Transformers(DiffiT)。该模型将U形编码器-解码器架构与新型时变自注意模块相结合。DiffiT可以生成高分辨率的图像,具有非常好的...
Read More在将语言模型嵌入到您的代码库中时,一个有用的心理模型是将它们视为具有标准输入和输出的函数。这篇博客是由React Native的创始人撰写的,展示了几种您可以这样建模模型以及这种方式的好处。
Read MoreGitHub的首席产品官Inbal Shani讨论了AI在软件开发中的作用,认为AI驱动的代码生成不会取代开发人员,而是提高他们的效率。她探讨了GitHub的Copilot背后的成功指标和理念,以及该公司如何促进创新。这次对话揭示了AI...
Read MoreSAFE是一种新的模式识别融合框架,它结合了预训练的视觉和语言模型,使用RGB帧、事件流和语义标签进行融合。该框架能够通过各种传感器收集的数据来识别和理解环境中的对象和场景,具有广泛的应用前景。在实现过程中...
Read More稳定AI发布了一款新模型SDXL Turbo,可以在207ms内生成高分辨率图像。该模型不使用LCM,而是采用一种称为对抗扩散蒸馏的新颖蒸馏技术。该模型的权重和代码已被用于研究中。
Read MoreStability AI宣布其开源模型组合中将新增稳定视频传输技术Stable Video Diffusion。其AI模型组合已经涵盖了图像、语言、音频、3D和代码等多种模态。
Read MoreJay Hack已为自动化软件开发的一些非常惊人的技术筹集了大量资金。它将Jira板连接到GitHub PR以进行自动化工程。
Read More