Anthropic最近发布了Claude 3家族的三个新模型,其中最强的模型匹敌了GPT4的报告基准结果。此外,这是一个多模态模型,对视觉任务表现良好。值得注意的是,Claude的编码能力在此版本中得到了显著提高。
Read MoreCharacter AI公司的一种编码风格极大地提高了张量中形状的可读性。这种风格使用形状后缀来标识张量中的形状,例如“weights_2x3”表示形状为2x3的权重张量。这种命名约定使得代码更加易读和易于理解,特别是对于机器学...
Read MoreBig Code项目发布了旗舰编码模型的另一个版本StarCoder v2。该模型具有16k上下文窗口,经过4T令牌的训练,性能强劲,但仍然低于DeepSeek编码器。StarCoder v2将在程序员社区和人工智能研究领域引起轰动,标志着Big C...
Read More音乐理解通常需要在语言模型中添加特定编码器,这往往既昂贵又不稳定。然而,一项新的研究发现,将音乐转换为ABC符号后,音乐理解能力显著提高,且不会影响基本的语言能力。
Read MoreFlowMDM是一种新的模型,用于从文本描述生成长时间连续的人体运动序列。这种首创的扩散模型使用混合位置编码进行逼真的运动创建,无需额外的去噪步骤,在关键数据集上表现出卓越的准确性和逼真度。
Read More近日,GitHub推出了一项新的方法,可以增强OpenFlamingo和LLaVA等多模型模型对视觉对抗攻击的防御能力。该方法通过无监督地微调CLIP视觉编码器,有效地保护这些模型免受恶意图像攻击,提高了它们在现实应用中的可靠...
Read MoreContextual团队发布了一种能够同时生成文本和嵌入式编码的模型,名为生成式表征指导调整模型(Generative Representational Instruction Tuning)。该模型在多模态领域表现出色,远远超过了单一专家模型。这种模型的...
Read More