这项研究引入了一个名为“理性分割”的新AI任务,设计用于根据复杂和隐含的文本指令生成分割掩膜。此研究展示了一个名为LISA(Large-language Instructed Segmentation Assistant)的工具作为展示。LISA结合了大语言模...
Read MoreHuggingFace公司最近在其文字生成接口(GitHub Repo)中进行了一次重要的许可证变更,该接口现在不再可用于商业用途。此接口是一个建立在Rust、Python和gRPC服务器上的文字生成推断系统,广泛应用于HuggingFace公司...
Read MoreAI基于文本的接口为我们与软件交互开辟了一种全新的方式,但是在非结构化文本中寻找洞察力却十分困难。Tidepool就是为解决这一问题而生,它能在用户的文本交互中找出模式,帮助你做出更好的产品决策。AI在许多领域已...
Read More近日,已发布超过400万对高质量、经过策划的文本和图像对,用于视觉问题回答。所有这些数据都是由Midjourney合成生成的,因此有人戏称这个数据集为Midjourney蒸馏数据集。这意味着该数据集能够提供丰富的视觉和语言...
Read More稳定性AI近期发布了最新的先进文本到图像模型,稳定扩散XL (SDXL) 1.0,该模型已在亚马逊Bedrock,以及其自有API上提供。新模型提供了改进的颜色准确性和细节,并引入了一个用于专门图像生成的Beta微调功能。SDXL 1....
Read More近日,新的框架FacTool在GitHub上开源,该框架专门设计用于检测大型语言模型生成的文本中的事实错误,无论任务或领域如何。这是一次重大突破,因为AI生成的文本往往包含事实上的错误或误导,这可能导致信息误解和混...
Read More最近,一个名为TF-ICON的新技术在GitHub上引起了广泛关注。该方法利用文本来指导将对象无缝集成到不同的图像中,无需进行额外的训练或调整模型。这种方法的独特之处在于使用了一个'卓越提示',能够从真实的图像中精...
Read More由Nous研究所训练的13B参数的LongLlama-2-13B模型现在可以处理多达8k的令牌(context)。该成果是通过精细调整和线性位置插值缩放实现的。LongLlama-2-13B模型的进步标志着人工智能技术的一大步,使得处理大规模数据变...
Read More