Stability AI宣布其开源模型组合中将新增稳定视频传输技术Stable Video Diffusion。其AI模型组合已经涵盖了图像、语言、音频、3D和代码等多种模态。
Read MoreLLaVa模型是一个开源模型,结合了语言和视觉。这个新版本允许使用图像编辑、生成等工具来进行指导,调整模型。LLaVa Plus模型提供了更高的精度和更好的性能。
Read More随着最近发布的优秀Zephyr语言模型,HuggingFace团队展示了如何在少数强大的预训练开源模型基础上训练个性化模型。HuggingFace对齐手册提供了一系列对齐技术的详细解释,并介绍了如何在不同任务上使用预训练模型。此...
Read More企业中使用AI模型的主要用途之一是从非结构化文本中提取结构化数据,如JSON或CSV。目前主要使用gpt-3.5-turbo的函数调用来完成此任务。GoLLIE通常表现更好,可以更加自信地运行敏感数据。
Read MoreDALLE-3图像生成模型的质量提升的主要驱动力之一是改进后的数据质量。通过使用内部模型进行标题上采样来实现。这里提供了一个使用强大的开源模型进行实现的GitHub开源库。
Read MoreCloudflare近日发布了一款名为“Workers AI”的无服务器人工智能推断平台,该平台运行在其全球GPU网络上。Workers AI提供了多种流行的开源模型,并与Hugging Face进行了合作。通过无服务器计算的方式,用户可以在Cloud...
Read More拥有海量高质量内部数据的公司已发布了精调版Llama,它在编码方面的能力非常高。这是在Meta发布其新的编程语言模型后的几天内完成的。重要的是要注意,当前GPT-4的版本在编码方面仍然优于任何开源模型。本文将新的Ll...
Read More轩辕是国内首个开源的千亿级中文对话大模型,同时也是首个针对中文金融领域优化的千亿级开源对话大模型。轩辕在BLOOM-176B的基础上针对中文通用领域和金融领域进行了针对性的预训练与微调,它不仅可以应对通用领域的...
Read More图像生成是人工智能技术的一个重要应用场景,而如何更好地控制其生成过程,是业界一直在探索的问题。最佳开源模型SDXL,推出了其ControlNet版本,通过利用边缘来调整最终输出,为图像生成提供了新的解决方案。SDXL C...
Read More该项目引入了AgentBench,一个用于测试大型语言模型(LLMs)在各种交互环境中的基准工具。在对25个LLMs进行的初步测试中,结果显示商业模型的表现超过了开源模型。这项研究为我们理解和评估大型语言模型的交互性能提供...
Read More