近来,Transformer模型在AI领域占据统治地位。它们是强大的序列学习器,但也存在一些缺点。这项新工作基于状态空间模型,展示了新的架构可以带来巨大的好处,如增加上下文长度。
Read More人工智能公司Mistral将在新一轮融资中获得超过4亿美元的资金。该公司还发布了一款8x7B混合专家模型,目前正在社区进行评估。Mistral致力于为客户提供最优质的人工智能产品和服务。他们的新一轮融资将用于推动产品开...
Read More稳定性人工智能公司发布了StableLM Zephyr 3B稳定聊天模型,该模型是StableLM 3B-4e1t模型的一个扩展,灵感来源于Zephyr 7B模型,旨在实现高效的文本生成,特别是在指令跟踪和问答上下文中。该模型已经使用直接偏好...
Read MoreFree3D是一种创新的方法,可以从一张图片中创建3D视图,而无需使用缓慢笨重的3D模型。这种技术的关键在于使用深度学习算法对图像进行处理,从而生成更加真实的3D视图。该技术可以应用于游戏、虚拟现实、增强现实等领...
Read MoreMamba是一种非Transformer的模型,其性能惊人。它经过了SFT的聊天调优,并且似乎具有比同等大小的Transformer更好的开箱即用的检索能力。
Read More最近,Mistral发布了一个使用MLX生成文本的示例,这是一种基于人工智能的技术,它可以生成高质量的自然语言文本。该示例代码可以在GitHub上找到,它展示了如何使用Mistral的MLX库来生成文本。MLX库是Mistral的核心开...
Read More