模型的相关内容 - 漫话开发者

2023-12-12 talkingdev

LLM推理速度如何实现100倍提升

随着开放模型在许多企业任务中变得有用，人们开始探索部署优化。然而，这个领域很复杂且分散。本文深入探讨了许多用于加速语言模型服务的标准技术。

2023-12-12 talkingdev

近来，Transformer模型在AI领域占据统治地位。它们是强大的序列学习器，但也存在一些缺点。这项新工作基于状态空间模型，展示了新的架构可以带来巨大的好处，如增加上下文长度。

2023-12-12 talkingdev

RAVE是一种利用现有文本到图像扩散模型来增强视频的视频编辑方法。这种方法可以在保持原始运动和结构的同时实现高质量的视频编辑。

2023-12-12 talkingdev

人工智能公司Mistral将在新一轮融资中获得超过4亿美元的资金。该公司还发布了一款8x7B混合专家模型，目前正在社区进行评估。Mistral致力于为客户提供最优质的人工智能产品和服务。他们的新一轮融资将用于推动产品开...

2023-12-12 talkingdev

稳定性人工智能公司发布了StableLM Zephyr 3B稳定聊天模型，该模型是StableLM 3B-4e1t模型的一个扩展，灵感来源于Zephyr 7B模型，旨在实现高效的文本生成，特别是在指令跟踪和问答上下文中。该模型已经使用直接偏好...

2023-12-11 talkingdev

Free3D是一种创新的方法，可以从一张图片中创建3D视图，而无需使用缓慢笨重的3D模型。这种技术的关键在于使用深度学习算法对图像进行处理，从而生成更加真实的3D视图。该技术可以应用于游戏、虚拟现实、增强现实等领...

2023-12-11 talkingdev

Mamba是一种非Transformer的模型，其性能惊人。它经过了SFT的聊天调优，并且似乎具有比同等大小的Transformer更好的开箱即用的检索能力。

2023-12-11 talkingdev

最近，Mistral发布了一个使用MLX生成文本的示例，这是一种基于人工智能的技术，它可以生成高质量的自然语言文本。该示例代码可以在GitHub上找到，它展示了如何使用Mistral的MLX库来生成文本。MLX库是Mistral的核心开...