模型的相关内容 - 漫话开发者

2024-02-28 talkingdev

自动驾驶汽车中的性能与效率平衡

近日，研究人员提出了一种新的自动驾驶汽车高效模型——尖峰神经网络。该模型通过减少能耗高达85%，实现了高性能的目标。该模型在 GitHub 上建立了一个存储库，供研究人员和开发人员参考。据悉，尖峰神经网络结合了神...

2024-02-28 talkingdev

Visual Speech Recognition with Language Models（VSP-LLM）框架在视觉语音识别和翻译中引入了新的方法，通过集成LLMs来高效处理视频输入，通过去重嵌入视觉特征和使用低秩适配器进行成本效益训练。

2024-02-28 talkingdev

该项目引入了回声嵌入，这是一种新的策略，通过将未来令牌信息纳入其中，克服了自回归模型的一个关键限制。这是通过将输入重复两次来实现的，这显著提高了基准任务的性能，同时与其他嵌入增强方法兼容。

2024-02-28 talkingdev

FlowMDM是一种新的模型，用于从文本描述生成长时间连续的人体运动序列。这种首创的扩散模型使用混合位置编码进行逼真的运动创建，无需额外的去噪步骤，在关键数据集上表现出卓越的准确性和逼真度。

2024-02-28 talkingdev

近日，Meta提出了一种三亿五千万参数的语言模型，其强大的推理能力甚至接近Llama 7B在API函数调用任务中的正确性。该模型尚未发布，但固定参数模型的创新值得探索。

2024-02-28 talkingdev

ConceptMath是一种新的双语基准，用于测试LLMs在英语和中文的数学技能。它的独特之处在于它将数学问题分解为特定的概念，从而允许更详细地评估AI在数学上的优势和劣势。这项技术将有助于开发更准确的AI模型，以应对...

2024-02-28 talkingdev

法国AI初创公司Mistral宣布推出新的API模型，并与Azure达成合作。Mistral Large在多语言任务方面表现出色，在MMLU上仅比GPT-4差了几个百分点，性能强大。该初创公司还在其API中添加了一个新的mistral-small模型。

2024-02-28 talkingdev

据悉，Litestar是一款轻量级、灵活的ASGI框架，适用于构建高性能API。其优点在于提供了简洁的API并支持异步编程模型，还具有可扩展性、易用性和可读性等优秀特性。此外，Litestar还为开发人员提供了丰富的文档和示例...