近期,研究人员开发了一种新的时序基础模型,名为TimesFM。该模型可应用于各种时间序列预测问题,包括股票价格、气象数据和交通流量等。TimesFM的优点在于能够处理数据的多种特征,如周期性、趋势性和季节性等。此外...
Read MoreConsistency LLM是一种新的自然语言处理模型,可以将其转换为并行解码器,从而将推理时间缩短至3.5倍。LLM模型是一种具有良好性能的模型,但推理速度较慢。该研究团队将LLM转换为并行解码器,使用了一种名为一致性训...
Read More传统上,搜索和推荐一直被分开,因为虽然它们在概念上占据了同一光谱的两端,但它们具有不同的工具、架构和机器学习目标。大型语言模型引入了需要小心管理的期望,因为在开放式解决方案空间中引导客户意图是很困难的...
Read MoreCohere的Command R和R+是针对长文本任务优化的最新LLM(Large Language Models)。这两款模型在关键的商业重要能力方面表现优异。它们都是目前市场上的技术先行者,并且已经在亚马逊Bedrock平台上进行发布。这无疑是...
Read More像GPT-4V这样的视觉-语言模型在理解和与图像和文本交互方面正在快速发展。然而,最近的一项研究揭示了它们在视觉推理上的重大限制。研究人员使用复杂的视觉难题,如智商测试中的难题,来测试这些模型,并发现它们在...
Read More自动化提示优化的人工智能模型预示着一个未来,手动提示工程可能会变得过时,指向了生成有效提示的更有效,模型驱动的方法。在这个新的模型驱动的世界里,我们可以期待更快速的提示生成,以及更精确的结果。此外,这...
Read MoreDeepSeek近期推出了一个具有超过2000亿参数的模型DeepSeek-V2,其中激活参数达到210亿。无论是在编码还是推理方面,该模型的表现都极为出色。虽然目前尚不清楚其性能是否超过了拥有700亿参数的Llama 3模型,但无疑,...
Read MoreVibe-Eval是一个新推出的基准测试,专为测试多模态聊天模型而设计。它包含了269项视觉理解提示,其中包括100项特别具有挑战性的提示。这些视觉理解提示的设计,力求能够全面、深入地评估和测试多模态聊天模型的性能...
Read More