漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-09 talkingdev

谷歌开源时序基础模型TimesFM:用于时间序列预测

近期,研究人员开发了一种新的时序基础模型,名为TimesFM。该模型可应用于各种时间序列预测问题,包括股票价格、气象数据和交通流量等。TimesFM的优点在于能够处理数据的多种特征,如周期性、趋势性和季节性等。此外...

Read More
2024-05-09 talkingdev

Consistency LLM:将LLMs转换为并行解码器可将推理加速3.5倍

Consistency LLM是一种新的自然语言处理模型,可以将其转换为并行解码器,从而将推理时间缩短至3.5倍。LLM模型是一种具有良好性能的模型,但推理速度较慢。该研究团队将LLM转换为并行解码器,使用了一种名为一致性训...

Read More
2024-05-08 talkingdev

搜索和推荐的融合:新的机器学习模型提出解决方案

传统上,搜索和推荐一直被分开,因为虽然它们在概念上占据了同一光谱的两端,但它们具有不同的工具、架构和机器学习目标。大型语言模型引入了需要小心管理的期望,因为在开放式解决方案空间中引导客户意图是很困难的...

Read More
2024-05-07 talkingdev

Cohere的Command R模型系列现已在亚马逊Bedrock平台上线

Cohere的Command R和R+是针对长文本任务优化的最新LLM(Large Language Models)。这两款模型在关键的商业重要能力方面表现优异。它们都是目前市场上的技术先行者,并且已经在亚马逊Bedrock平台上进行发布。这无疑是...

Read More
2024-05-07 talkingdev

ml-rpm-bench: 视觉-语言模型在视觉推理方面的限制评估

像GPT-4V这样的视觉-语言模型在理解和与图像和文本交互方面正在快速发展。然而,最近的一项研究揭示了它们在视觉推理上的重大限制。研究人员使用复杂的视觉难题,如智商测试中的难题,来测试这些模型,并发现它们在...

Read More
2024-05-07 talkingdev

人工智能提示工程的终结:模型驱动,效率更高

自动化提示优化的人工智能模型预示着一个未来,手动提示工程可能会变得过时,指向了生成有效提示的更有效,模型驱动的方法。在这个新的模型驱动的世界里,我们可以期待更快速的提示生成,以及更精确的结果。此外,这...

Read More
2024-05-07 talkingdev

DeepSeek发布200B+参数模型——DeepSeek-V2

DeepSeek近期推出了一个具有超过2000亿参数的模型DeepSeek-V2,其中激活参数达到210亿。无论是在编码还是推理方面,该模型的表现都极为出色。虽然目前尚不清楚其性能是否超过了拥有700亿参数的Llama 3模型,但无疑,...

Read More
2024-05-07 talkingdev

Vibe-Eval开源:评估多模态聊天模型基准测试

Vibe-Eval是一个新推出的基准测试,专为测试多模态聊天模型而设计。它包含了269项视觉理解提示,其中包括100项特别具有挑战性的提示。这些视觉理解提示的设计,力求能够全面、深入地评估和测试多模态聊天模型的性能...

Read More
  1. Prev Page
  2. 227
  3. 228
  4. 229
  5. Next Page