漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-28 talkingdev

精调版Llama编码模型在编码基准测试上超过GPT-4

拥有海量高质量内部数据的公司已发布了精调版Llama,它在编码方面的能力非常高。这是在Meta发布其新的编程语言模型后的几天内完成的。重要的是要注意,当前GPT-4的版本在编码方面仍然优于任何开源模型。本文将新的Ll...

Read More
2023-08-25 talkingdev

论文:谷歌新推视频生成基准测试工具,助力自动视频生成领域研究

自动视频生成作为一个新兴的研究领域,已经引起了广泛的关注。其中,故事延续、故事混搭等任务的衡量标准十分复杂。谷歌最新推出的视频生成基准测试工具,希望能帮助这一领域取得进一步的进展。通过这个基准测试,研...

Read More
2023-08-25 talkingdev

cheetah:开源的多模态语言模型,用于处理视觉-语言任务

近期的模型常常在处理复杂的视觉-语言任务上遇到困难,这主要是由于它们在理解混合的图像-文本上下文时存在限制。为了评估这些任务,研究人员引入了I4基准。结果显示,视觉提示生成器的注意力存在缺陷。为了解决这个...

Read More
2023-08-23 talkingdev

AI预测两年成果报告

近日,一份评估人工智能(AI)进展的跨领域报告引起了业内的广泛关注。这份报告由一个专门预测各类结果的团队发布,详细分析了各类AI模型在各种基准测试中的表现。报告显示,一些前沿的AI模型在预测任务中表现出色,成...

Read More
2023-08-09 talkingdev

评估大型语言模型作为代理的能力:AgentBench工具

该项目引入了AgentBench,一个用于测试大型语言模型(LLMs)在各种交互环境中的基准工具。在对25个LLMs进行的初步测试中,结果显示商业模型的表现超过了开源模型。这项研究为我们理解和评估大型语言模型的交互性能提供...

Read More
2023-07-31 talkingdev

优化后的Llama 2,上下文长度达到32k

最近获得2000万美元投资的together公司,已经对Llama 2进行了微调,通过在位置嵌入上进行线性扩展,使其在处理上下文时可以处理高达32k的token。他们在许多有趣的基准测试中进行了测试,但是他们警告说,现代语言模...

Read More
2023-07-31 talkingdev

论文:AI现已能从模拟环境中学习并独立交互

新的算法“思考者”引入了一种独特的方法,使人工智能能够独立地与模拟环境交互并从中学习,从而提高其制定战略计划的能力。在推箱子游戏和雅达利2600基准测试中,该算法展现了顶级的性能,为AI的强化学习提供了一种新...

Read More
2023-07-20 talkingdev

视频对象追踪:基于点的分割方法引领新潮流

最新研究引入了一种名为SAM-PT的新系统,该系统利用Segment Anything Model (SAM)来提高视频中对象的追踪和分割效果。在多个视频分割基准测试中,SAM-PT表现出卓越的性能。SAM-PT的优势在于其对对象的分割和追踪能力...

Read More
2023-07-19 talkingdev

Meta发布开源AI模型Llama 2,允许商业化应用

Meta公司发布了新的开源AI语言模型家族Llama 2,其许可证允许其被整合到商业产品中。这些模型的大小从70亿参数到7亿参数不等,据报道,它们在大多数基准测试中表现优于其他开源聊天模型。Llama 2已在Microsoft Azure...

Read More
2023-06-15 talkingdev

开源代码模型击败ChatGPT在编码任务中(GitHub Repo)

近日,一种开源代码模型在编码任务中表现超越ChatGPT等语言模型。封闭模型之所以强大,是因为它们实际上是伪装成语言模型的代码模型。很多开放式语言模型表现不佳,因为它们无法从大规模的代码预训练中获得推理能力...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page