漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-01 talkingdev

StarCoderV2发布,具备16k上下文窗口和4T训练令其性能强劲

Big Code项目发布了旗舰编码模型的另一个版本StarCoder v2。该模型具有16k上下文窗口,经过4T令牌的训练,性能强劲,但仍然低于DeepSeek编码器。StarCoder v2将在程序员社区和人工智能研究领域引起轰动,标志着Big C...

Read More
2024-03-01 talkingdev

论文:视频框架成为现实决策的新语言

一篇令人惊叹的论文将视频框架作为人工智能与人类用户交互的一种潜在更好的方法。它展示了视频模型可以用作规划器、代理、计算引擎和环境模拟器。以视频为基础的人工智能可以模拟现实世界,更好地支持人类决策。

Read More
2024-03-01 talkingdev

论文:AI模型的视觉感知能力得到提升

本研究致力于提高基于多模态的GPT-4V等模型在低级视觉感知任务中的表现。大规模实验从58,000名人类受试者中收集了18,973张图像的反馈,并创建了Q-Pathway数据集,以分析其清晰度、色彩和亮度。

Read More
2024-03-01 talkingdev

苹果CEO宣布公司计划在生成式AI领域开创新局面

苹果CEO蒂姆·库克在公司年度股东大会上宣布,公司计划在2024年在生成式人工智能领域开创新局面,为用户提供变革性的机会。

Read More
2024-03-01 talkingdev

Meta计划于7月推出Llama 3模型

据报道,Meta的Llama团队仍在努力对齐,以使该模型放松并回答更多实际上并不具有争议性的查询。

Read More
2024-02-29 talkingdev

论文:量化语言模型提高生成效率

IR-QLoRA是一种新方法,它可以提高量化大型语言模型的准确性,使它们更适合在资源有限的设备上使用。量化是一种通过降低浮点精度来减少计算资源需求的技术。虽然这种方法可以大大减少模型的计算量和存储空间,但它也...

Read More
2024-02-29 talkingdev

Databricks、Anyscale和微软的十大AI见解

本文报道了对AI领域前沿公司的创始人的采访,涵盖了他们对AGI到来的看法,如何思考LLMs以及创始人在产品中如何处理AI的简单策略。

Read More
2024-02-29 talkingdev

伯克利函数调用排行榜

函数调用是指语言模型可以通过合成的函数访问工具来完成其给定的指令。这需要正确合成参数以传递给这些函数。这个排行榜旨在评估模型在函数调用任务上的能力。

Read More
  1. Prev Page
  2. 206
  3. 207
  4. 208
  5. Next Page