漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-28 talkingdev

论文:研究者开发出更好的工具检测AI语言模型的偏见

科研人员已经开发出一种名为CALM的新测试,用来检查AI语言工具是否存在偏见。他们从不同的来源收集了大量的数据,并测试了各种AI模型,结果发现一些大型AI模型的偏见可能比较小的模型更严重。这一发现对于AI领域的研...

Read More
2023-08-28 talkingdev

FineRecon:深度感知前馈网络实现细节丰富的3D重建

苹果公司最新的研究成果在3D物体重建这一具有挑战性的问题上展现了惊人的性能。这项名为FineRecon的新技术,利用深度感知前馈网络,将2D图像转化为精细的3D模型。这一突破性的技术有望在许多领域得到应用,包括虚拟...

Read More
2023-08-28 talkingdev

微软开源DeepSpeed训练长文本模型

DeepSpeed是微软推出的一个库,可以用来扩大语言模型的预训练。虽然使用起来有些复杂,但它提供了强大的抽象功能。微软最近添加了序列并行性,可以训练具有更长上下文长度的模型。这并不是一个新的突破,而是对开源...

Read More
2023-08-28 talkingdev

精调版Llama编码模型在编码基准测试上超过GPT-4

拥有海量高质量内部数据的公司已发布了精调版Llama,它在编码方面的能力非常高。这是在Meta发布其新的编程语言模型后的几天内完成的。重要的是要注意,当前GPT-4的版本在编码方面仍然优于任何开源模型。本文将新的Ll...

Read More
2023-08-25 talkingdev

开源的AutoML网络应用程序

近日,GitHub平台上发布了一个名为AutoML的网络应用程序。该应用程序是用于训练机器学习管道的工具,它采用了MLJAR AutoML技术。通过这款应用程序,用户可以更方便、快捷地对各种机器学习模型进行训练,无需深入了解...

Read More
2023-08-25 talkingdev

一键从命令行进行微调:新工具助力gpt-3.5-turbo调优

近日,一款新的工具引发了业界的广泛关注。这款工具可以自动化gpt-3.5-turbo的调优过程,用户只需一键操作,即可使用本地磁盘上的文件进行调优。这一技术的出现无疑为大数据处理和人工智能的发展带来了新的可能性。...

Read More
2023-08-25 talkingdev

朝向AGI:我们还缺少什么?

本文探讨了为何现有的大型语言模型(LLMs)不太可能导致人工通用智能(AGI)的发展,以及为何物理学本身将阻止我们从现在的状态突然跃升到AGI。当前的LLMs,虽然在某些方面已经取得了显著的进步,但是在理解和推理的...

Read More
2023-08-25 talkingdev

人类反馈改善语言模型:DPO在Llama 2的应用

人类反馈在改善语言模型对齐和整体性能方面扮演着关键角色。然而,使用近端策略优化进行训练的过程中存在一些挑战。最近的研究表明,可以直接针对人类偏好进行优化,从而绕过奖励模型。借助基于文本的强化学习,你可...

Read More
  1. Prev Page
  2. 406
  3. 407
  4. 408
  5. Next Page