漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-31 talkingdev

微软发布新型AI训练法“思想算法”

微软发布了一种名为“思想算法”(AoT)的新型AI训练方法,旨在使大型语言模型如ChatGPT的推理能力更加高效和类人化。这种新颖的AI训练方法是微软在人工智能领域的一项重要突破,表明了微软在深化机器学习和人工智能技...

Read More
2023-08-30 talkingdev

开源工具DSPy:可提升语言模型的理解和学习能力

GitHub近日发布了新工具DSPy,这是一套简洁的Python模块集,能够统一调动和微调语言模型(LMs)的技术,并通过推理和工具/检索增强来改进它们。DSPy的设计理念是使得这些复杂的技术可以通过简洁的代码实现,同时也使得...

Read More
2023-08-28 talkingdev

OpenLemur - 代码模型没有语言技能,但可以弥补

封闭源代码模型如Claude或GPT-4之所以令人印象深刻,是因为它们在推理能力和通用语言能力方面表现出色。许多开放的替代方案专注于极其狭窄的技能领域,而忽视了其他方面。OpenLemur项目的目标是在许多不同的任务中平...

Read More
2023-08-25 talkingdev

朝向AGI:我们还缺少什么?

本文探讨了为何现有的大型语言模型(LLMs)不太可能导致人工通用智能(AGI)的发展,以及为何物理学本身将阻止我们从现在的状态突然跃升到AGI。当前的LLMs,虽然在某些方面已经取得了显著的进步,但是在理解和推理的...

Read More
2023-08-25 talkingdev

法律推理基准:测量语言模型在法律框架中的推理能力

在一个大规模的合作努力下,我们构建了一个基准,用于度量语言模型在法律框架中的推理能力。这项工作的关键在于,我们需要警惕已经训练过的模型中的污染。语言模型在训练过程中可能会被各种各样的数据源影响,这些数...

Read More
2023-08-24 talkingdev

Roboflow-最新开源的视觉模型推理工具

Roboflow推理是一种在最先进的计算机视觉模型上运行推理的工具。它可以在各种设备和环境上部署,无需机器学习的先验知识。Roboflow推理支持目标检测、分类、实例分割模型以及基础模型。有一个展示Roboflow推理在足球...

Read More
2023-08-23 talkingdev

HuggingFace发布视觉/语言模型IDEFICS:复制并优化Flamingo模型

人工智能公司HuggingFace近日发布了IDEFICS,这个名字是一个复杂的缩写,全称为Image-aware Decoder Enhanced à la Flamingo with Interleaved Cross-attentionS。IDEFICS实质上是Flamingo模型的复制版本,Flamingo...

Read More
2023-08-18 talkingdev

WizardLM,利用强化进化指令教大型语言模型进行推理

近期,WizardLM团队的研究进展备受关注。他们最新的论文探讨了用于指令调整的数据策划问题。WizardLM在强化学习部分做出了突破性的提升,成功超越了许多封闭源模型在数学和推理任务上的表现。他们的研究成果可能会对...

Read More
2023-08-17 talkingdev

SPP开源,利用LLMs增强问题解决能力

近日,一项研究引入了一种名为Solo Performance Prompting(SPP)的方法。该方法利用LLMs中的多个角色模拟认知协同,这是一种提高问题解决能力的协作过程。通过使用经过精细调整的角色,SPP使LLMs能够处理需要深度领...

Read More
2023-08-14 talkingdev

机器学习模型是记忆还是泛化?揭秘模型训练动态

本文探讨了一个微型模型的训练动态,并反向工程了它找到的解决方案。这为我们揭示了一个令人兴奋的新兴领域——机械可解释性。机器学习模型在工作时,是通过记忆数据还是通过泛化理解进行推理?这是一个长期存在且至关...

Read More
  1. Prev Page
  2. 20
  3. 21
  4. 22
  5. Next Page