漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-28 talkingdev

如何看待通用人工智能(AGI)

尽管一些专家认为通用人工智能(AGI)可能在不久的将来实现,但由于缺乏对一般智能的连贯理论模型以及对大型语言模型(LLM)为何或如何如此高效的理解,整体共识仍然不确定。讨论强调了围绕AGI的巨大未知数,类似于...

Read More
2024-05-28 talkingdev

xAI完成60亿美元B轮融资,推动AI系统发展

近日,xAI宣布完成了由顶级投资者领投的60亿美元B轮融资。本轮融资将用于推进其AI系统的发展,包括增强版的Grok-1模型。资金将主要用于产品的市场推广策略、基础设施建设以及研发。本次融资的成功体现了市场对xAI技...

Read More
2024-05-28 talkingdev

Anthropic发布新方法解读大型语言模型Claude Sonnet的内部运作

Anthropic的研究人员近日公布了一种解读其大型语言模型Claude Sonnet内部运作的新方法。他们通过绘制出数百万个与各种概念相对应的特征,成功解析了这个模型的内在机制。这一可解释性研究不仅有助于我们更好地理解AI...

Read More
2024-05-27 talkingdev

LoRA-Ensemble:提升自注意力网络的预测精度

LoRA-Ensemble是一种面向自注意力网络的参数高效深度集成方法。该技术扩展了低秩适配(LoRA)的应用,通过隐式集成实现了在不增加传统集成方法高计算成本的情况下,仍能做出准确且校准良好的预测。这种方法不仅在精...

Read More
2024-05-27 talkingdev

论文:语言模型可重复评估方法的新思路

评估语言模型一直以来都是一个复杂的任务,尤其是在大多数评估细节都只存在于大型公司内部的情况下。这篇论文展示了一套可重复且强大的评估标准,为研究人员提供了一个实用的框架。论文中包括了对困惑度评估的详细讨...

Read More
2024-05-27 talkingdev

论文:Lyft利用强化学习技术优化司机与乘客匹配

Lyft团队采用在线强化学习技术,通过司机未来收入来奖励司机,从而实现司机与乘客的匹配优化。这种方法使得匹配过程能够实时显著改进,每年为乘客额外创造了大约3000万美元的收入。强化学习是一种机器学习技术,它通...

Read More
2024-05-25 talkingdev

大语言模型在财务报表分析中的应用

最近,一项新的研究表明,大语言模型可以用来帮助金融分析师更快地分析公司的财务报表。这些模型可以利用自然语言处理技术,自动识别和解释公司的财务数据,为分析师提供更准确的预测和决策。这种方法已经在一些金融...

Read More
2024-05-24 talkingdev

SirLLM:增强大模型长期记忆的方法开源

近年来,大型语言模型在自然语言处理领域取得了显著进展,但在长时间对话中保持记忆仍然是一个巨大的挑战。为了解决这一问题,研究人员提出了一种新的方法:Streaming Infinite Retentive LLM(SirLLM)。这种方法允...

Read More
  1. Prev Page
  2. 82
  3. 83
  4. 84
  5. Next Page