漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-11 talkingdev

[论文推荐]强化学习预训练(RPT):大语言模型与强化学习融合的新范式

强化学习预训练(Reinforcement Pre-Training, RPT)作为大语言模型(LLM)与强化学习(RL)协同进化的前沿技术,提出了一种革命性的规模化训练范式。该技术通过创新性地利用海量文本数据进行通用强化学习预训练,在...

Read More
2025-04-29 talkingdev

Valeo AI推出VaViM和VaVAM:生成式视频模型革新自动驾驶轨迹预测

Valeo AI最新发布了两项突破性技术:VaViM自回归视频模型和VaVAM驾驶轨迹预测模型。VaViM通过时空令牌序列预测技术,实现了对连续视频帧的高精度建模;而VaVAM则创新性地将学习到的视频表征通过模仿学习转化为可执行...

Read More
2024-11-26 talkingdev

最近邻攻击:AI安全新挑战

最近邻攻击是一种新型的安全威胁,它通过精心设计的输入扰动,使得机器学习模型的预测结果偏离真实目标,而指向攻击者指定的最近邻类别。这种攻击手段对于基于深度学习的图像识别系统尤为危险,因为它可以迷惑模型,...

Read More
2024-07-12 talkingdev

LookbackLens-解决LLM幻觉问题的最简方案

Lookback Lens是一个直接的模型,用于检测大型语言模型中的上下文幻觉。它通过在预测过程中引入更多的上下文信息,来解决大型语言模型(LLM)在生成文本时可能出现的幻觉问题。这种新的方法旨在提高模型预测的准确性...

Read More
2023-11-21 talkingdev

数据驱动的人工智能崛起

前Atlassian首席技术官兼现任Coatue Ventures董事总经理Sri Viswanath深入探讨了人工智能的现状。虽然这是一份117页的文件,但本文对亮点进行了很好的总结。文章指出,人工智能正在成为一种基础设施,被广泛应用于各...

Read More
2023-09-08 talkingdev

论文:运用大型语言模型预测股票趋势

这篇论文介绍了一种使用大型语言模型(LLMs)快速分析公司的年度报告的方法,使得理解公司的财务健康状况,甚至预测股票价格变得更加简单。LLMs可以处理大量文本信息,提炼出关键数据,使投资者能够在短时间内获取到公...

Read More
2023-06-27 talkingdev

Giskard:一个专注于机器学习模型测试的开源框架

Giskard是一个专注于机器学习模型测试的开源框架,适用于从表格模型到LLM(Language Learning Models)的各种模型。该框架提供了一套强大的工具和方法,帮助开发人员测试和验证机器学习模型的准确性和鲁棒性。Giskar...

Read More