漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-21 talkingdev

利用LLM生成随机模糊测试工具

像Claude这样的大型语言模型(LLMs)能够为解析代码生成有效的模糊测试工具,这一过程传统上需要大量的人力投入。尽管LLMs通常在精确度上不足以进行静态分析,但它们似乎非常适合创建模糊测试工具,因为模糊测试的随机...

Read More
2024-03-21 talkingdev

交互式推理技术助力大型视觉语言模型更精准理解图像

Chain-of-Spot(CoS)技术近日提出了一种交互式推理方法,该方法大幅提升了大型视觉语言模型(LVLMs)处理和理解图像的能力。CoS通过识别图像中对于特定问题或指令的关键区域,使得LVLMs能够在不损失图像分辨率的前...

Read More
2024-03-21 talkingdev

GPT-5或于今年夏季发布,预计将大幅升级ChatGPT

据报道,OpenAI计划在今年2024年夏季发布一个重要的人工智能模型,可能是GPT-5。这个新模型预计是一个多模态大型语言模型,其功能与GPT-4相似,但性能更为优秀。目前,OpenAI仍在对该模型进行训练,训练完成后将进行...

Read More
2024-03-20 talkingdev

Fitbit携手谷歌Gemini打造AI健身教练,提供个性化健康建议

Fitbit正与谷歌合作开发基于Gemini的大型语言模型,旨在通过Fitbit应用程序为用户提供个性化的健康建议和指导。这项技术的开发将使得Fitbit用户能够获得更加精准的健康和健身指导,从而更好地实现个人健康目标。通过...

Read More
2024-03-20 talkingdev

人工智能发展遇瓶颈?GPT-4等大型语言模型显现收益递减

近期研究表明,人工通用智能(AGI)的发展可能并未如预期那般顺利。尽管投入了更多的资源,像GPT-4这样的大型语言模型(LLMs)却表现出硬件扩展的极限,收益递减的现象。这意味着,随着模型规模的扩大,其性能提升的...

Read More
2024-03-20 talkingdev

LlamaGym:在线强化学习优化大模型Agent

近日,GitHub上出现了一个新的项目LlamaGym,该项目专注于通过在线强化学习方法对大型语言模型(LLM)代理进行微调。大型语言模型在近年来取得了显著的进展,但如何进一步提升其性能,尤其是在特定任务上的表现,成...

Read More
2024-03-20 talkingdev

新技术助力模型持续学习:MoE适配器框架

研究人员开发了一种新框架,通过为新任务增加特殊适配器的方式来扩展模型,帮助视觉-语言模型在不遗忘之前知识的情况下进行持续学习。这一技术突破为深度学习模型的持续学习能力提供了新的解决方案,能够有效避免传...

Read More
2024-03-20 talkingdev

Quiet-Star:提升语言模型输出准确性的推理框架开源

Quiet-Star是一个推理框架,旨在增强语言模型生成正确输出的能力。该框架的代码已经公开,同时发布了一个每个令牌8步的模型。Quiet-Star通过优化模型的推理过程,提高了生成文本的准确性和相关性,对于自然语言处理...

Read More
  1. Prev Page
  2. 68
  3. 69
  4. 70
  5. Next Page