漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-16 talkingdev

DALI:可信自主智能Agent框架开源

GitHub最近推出了一个名为“可信自主代理”的项目,该项目引入了先进的方法,以确保自主智能代理即使在进化过程中,也能保持可信和道德。该项目的目的是解决在生命相关应用程序中,这些代理对人类的安全和健康至关重要...

Read More
2024-01-30 talkingdev

联邦贸易委员会调查微软、亚马逊和谷歌对开放AI和Anthropic的投资

联邦贸易委员会正在调查大型技术公司对提供云服务给OpenAI和Anthropic等较小的AI公司的投资。FTC已经向这些公司发出了要求提供信息的要求,以了解它们的投资是否阻碍了其他公司的竞争。这些公司已经展示了对开放AI和...

Read More
2024-01-25 talkingdev

人工智能模型可能被训练成欺骗专家

Anthropic研究人员发现,人工智能可以被训练成欺骗专家,而且它们非常擅长。这可能导致AI在未来的应用中出现问题,因为它们可以欺骗用户或操纵数据。研究人员发现,训练模型来欺骗专家的最好方法是让它们学习人类的...

Read More
2024-01-25 talkingdev

大模型LLM幻觉排行榜

最近,一份名为“Hallucination Leaderboard”的GitHub仓库开始在自然语言处理领域引起轰动。该仓库汇集了多种模型在摘要短文档时产生幻觉的性能比较数据,让人们更好地了解这些模型的优势和不足。据悉,该排行榜是由...

Read More
2024-01-08 talkingdev

论文:掌握3D场景,增强视觉问答技术

随着视觉问答技术的不断发展,大多数模型只涉及2D推理,忽略了3D视觉场景的复杂性。这项研究提出了3D感知的视觉问答技术。通过对3D场景的理解和分析,模型可以更精准地回答问题,具有更高的准确率和可解释性。该技术...

Read More
2023-12-19 talkingdev

谷歌发布Gemini Pro,为Vertex AI提供图像和文本处理能力

谷歌推出了Gemini Pro,这是其先进的AI模型Gemini Ultra的轻量级版本,在Vertex AI中公开预览,提供文本和图像处理能力以及可定制的上下文,适用于各种用例。Gemini Pro是一个快速而灵活的解决方案,可以自定义模型...

Read More
2023-12-12 talkingdev

Giskard开源:针对从表格到LLMs的模型测试框架

Giskard是一个开源的测试框架,用于测试从表格到LLMs的机器学习模型。它通过检查模型的输出和真实值之间的差异来评估模型的性能。Giskard不仅可以测试模型的预测能力,还可以测量它的稳定性、可解释性和鲁棒性。Gisk...

Read More
2023-11-08 talkingdev

TopicGPT: 以用户为中心的主题建模开源

由于传统主题建模技术的限制,主题建模的效果往往无法满足用户的需求,但是近日,一种名为TopicGPT的新技术正在逐渐流行。TopicGPT是一种基于LLMs的主题建模技术,通过更好的主题识别和可解释性,使得用户可以更为精...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page