漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-15 talkingdev

LiveCodeBench:对大型编程语言模型进行全面无污染的评估

评估训练编程语言模型的性能是一个具有挑战性的任务。大多数人使用OpenAI的HumanEval。然而,一些开放的模型似乎会过度拟合到这个基准。LiveCodeBench是一种测量编程性能的方法,同时减轻污染问题。

Read More
2024-03-14 talkingdev

MoAI:整合视觉任务信息的增强型语言模型

MoAI是一种新型的大型语言和视觉模型,它通过整合专门的计算机视觉任务的辅助视觉信息来增强当前模型。该模型在 GitHub 上发布,旨在改善自然语言处理和计算机视觉任务之间的互动。MoAI使用了一种新的训练方法,可以...

Read More
2024-03-13 talkingdev

FastV: 优化视觉语言模型效率方法开源

该项目提出了一种改善大型视觉语言模型(例如LLaVA-1.5、QwenVL-Chat和Video-LLaVA)效率的方法,解决了“低效的注意力”问题。使用FastV这种新方法,通过修剪视觉令牌和学习自适应注意力模式来优化这些模型,从而显著...

Read More
2024-03-13 talkingdev

OpenAI发布Transformer调试工具

OpenAI的超对齐团队开发了一款名为Transformer Debugger的工具,以支持对小型语言模型的特定行为进行调查。该工具将自动可解释性技术与稀疏自编码器相结合。

Read More
2024-03-13 talkingdev

论文:小成本实现语言模型部分窃取

据报道,使用公共API即可窃取闭源语言模型的部分内容,例如嵌入层。这项技术只需不到2000美元的预算即可实现。

Read More
2024-03-13 talkingdev

Transformer Debugger: 为小型语言模型提供自动可解释性技术支持

Transformer Debugger是一种工具,它通过将自动可解释性技术与稀疏自动编码器相结合,支持对小型语言模型的特定行为进行调查。

Read More
2024-03-12 talkingdev

微软AICI-实时控制语言模型的输出

人工智能控制界面(AICI)使您能够构建控制器,以实时约束和指导大型语言模型的输出。通过AICI,用户可以使用自己的约束条件或限制来约束模型的输出,同时还可以通过实时反馈来调整约束条件,从而实现更好的模型输出...

Read More
2024-03-12 talkingdev

Cohere For AI发布Command-R多语言模型

Cohere For AI发布了一个30B+参数模型,该模型在10种语言的推理、摘要和问答方面非常擅长。该模型名为Command-R,是自然语言处理领域的一项重大突破。Command-R模型可以在多语言环境下进行推理和答案提取,这对于跨...

Read More
2024-03-12 talkingdev

Covariant推出ChatGPT,为机器人构建LLM

Covariant推出了RFM-1,旨在通过利用其Brain AI平台的大规模数据收集,为机器人语言构建大型语言模型,提高机器人在各行业的决策和交互能力。这将彻底改变机器人的行业应用,为机器人开启新的聊天界面。ChatGPT将有...

Read More
2024-03-12 talkingdev

xAI的语言模型Grok将于本周开源

据Elon Musk在X上透露,xAI的语言模型Grok将在未来几天内开源。 Grok是xAI的一项重要技术,它基于深度学习技术,能够快速地处理自然语言,并在文本中找到有意义的信息。Grok已经在xAI内部使用了很长时间,现在将会对...

Read More
  1. Prev Page
  2. 25
  3. 26
  4. 27
  5. Next Page