语言模型的相关内容 - 漫话开发者

2024-04-02 talkingdev

论文：视觉语言模型遇到难题：新基准测试与改进方向

视觉语言模型（VLMs）在处理输入图像时，有时会遇到无法回答的问题。即便是最先进的VLMs，如GPT-4V，也面临这一挑战。本文提出了一个针对VLMs在面对无解问题时的基准测试，并探讨了一些可能的改进方向。研究者们通过...

2024-04-01 talkingdev

EvoEval是一套全新的基准测试工具，专为评估大型语言模型（LLMs）的编码能力而设计。该测试套件采用了比以往更加严格的测试标准，以确保对LLMs编程能力的全面检测。EvoEval的发布意味着开发者和研究人员现在可以更准...

2024-03-29 talkingdev

谷歌发布了一份数据集和基准测试，用以展示各语言模型生成事实信息的能力。本报告深入分析了如何提升模型的真实性，并揭示在多数情况下语言模型胜过人类注释者。这一发现不仅对技术领域产生重大影响，也对如何使用人...

2024-03-29 talkingdev

1比特语言模型的研究为深度学习领域带来了新的突破。该技术通过在不损失性能的前提下，对语言模型中的线性层进行量化处理，实现了模型大小的大幅压缩。这一创新使得原本只能在高性能计算平台上运行的700亿参数模型，...

2024-03-29 talkingdev

AI21实验室近日发布了一款新型语言模型——Jamba，它采用了独特的模型结构，旨在实现比Transformers更高的效率，同时保持相当的性能水平。Jamba模型的最大亮点在于其创新性地融合了MoE（Mixture of Experts）层，这使...

2024-03-28 talkingdev

研究人员发现一种侧信道攻击手段，该手段通过利用加密内的令牌传输，能够以高准确率解密AI助手的特定话题聊天内容。这种攻击方法使用大型语言模型将令牌序列重构为可读文本，可能会暴露用户的敏感对话。除了谷歌的Ge...

2024-03-28 talkingdev

语言模型（LLMs）的实用性在于其速度、准确性以及遵循指令的能力。这三个特性使得通过文本输入控制的街头霸王模拟器成为了衡量不同模型在这三个方面表现的绝佳方式。GitHub上的一个项目通过这种方式为LLMs提供了一个...

2024-03-28 talkingdev

随着人工智能的蓬勃发展，行业内的人才争夺战达到了前所未有的激烈程度。企业为了吸引具备开发生成性AI技术的专业知识和经验的人才，提供了百万美元的年薪和加快股票归属时间表等丰厚待遇。与此同时，科技行业的其他...