漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-29 talkingdev

论文:LLM中的长篇文章真实性研究

谷歌发布了一份数据集和基准测试,用以展示各语言模型生成事实信息的能力。本报告深入分析了如何提升模型的真实性,并揭示在多数情况下语言模型胜过人类注释者。这一发现不仅对技术领域产生重大影响,也对如何使用人...

Read More
2024-03-29 talkingdev

1比特语言模型:后训练量化技术助力在消费级GPU上运行700亿参数模型

1比特语言模型的研究为深度学习领域带来了新的突破。该技术通过在不损失性能的前提下,对语言模型中的线性层进行量化处理,实现了模型大小的大幅压缩。这一创新使得原本只能在高性能计算平台上运行的700亿参数模型,...

Read More
2024-03-29 talkingdev

AI21发布Jamba语言模型,性能超越Transformers

AI21实验室近日发布了一款新型语言模型——Jamba,它采用了独特的模型结构,旨在实现比Transformers更高的效率,同时保持相当的性能水平。Jamba模型的最大亮点在于其创新性地融合了MoE(Mixture of Experts)层,这使...

Read More
2024-03-28 talkingdev

黑客可通过侧信道攻击解密AI助手的私密对话

研究人员发现一种侧信道攻击手段,该手段通过利用加密内的令牌传输,能够以高准确率解密AI助手的特定话题聊天内容。这种攻击方法使用大型语言模型将令牌序列重构为可读文本,可能会暴露用户的敏感对话。除了谷歌的Ge...

Read More
2024-03-28 talkingdev

通过街头霸王游戏测试基准语言模型

语言模型(LLMs)的实用性在于其速度、准确性以及遵循指令的能力。这三个特性使得通过文本输入控制的街头霸王模拟器成为了衡量不同模型在这三个方面表现的绝佳方式。GitHub上的一个项目通过这种方式为LLMs提供了一个...

Read More
2024-03-28 talkingdev

AI人才争夺战:百万薪酬和整队收购

随着人工智能的蓬勃发展,行业内的人才争夺战达到了前所未有的激烈程度。企业为了吸引具备开发生成性AI技术的专业知识和经验的人才,提供了百万美元的年薪和加快股票归属时间表等丰厚待遇。与此同时,科技行业的其他...

Read More
2024-03-27 talkingdev

人工智能模型Claude-3展现特殊智能,超越人类智商

近期,由Anthropic开发的最新人工智能模型Claude-3在高级认知任务上的表现超越了普通人类智商,并且在某些领域胜过了业界知名的GPT-4模型。然而,尽管在这些复杂任务上表现出色,Claude-3在处理一些人类认为简单的谜...

Read More
2024-03-27 talkingdev

AI搜索引擎为何无法取代谷歌搜索的真相解析

尽管AI技术日益进步,谷歌搜索的地位似乎并未受到太大威胁。谷歌搜索不仅复杂,而且用户需求多样化。虽然基于大型语言模型的AI工具在某些特定情况下可能比谷歌的搜索结果更有用,但对于大多数用例而言,AI仍难以取代...

Read More
  1. Prev Page
  2. 38
  3. 39
  4. 40
  5. Next Page