漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-01 talkingdev

xAI发布新一代模型Grok 1.5,提升编程与检索能力

人工智能公司xAI近日宣布推出其最新模型Grok 1.5,该模型具有128k的上下文长度,能够更好地理解复杂的问题并提供准确的回答。Grok 1.5的推理能力得到了显著提升,尤其在信息检索和编程领域表现出色。这使得开发者和...

Read More
2024-03-29 talkingdev

AI未来展望:加速回报定律与指数级增长

AI未来学家雷·库兹韦尔提出了加速回报定律,该定律表明随着时间的推移,进步的速度以指数级速率增长。在最近一次讨论中,库兹韦尔探讨了多个话题,包括不断改善的前景、AI经济的发展方向、人类与AI的关系、长寿逃逸...

Read More
2024-03-29 talkingdev

MRA开源-高分辨率大型语言视觉助手

研究人员最近开发出一种名为Mixture-of-Resolution Adaptation(MRA)的新技术,该技术能够显著提升人工智能在图像识别中的细节识别能力。MRA方法通过调整AI模型对图像分辨率的适应度,使其更加精准地捕捉图像中的细...

Read More
2024-03-29 talkingdev

论文:CoDA技术助力AI模型无监督领域适应能力提升

CoDA作为一种新的无监督领域适应(UDA)方法,通过在场景和图像两个层面学习差异,帮助AI模型更好地适应未标记的、具有挑战性的环境。CoDA的核心在于利用大量未标记数据来训练模型,使其在面对新场景时仍能保持高效...

Read More
2024-03-29 talkingdev

论文:LLM中的长篇文章真实性研究

谷歌发布了一份数据集和基准测试,用以展示各语言模型生成事实信息的能力。本报告深入分析了如何提升模型的真实性,并揭示在多数情况下语言模型胜过人类注释者。这一发现不仅对技术领域产生重大影响,也对如何使用人...

Read More
2024-03-29 talkingdev

1比特语言模型:后训练量化技术助力在消费级GPU上运行700亿参数模型

1比特语言模型的研究为深度学习领域带来了新的突破。该技术通过在不损失性能的前提下,对语言模型中的线性层进行量化处理,实现了模型大小的大幅压缩。这一创新使得原本只能在高性能计算平台上运行的700亿参数模型,...

Read More
2024-03-29 talkingdev

AI21发布Jamba语言模型,性能超越Transformers

AI21实验室近日发布了一款新型语言模型——Jamba,它采用了独特的模型结构,旨在实现比Transformers更高的效率,同时保持相当的性能水平。Jamba模型的最大亮点在于其创新性地融合了MoE(Mixture of Experts)层,这使...

Read More
2024-03-28 talkingdev

英伟达GPU在MLPerf推理测试中夺魁

近日,英伟达的GPU在MLPerf推理测试中取得了优异的成绩,尤其是H200型号。MLPerf推理测试是业界公认的深度学习性能评估基准,对AI系统的推理能力进行全方位评测。在此次测试中,英伟达的GPU展现了其在处理复杂机器学...

Read More
  1. Prev Page
  2. 249
  3. 250
  4. 251
  5. Next Page