漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-12 talkingdev

TIM新方法提升机器翻译性能,表现超过现有技术

研究人员已经开发出一种名为TIM的新方法,通过向其展示正确和错误的翻译示例,来教导语言模型更好地翻译文本。这种方法在WMT2022数据集上的测试表明,其性能超过了现有的翻译技术。TIM的出现,无疑为机器翻译领域带...

Read More
2023-07-12 talkingdev

FreeDrag:更准确的图像编辑方法,解决DragGAN的准确性问题

近期,研究者们推出了名为FreeDrag的图像编辑新方法,以解决前一模型DragGAN在跟踪点位准确性上常出现的问题。经过一系列实验,研究者们发现,FreeDrag的全新特性导向方式,采用自适应模板特性、线性搜索以及模糊定...

Read More
2023-07-12 talkingdev

bitsandbytes发布4位推理,实现AI模型精度与速度的突破

AI模型包含许多参数,它们在计算机中以十进制数字的形式表示。这些数字的精度决定了它们的准确度和占用的空间大小。如果将精度从32位降低到16位,将会大幅提高运行速度。现在,我们可以将精度降低到4位,从而在一些...

Read More
2023-07-12 talkingdev

Anthropic发布新模型Claude 2:提供更强大的性能和扩展响应

Anthropic公司最近发布了其最新模型Claude 2。Claude 2提供了改进的性能,扩展的响应,并可通过API和beta站点进行访问。Claude 2拥有增强的推理,编码和数学能力,可以处理每个提示中多达100K的令牌,使其能够处理复...

Read More
2023-07-11 talkingdev

树莓派集群上运行llama 65B模型?(GitHub议题)

GGML是一个开源库,用于在低资源设备上运行语言模型。最近,团队已经进行了并行推理的MPI(Message Passing Interface)工作。现在,随着这些变化的实施,团队正在努力在树莓派集群上推理llama 65B模型。这一行动可...

Read More
2023-07-11 talkingdev

创新模型DPC-DUN:使图像修复更快更好

这项研究介绍了动态路径可控的深度展开网络(DPC-DUN),这是一种创新的模型,优化了压缩感测(CS)中的图像重建,平衡了性能和复杂性,以提高效率和结果。DPC-DUN模型通过动态路径控制,实现了对算法的灵活配置和优化,...

Read More
2023-07-11 talkingdev

个人设备上运行大型语言模型的开源模拟器INT-FP-QSim

本文介绍了一个名为INT-FP-QSim的开源模拟器。这款模拟器的主要功能是测试大型语言模型和视觉变换器在不同数值精度级别下的运行效果。大型语言模型和视觉变换器在AI领域具有广泛的应用,然而,由于其复杂的计算需求...

Read More
2023-07-10 talkingdev

无需强化学习环节的逆向强化学习:快速且稳健

逆向强化学习有时被称为行为克隆或专家模仿。它通过引入一个内部强化学习环路,将监督调优的简单任务变得复杂。然而,如果我们去掉这个环路,我们可以获得强化学习探索的许多优势,同时避免了函数近似问题的挑战。这...

Read More
  1. Prev Page
  2. 395
  3. 396
  4. 397
  5. Next Page