漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-12 talkingdev

TIM新方法提升机器翻译性能,表现超过现有技术

研究人员已经开发出一种名为TIM的新方法,通过向其展示正确和错误的翻译示例,来教导语言模型更好地翻译文本。这种方法在WMT2022数据集上的测试表明,其性能超过了现有的翻译技术。TIM的出现,无疑为机器翻译领域带...

Read More
2023-07-11 talkingdev

科学研究中的符号和结构回归分析

科学研究的大部分都依赖于回归分析。然而,回归分析并不能揭示被研究问题的潜在结构。如果你采用结构化和符号化的回归分析,它可以揭示问题之前未被理解的部分。在研究过程中,使用结构化和符号化的回归分析可以使我...

Read More
2023-07-11 talkingdev

创新模型DPC-DUN:使图像修复更快更好

这项研究介绍了动态路径可控的深度展开网络(DPC-DUN),这是一种创新的模型,优化了压缩感测(CS)中的图像重建,平衡了性能和复杂性,以提高效率和结果。DPC-DUN模型通过动态路径控制,实现了对算法的灵活配置和优化,...

Read More
2023-07-11 talkingdev

个人设备上运行大型语言模型的开源模拟器INT-FP-QSim

本文介绍了一个名为INT-FP-QSim的开源模拟器。这款模拟器的主要功能是测试大型语言模型和视觉变换器在不同数值精度级别下的运行效果。大型语言模型和视觉变换器在AI领域具有广泛的应用,然而,由于其复杂的计算需求...

Read More
2023-07-10 talkingdev

AI的工具箱:初探代码解释器

ChatGPT的代码解释器利用GPT-4在持久化工作空间中编写和执行程序,使AI能够做到以前无法做到的事情。用户可以上传文件供代码解释器分析或修改。本文为读者提供了有关代码解释器以及如何使用它的概述。代码解释器将很...

Read More
2023-07-10 talkingdev

扩展AI的记忆:专注Transformer(GitHub Repo)

该研究介绍了一种新的技术,专注变压器,这种技术可以帮助AI模型在处理大量数据的情况下,记住并专注于相关的信息。该方法改进了AI如何理解和使用长篇的文本,他们在OpenAI的模型上的测试显示了这一点。专注变压器的...

Read More
2023-07-10 talkingdev

美国国防部试验生成型AI 加快数据处理与创新解决方案

美国国防部正在成功地测试用于军事任务的大型语言模型(LLMs),旨在加速数据请求并生成新颖的解决方案。五角大楼正在与像Scale AI这样的科技初创公司合作,实验五个LLMs。这是他们在军事领域中更广泛的数据整合和数...

Read More
2023-07-08 talkingdev

提升LLMs问题解决能力的新技术——FLACUNA

最近一份技术报告详细介绍了FLACUNA,这是一种可以提高问题解决能力的语言模型。FLACUNA是通过使用一个名为FLANMINI的自定义指令数据集对VICUNA进行微调而创建的,VICUNA是另一种大型语言模型。FLACUNA的出现,对于...

Read More
  1. Prev Page
  2. 177
  3. 178
  4. 179
  5. Next Page