漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-21 talkingdev

CPO策略提高翻译语言模型的能力

该项目提出了对比优化策略(CPO),以提高机器翻译中中等规模语言模型的性能。将该方法应用于13B参数ALMA模型,解决了监督微调的局限性,并取得了改进。CPO策略通过对模型的预训练进行增量式微调,有助于提高机器翻译...

Read More
2024-01-15 talkingdev

论文:语言模型对提示词敏感研究

最近的研究表明,根据提示对模型进行少量训练,可以在任务上达到4-88%的准确率。这项研究展示了如何科学地改进您的提示,从而提高模型的准确性。这项技术对于自然语言处理领域的未来具有重要意义。

Read More
2024-01-12 talkingdev

Unsloth轻量化库加速TRL上的模型

Unsloth是一个轻量化库,可加速语言模型的微调。它现在可以轻松地与TRL在常见的模型架构上配合使用。Unsloth库通过一个简单的API使得模型训练和微调更快速。它可以帮助从训练数据中自动学习、优化和微调模型,使得模...

Read More
2024-01-11 talkingdev

论文:谷歌研究人员提出自我对弈优化算法,致力于简化AI对齐

谷歌研究人员提出了一种名为Self-Play Preference Optimization (SPO) 的自我对弈优化算法。该算法相比传统的强化学习对齐方式更加简单。研究人员运用博弈论,找到了对噪声干扰鲁棒性强、性能表现优异的单人自我对弈...

Read More
2024-01-08 talkingdev

英特尔称Gaudi 2芯片超越A100

英特尔推出的新芯片在多个平台和本地部署中可用,具有出色的训练吞吐量、浮点运算次数和解码带宽。英特尔的新型AI加速卡Gaudi 2在性能上超越了Nvidia的A100。该芯片采用Intel的海湾科技,这是一种可扩展的、可重复使...

Read More
2024-01-08 talkingdev

OpenAI发布官方Prompt工程指南

OpenAI发布了一份全面的、分步骤的指南,分享了如何从大型语言模型(如GPT-4)中获得更好的结果的策略和技巧。该指南提供了从选择Prompt到微调和优化的详细步骤,并介绍了一些最佳实践和调试技巧。此外,该指南还包...

Read More
2024-01-08 talkingdev

2024年我如何编写CSS

2024年的CSS具有跨浏览器支持嵌套、:has()、容器查询等功能。现在有许多框架和编译器可以帮助优化CSS加载性能和强大的快速CSS工具。本文是关于CSS生态系统的笔记和思考的集合。它涵盖了许多变化,并提供了有用工具的...

Read More
2024-01-04 talkingdev

论文:改进稳定性的单幅图像超分辨率技术

研究人员开发了一种新的方法,通过关注两个关键方面来提高单幅图像超分辨率:潜在高分辨率图像的最佳质心和影响图像质量的固有噪声。其方法还使用了一个新的深度学习框架,该框架可以显著提高超分辨率的稳定性,避免...

Read More
  1. Prev Page
  2. 193
  3. 194
  4. 195
  5. Next Page