漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-16 talkingdev

论文:自我指涉的元语言测试,为语言模型带来新挑战

自我指涉语句是一种挑战,例如“这个句子中的最后一个单词是is”。语言模型在处理这种语言时会遇到极大的困难。该论文介绍了一个数据集以及一些评估,以帮助改进语言模型的元语言能力。研究人员采用了一种混合方法来生...

Read More
2024-01-15 talkingdev

斯坦福Monarch-32k检索模型发布,比闭源嵌入式模型表现更佳

Together Compute一直在探索不同的Transformer替代方案。最近,他们发布了一款检索模型,该模型的表现优于许多闭源嵌入式模型,适用于检索任务。该模型命名为Monarch Mixer 32k。它是一个基于深度神经网络的模型,可...

Read More
2024-01-12 talkingdev

使用Distilabel技术的DPO数据集

一种新的方法可以过滤高质量的配对偏好以进行对齐。它可以显著提高基准模型的性能。

Read More
2024-01-11 talkingdev

Mixtral of Experts论文发布

Mixtral论文已经发布。该论文没有讨论预训练数据集。大部分的内容都是众所周知的,但是在专家路由评估的讨论中有一个有趣的新见解。

Read More
2024-01-10 talkingdev

DeepSeek LLM技术报告发布:接近GPT-3.5水平

去年最好的编码模型之一是DeepSeek LLM。它在许多基准测试中接近GPT-3.5(即使它可能是3倍大小)。有关模型训练,令牌计数,模型架构等的信息已在技术报告中发布。DeepSeek LLM是一种基于语言模型的编码器,它使用自...

Read More
2024-01-08 talkingdev

论文:无人驾驶中的语义分割技术(CAINet)

研究人员开发了一种名为CAINet的新方法来改进RGB-T语义分割技术,这对于无人驾驶至关重要。该系统独特地结合了不同类型的数据,注重它们的互补性和全局上下文。CAINet使用了一个基于注意力机制的自适应特征融合模块...

Read More
2024-01-03 talkingdev

PostgreSQL在2024年的展望与思考

PostgreSQL是一款备受欢迎的关系型数据库管理系统,它在安全性、可靠性和扩展性方面表现出色。随着2024年的到来,PostgreSQL将迎来一系列新功能和改进,包括更好的分区支持、更快的查询性能、更好的数据集成和更多的...

Read More
2023-12-26 talkingdev

qsv:一款并行化CPU加速的CSV文件处理工具

qsv是一款并行化、CPU加速的命令行程序,可用于查询、索引、切片、分析、过滤、增强、转换、排序、验证和连接CSV文件。它具有超过50个简单、快速和可组合的命令,旨在处理大型数据集而无需专业编程技能。此外,它还...

Read More
2023-12-25 talkingdev

UDiffText-提高AI生成图片中的文字质量

UDiffText是一种全新的方法,可以提高AI生成图片中的文字质量。通过使用专门的文本编码器和大型数据集进行微调,UDiffText显著减少拼写错误并提高文字准确性。

Read More
2023-12-25 talkingdev

论文:采用序列感知损失函数的图像生成技术

研究人员开发了一种“序列感知”损失函数,以改进去噪概率模型(DPM),解决了图像生成中时间步长相关性的问题。这种新方法不仅提供了更紧凑的损失估计,而且在诸如CIFAR10和CelebA等数据集上显示出显著的图像质量改进,...

Read More
  1. Prev Page
  2. 17
  3. 18
  4. 19
  5. Next Page