漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-25 talkingdev

人类反馈改善语言模型:DPO在Llama 2的应用

人类反馈在改善语言模型对齐和整体性能方面扮演着关键角色。然而,使用近端策略优化进行训练的过程中存在一些挑战。最近的研究表明,可以直接针对人类偏好进行优化,从而绕过奖励模型。借助基于文本的强化学习,你可...

Read More
2023-08-25 talkingdev

论文:LiDAR点追踪3D物体的新方法

大多数计算机视觉工具在使用LiDAR点追踪3D物体时,由于干扰或未注意到长期运动,常常遇到困难。为了解决这些问题,MTM-Tracker混合使用了两种方法,并分为两个阶段进行工作。在第一阶段,MTM-Tracker使用基于模型的...

Read More
2023-08-24 talkingdev

Llama.cpp,新的GGML格式可支持更多模型

Llama.cpp是一个运行本地语言模型的简便方式。然而,它目前受到底层GGML格式的限制。为了解决这个问题,我们提出了一个新的格式,并开始进行集成。新的GGML格式将更加灵活,可以支持更多的模型,这将有助于推动机器...

Read More
2023-08-24 talkingdev

Clip4Cir开源-使用CLIP和标题改进图像搜索

该项目引入了一种搜索图像的方法,该图像看起来像给定的图片,但是在标题中描述了变化。它使用了增加了特殊技巧的CLIP模型。该方法在FashionIQ和CIRR等流行的图像搜索数据集上表现更好。CLIP模型是一个多模态视觉模...

Read More
2023-08-23 talkingdev

sumtitup:一款免费开源的AI文本摘要器

名为“汇总一切”的产品是一款免费且开源的AI摘要器,无论是任何文本、文章,还是歌曲,它都可以进行有效的摘要。这款工具利用先进的人工智能技术,通过对输入的文本进行深度学习和理解,生成简洁、精炼的摘要。作为一...

Read More
2023-08-23 talkingdev

开源Whisper API:实现自我托管的语音转文本转录

近日,一个名为Whisper API的开源项目在GitHub上引起了广泛关注。该项目提供了一个自我托管的API,用于进行语音到文本的转录。这一切都是通过使用一个精心调整的Whisper自动语音识别模型来实现的。这个项目的出现将...

Read More
2023-08-23 talkingdev

Meta's Threads开始在Web上推出,扎克伯格直接瞄准马斯克的X

Meta's Threads已开始在Web上推出。在接下来的几周内,Web版本将得到改进,使其更像移动应用程序。Meta目前正在开发一个搜索功能,以提高Threads的功能,并使其更具竞争力。该公司在服务更加成熟之前没有计划将其商...

Read More
2023-08-22 talkingdev

我如何让Stable Diffusion XL变得更智能

在这篇文章中,Max Woolf详细解释了他如何通过训练AI生成的劣质图像,使Stable Diffusion的最新版变得更好。他通过深度学习技术,让AI从错误中学习,并在此基础上进行改进。这种方法不仅提高了AI生成图像的质量,还...

Read More
2023-08-22 talkingdev

AI的初期阶段:从LLMs、Transformer到扩散模型

我们当前的时代正处于一个全新的人工智能阶段,这个阶段的特点是LLMs、变压器和扩散模型的广泛应用。这与以往的人工智能发展阶段有着明显的区别。LLMs是一种复杂的深度学习模型,可以处理大量的数据并预测结果。变压...

Read More
2023-08-22 talkingdev

一位即将退休的顾问对顾问的建议

一位即将退休的顾问为其他顾问提供了宝贵的建议。顾问行业一直以来都是一个充满挑战和机遇的领域,这位退休顾问分享了他多年的经验和教训。他首先强调了顾问应该持续学习和更新知识的重要性。随着科技的快速发展,顾...

Read More
  1. Prev Page
  2. 32
  3. 33
  4. 34
  5. Next Page