漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-01 talkingdev

论文:Seismic使用更快的嵌入搜索进行文本检索

Seismic是一种创新的组织倒排索引的方法,它通过学习稀疏嵌入大大提高了文本检索的速度和准确性。倒排索引是一种常用的信息检索技术,其基本原理是通过构建单词到文档的映射,从而快速找到包含特定单词的文档。而Sei...

Read More
2024-04-30 talkingdev

StoryDiffusion:远距离图像和视频生成技术

StoryDiffusion是一项新的机器学习技术,可用于生成具有长距离相关性的图像和视频。它使用了一种称为StoryGAN的生成模型,可以根据输入的故事情节和场景描述生成相关的图像和视频。这项技术有助于解决传统图像和视频...

Read More
2024-04-30 talkingdev

人工智能并非无用,但真的值得吗?

本文对人工智能和机器学习进行了深入剖析,认为尽管AI工具在某些任务中可能有所用处,但它们常常未能达到AI公司所作的宏大承诺。文章强调了AI实际应用案例,如编程辅助和语言生成,与行业叙事设定的过高期待之间的巨...

Read More
2024-04-30 talkingdev

Mistral.rs:一款快速的LLM开源推理平台

近日,一款名为Mistral.rs的LLM推理平台在GitHub上备受关注。它可以支持多种设备上的推理,支持量化,并且具有易于使用的应用程序,带有OpenAI API兼容的HTTP服务器和Python绑定。无论是在深度学习推理、设备兼容性...

Read More
2024-04-30 talkingdev

星际编程2 15B模型:人类与合成数据的混合训练成果

星际编程2 15B模型是一款在合成数据和人类数据上进行训练的人工智能模型。该模型在humaneval测试中获得了72.6的高分,表现出色。开发者在训练过程中不仅展示了他们的数据管道复制能力,还提供了将合成数据应用于其他...

Read More
2024-04-30 talkingdev

论文:以FP6-LLM新装包格式加速训练,实现全张量核心利用

浮点精度的降低能够提高训练速度,但可能会导致不稳定的现象。最新的研究论文展示,通过新的装包格式FP6-LLM,可以在不引发常见不稳定性或由于尝试不当引发的训练速度下降的情况下,实现全张量核心的利用。这一突破...

Read More
2024-04-30 talkingdev

开放式Gato复制:全面任务模型JAT的训练与评估

近日,与Hugging Face团队相关联的研究者们,训练并评估了一种名为JAT(Jack-of-All-Trades)的模型,这是一种全面任务模型,能在各种不同的任务上表现出相当的效果。此模型的出现,为深度学习领域的多任务学习提供...

Read More
2024-04-30 talkingdev

GitHub发布新项目Copilot Workspace,让语言模型帮助完成功能和修复错误

GitHub近日宣布启动一个新项目Copilot Workspace,其主要目标是允许语言模型以较为自主的方式完成特性开发和错误修复。该项目将为开发者提供更多便利,提高开发效率,同时也为人工智能在软件开发领域的应用开启了新...

Read More
  1. Prev Page
  2. 55
  3. 56
  4. 57
  5. Next Page