漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-04 talkingdev

[开源]Nebius推出Kvax:基于JAX的Flash Attention优化实现,助力长上下文训练

Nebius近日开源了Kvax项目,这是一个基于JAX框架的Flash Attention实现,专门针对长上下文训练场景进行了优化。Kvax通过创新的上下文并行技术和高效的文档掩码计算,实现了更快的训练速度和更高的数据密度压缩,在性...

Read More
2025-03-26 talkingdev

[开源]FastCuRL-1.5B-Preview:通过课程强化学习推动慢思维推理模型的进步

FastCuRL-1.5B-Preview 是一种基于课程强化学习(Curriculum Reinforcement Learning)的慢思维推理模型,该模型在较少的训练步骤中实现了最先进的性能,展示了其在复杂推理任务中的潜力。相比传统方法,FastCuRL 通...

Read More
2025-03-13 talkingdev

[开源]LM-Implicit-Reasoning:探究语言模型的逐步隐式推理能力

近日,GitHub开源项目LM-Implicit-Reasoning引发了广泛关注。该研究深入探讨了语言模型在逐步隐式推理方面的表现,揭示了其在处理包含变量作为减数的表达式时的泛化能力不足的问题。语言模型在自然语言处理(NLP)领...

Read More
2025-01-11 talkingdev

数据监控平台Datadog收购自然语言处理初创企业Quickwit

全球领先的云监控和分析平台Datadog近日宣布收购自然语言处理(NLP)领域的初创企业Quickwit。Quickwit以其领先的语言理解能力而著称,其技术能够处理和解析复杂的查询语句,并将这些查询转化为机器可以理解的数据请...

Read More
2024-12-26 talkingdev

papermatch:可对ArXiv论文进行语义搜索

近日,一个网站引起了科技界的关注,该网站提供了一种全新的功能,即可对ArXiv上的论文进行语义搜索。这一功能利用自然语言处理(NLP)技术,允许用户通过输入论文的关键词或者摘要描述来搜索相关论文,极大地提高了...

Read More
2024-12-15 talkingdev

Buzee文件搜索应用开源

开发者在社区分享了自己失败的创业项目Buzee,这是一个文件搜索应用。Buzee旨在提高用户查找和管理文件的效率,通过集成自然语言处理(NLP)技术,实现对文件内容的智能搜索。尽管项目最终未能成功,但开发者选择将其...

Read More
2024-07-18 talkingdev

Prover-Verifier改善LLM可读性

OpenAI训练了一个强大的模型,以便为弱模型输出更易读的文本,并发现这导致了LLM整体可读性的普遍提高。通过对弱模型进行精准评估,强模型的文本输出效果得到大幅提升。在日常实际应用中,这种提升将促进文本信息的...

Read More
2024-06-25 talkingdev

在TRL中训练视觉模型

TRL是一个Hugging Face库,专为使用强化学习训练变形金刚设计。这个示例允许您对基于视觉的语言模型如LLaVA进行相同的处理。Hugging Face是一个开源NLP(自然语言处理)社区和公司,致力于使用人工智能推动自然语言...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page