漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-18 talkingdev

[论文推荐] 突破长文本限制:新型“Power”注意力机制实现高效训练

一项名为“Power”注意力的创新技术通过引入超参数p,实现了对状态大小的独立控制,有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力,并支持定制GPU内核,在64k上下文长度下速度...

Read More
2025-07-15 talkingdev

谷歌Gemini API正式推出Gemini Embedding文本模型,支持多语言与长文本处理

谷歌开发者博客宣布,其首个Gemini Embedding文本模型现已在Gemini API和Vertex AI中正式向开发者开放。这一模型提供了跨领域的统一尖端体验,支持超过100种语言,并具备2048个最大输入标记长度的处理能力。Gemini E...

Read More
2025-07-04 talkingdev

KyutaiTTS开源-支持流式传输与低延迟的TTS引擎

法国研究机构Kyutai Labs近日开源其文本转语音(TTS)系统Kyutai TTS,该技术凭借L40S GPU实现32请求并行处理时仅350毫秒的延迟表现,达到行业领先水平。系统创新性地提供单词级时间戳输出功能,英语和法语的字错误...

Read More
2025-06-10 talkingdev

Chonkie:超轻量级闪电式文本分块,支持多语言与云端部署

Chonkie是一款革命性的开源文本分块库,以其超轻量级架构和闪电般的处理速度重新定义了文本预处理效率。作为GitHub上的明星项目,它具备多语言处理能力、云端就绪特性以及丰富的功能集,支持主流分词器、嵌入模型和A...

Read More
2025-03-12 talkingdev

[论文推荐] 广义离散扩散: 提升文本数据去噪效率与自校正能力

在最新的研究进展中,科学家提出了一种广义离散扩散方法,该方法显著改进了在文本等离散数据上的扩散过程。这一创新通过引入一种广义的去噪过程和略微改进的掩码方案,使得训练过程更加高效,并赋予了模型自我校正输...

Read More
2025-03-10 talkingdev

Gemini推出全新文本Embedding模型,性能卓越且价格合理

近日,Gemini团队宣布成功训练并发布了一款全新的文本Embedding模型。该模型在多项基准测试中表现优异,不仅性能卓越,还具备出色的运行速度。此外,其定价策略也相当合理,使其成为市场上极具竞争力的选择。这一模...

Read More
2025-02-26 talkingdev

XLabs推出基于Flux模型的LoRA系列,真实感模型备受青睐

近日,XLabs宣布在强大的Flux模型基础上训练了一系列实用的LoRA模型,其中最受欢迎的是真实感模型。这些LoRA模型通过优化embedding技术,显著提升了生成内容的质量和多样性。真实感模型在图像生成和文本处理领域表现...

Read More
2025-02-16 talkingdev

Kreuzberg:现代异步Python库助力文档文本提取

近日,一款名为Kreuzberg的现代异步Python库在技术社区中引起了广泛关注。该库专注于文档文本提取,旨在为开发者提供高效、灵活的解决方案。Kreuzberg通过异步编程模型,显著提升了文本提取的速度和效率,尤其适用于...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page