一项名为“Power”注意力的创新技术通过引入超参数p,实现了对状态大小的独立控制,有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力,并支持定制GPU内核,在64k上下文长度下速度...
Read More谷歌开发者博客宣布,其首个Gemini Embedding文本模型现已在Gemini API和Vertex AI中正式向开发者开放。这一模型提供了跨领域的统一尖端体验,支持超过100种语言,并具备2048个最大输入标记长度的处理能力。Gemini E...
Read More法国研究机构Kyutai Labs近日开源其文本转语音(TTS)系统Kyutai TTS,该技术凭借L40S GPU实现32请求并行处理时仅350毫秒的延迟表现,达到行业领先水平。系统创新性地提供单词级时间戳输出功能,英语和法语的字错误...
Read MoreChonkie是一款革命性的开源文本分块库,以其超轻量级架构和闪电般的处理速度重新定义了文本预处理效率。作为GitHub上的明星项目,它具备多语言处理能力、云端就绪特性以及丰富的功能集,支持主流分词器、嵌入模型和A...
Read More在最新的研究进展中,科学家提出了一种广义离散扩散方法,该方法显著改进了在文本等离散数据上的扩散过程。这一创新通过引入一种广义的去噪过程和略微改进的掩码方案,使得训练过程更加高效,并赋予了模型自我校正输...
Read More近日,Gemini团队宣布成功训练并发布了一款全新的文本Embedding模型。该模型在多项基准测试中表现优异,不仅性能卓越,还具备出色的运行速度。此外,其定价策略也相当合理,使其成为市场上极具竞争力的选择。这一模...
Read More近日,XLabs宣布在强大的Flux模型基础上训练了一系列实用的LoRA模型,其中最受欢迎的是真实感模型。这些LoRA模型通过优化embedding技术,显著提升了生成内容的质量和多样性。真实感模型在图像生成和文本处理领域表现...
Read More近日,一款名为Kreuzberg的现代异步Python库在技术社区中引起了广泛关注。该库专注于文档文本提取,旨在为开发者提供高效、灵活的解决方案。Kreuzberg通过异步编程模型,显著提升了文本提取的速度和效率,尤其适用于...
Read More