Transformers的相关内容 - 漫话开发者

2025-07-02 talkingdev

Sentence Transformers推出稀疏编码器微调功能，助力混合搜索与重排序

Sentence Transformers最新升级引入对稀疏嵌入模型训练的支持，这一技术突破特别适用于混合搜索和重排序场景。该博客详细解析了模型的核心组件与训练步骤，并重点介绍了基于SPLADE架构的现成模型。稀疏编码技术通过...

2025-06-24 talkingdev

近日，SGLang宣布成功集成Transformers后端技术，这一重大进展使开发者能够将Hugging Face的模型API与SGLang的高吞吐量、低延迟引擎相结合。该集成不仅显著提升了模型推理效率，还为自然语言处理（NLP）领域的实时应...

2025-04-30 talkingdev

关系图Transformer（Relational Graph Transformers）作为一种前沿的人工智能技术，正在企业数据处理领域引发革命性变革。该技术通过图神经网络与Transformer架构的创新融合，能够有效解决企业级数据中的复杂关系建...

2025-04-25 talkingdev

近日，Hugging Face Hub发布的Omdet Turbo技术标志着实时开放词汇对象检测领域取得显著进展。该技术通过优化模型架构和算法效率，在保持高精度的同时大幅提升检测速度，解决了传统对象检测系统在动态场景中响应延迟...

2025-04-23 talkingdev

本文深入探讨了图Transformer这一新兴技术架构，及其与图神经网络(GNN)的对比关系。作为图表示学习领域的最新进展，图Transformer通过自注意力机制直接建模图中节点间的全局依赖关系，突破了传统GNN基于局部邻域聚合...

2024-09-17 talkingdev

随着人工智能领域的不断发展，变换器（Transformers）模型在处理序列性问题方面表现出色。近期的研究表明，思维链（Chain of Thought）技术能够进一步提升变换器的效率，尤其在解决需要多步骤推理的任务时。这一方法...

2024-07-11 talkingdev

现在，你可以通过在模型的首次运行中将一些懒加载移动到模型上，以极小的每秒令牌损失来显著提升模型初始化的速度。这种改进将大大提升模型运行效率，为用户带来更流畅的体验。

2024-07-11 talkingdev

最近，GitHub仓库发布了一款名为minRF的新工具。这个工具主要使用了可扩展的矩形流转换器，部分用于Stable Diffusion 3。这个仓库是一种最小化实现，同时也包括muP超参数扫描功能。可扩展的矩形流转换器是一种强大的...