HuggingFace的相关内容 - 漫话开发者

2025-06-27 talkingdev

Bria开源新一代T2I模型：4B参数媲美Flux质量，体积缩小三分之二

视觉AI平台服务商Bria推出新一代开源文本生成图像（T2I）模型，其技术突破引发行业关注。该模型仅用4B参数即实现与Adobe Firefly 4.0和Flux[Dev]相当的生成质量，同时模型体积缩减67%。核心技术亮点包括：集成Contro...

2025-06-24 talkingdev

近日，SGLang宣布成功集成Transformers后端技术，这一重大进展使开发者能够将Hugging Face的模型API与SGLang的高吞吐量、低延迟引擎相结合。该集成不仅显著提升了模型推理效率，还为自然语言处理（NLP）领域的实时应...

2025-06-19 talkingdev

近日，Moonshot AI推出的Kimi-Dev-72B开源模型在SWE-bench Verified测试中取得了60.4%的优异成绩，成为当前开源模型中的新标杆。这一突破性成果得益于其采用的大规模强化学习技术，该技术通过在Docker环境中直接修补...

2025-06-17 talkingdev

Groq的低延迟硬件技术现已正式成为Hugging Face Hub及SDK的可选推理服务提供商，这一合作标志着AI基础设施领域的重大突破。通过集成Groq的专用处理器架构，开发者能够以服务器无感知（serverless）方式极速调用Llama...

2025-06-17 talkingdev

Hugging Face平台上的Nanonets-OCR-s项目近日引发技术社区关注，该OCR模型能够将复杂文档（如PDF、扫描件）高效转换为结构化Markdown格式，解决了传统OCR输出非结构化数据的行业痛点。其技术亮点包括基于深度学习的...

2025-06-16 talkingdev

人工智能领域迎来重要进展，Featherless AI近日正式成为Hugging Face平台的推理服务提供商。这一合作将为开发者带来革命性的无服务器（serverless）模型访问体验，用户无需管理底层基础设施即可直接调用包括Meta、Qw...

2025-06-10 talkingdev

Hugging Face最新发布的ScreenSuite是一款专为评估视觉语言模型（Vision-Language Models, VLMs）在图形用户界面（GUI）智能体任务中表现而设计的基准测试套件。该工具通过提供标准化的评估框架，填补了当前多模态模...

2025-06-09 talkingdev

微软研究院最新提出的GUI-Actor技术，彻底改变了AI代理与图形用户界面（GUI）的交互方式。这项突破性技术摒弃了传统依赖像素坐标预测的方法，转而采用注意力机制直接解析屏幕截图内容，使AI能够像人类一样'理解'界面...