漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-03 talkingdev

[论文推荐]GNN与Transformer结合:新型神经网络架构预测器诞生

研究人员最新提出了一种创新的神经网络架构预测器,该预测器将图神经网络(GNN)与Transformer架构相结合,通过引入兄弟感知令牌混合器(sibling-aware token mixer)和双向图同构前馈网络(bidirectional graph iso...

Read More
2025-06-25 talkingdev

[论文推荐]ContinualFlow:生成模型中的持续流优化技术

近日,一项名为ContinualFlow的创新技术为生成模型领域带来突破性进展。该技术通过流向能量重加权目标的匹配方法,直接从模型分布中剔除不需要的区域,从而避免了传统方法所需的完整模型重新训练过程。这一技术的核...

Read More
2025-06-19 talkingdev

企业级AI的未来是智能体?Glean与451 Research联合解析行业趋势

6月25日,知名分析机构451 Research与AI企业Glean将联合举办线上研讨会,深度探讨企业级AI向智能体(Agentic)转型的技术路径与市场机遇。本次会议将发布基于全球500强企业的AI应用调研数据,揭示智能体技术在自动化...

Read More
2025-06-16 talkingdev

ParetoQ算法突破低比特量化技术瓶颈,统一二元、三元及2至4位量化方案

PyTorch官方博客最新发布的ParetoQ训练算法在低比特量化领域取得重大突破。该技术首次实现了二元(1-bit)、三元(1.58-bit)和2至4位量化的统一框架,并在所有量化级别上均达到当前最优性能。这一突破性进展尤其适...

Read More
2025-06-13 talkingdev

字节跳动Seedance 1.0登顶视频生成基准测试,超越谷歌Veo 3与OpenAI Sora

字节跳动旗下TikTok母公司最新发布的Seedance 1.0模型在文本生成视频(text-to-video)和图像生成视频(image-to-video)两项核心任务中均位列榜首,其性能表现超越谷歌Veo 3与OpenAI Sora等业界标杆。该模型仅需41...

Read More
2025-06-11 talkingdev

[论文推荐]专家模型集成共识机制:迈向自适应临床AI的新路径

随着大语言模型(LLMs)在临床领域的应用日益广泛,当前技术主要依赖单一模型架构的局限性逐渐显现。针对这一现状,最新提出的'共识机制'框架通过模拟临床分诊和多学科协作决策流程,构建了由专业医疗代理模型组成的...

Read More
2025-06-11 talkingdev

[开源] 高性能色彩量化工具Patolette,突破传统算法限制

开发者big-nacho近日在GitHub开源了个人项目Patolette,这是一个基于前沿论文实现的高端色彩量化工具。该项目源于作者工作中遇到的色彩量化问题,在发现一篇创新论文却找不到现有实现后,决定自行开发并逐渐深入优化...

Read More
2025-06-09 talkingdev

[开源]阿里开源Qwen3 Embedding系列模型,8B版本登顶MTEB多语言榜单

阿里巴巴近日开源了Qwen3 Embedding系列模型,其8B参数版本在权威的MTEB多语言排行榜上位列第一。这一系列模型为开发者提供了构建RAG系统、语义搜索引擎和文档检索应用的强大工具,支持超过100种语言的处理需求。模...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page