漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-05 talkingdev

[开源]WebThinker:赋能大语言模型的深度研究框架

中国人民大学自然语言处理实验室推出的WebThinker框架,标志着大语言模型(LRMs)向自主科研领域迈出关键一步。该开源项目通过构建深度研究架构,使LRMs具备三项突破性能力:1)智能化的全网信息检索系统,可自主定...

Read More
2025-05-04 talkingdev

[开源]TScale-基于消费级GPU的分布式训练框架

GitHub开源项目TScale提出了一种创新性的分布式训练解决方案,允许开发者在消费级GPU集群上高效运行大规模模型训练。该项目通过优化通信协议和资源调度算法,显著降低了分布式训练的硬件门槛,使中小型研究团队也能...

Read More
2025-05-04 talkingdev

3D打印设计优化:机械结构设计的深度解析

Rahix的博客文章《Design for 3D-Printing》深入探讨了专为3D打印优化的机械设计方法。文章指出,3D打印技术的快速发展为机械设计带来了全新的可能性,但也提出了独特的挑战。作者详细分析了如何利用3D打印的特性(...

Read More
2025-05-03 talkingdev

从Next.js到Ruby on Rails:一家公司的技术栈迁移心路历程

近日,Hardcover团队在其博客中详细分享了他们从Next.js迁移至Ruby on Rails及Inertia.js的技术决策过程。这篇题为《我们为何不再爱Next.js,重新爱上Ruby on Rails》的文章引发了开发者社区的广泛讨论,在Hacker Ne...

Read More
2025-05-02 talkingdev

[开源] BLAST:斯坦福大学发布高性能浏览器-LLM自动扩展服务引擎

斯坦福大学MAST实验室推出的BLAST项目,是一款专为浏览器增强型大语言模型(LLM)设计的高性能服务引擎。该技术旨在简化网页浏览AI代理的部署流程,显著提升响应速度并优化成本管理。其核心创新包括:1)自动并行化...

Read More
2025-05-02 talkingdev

微软OmniParser v2.0:全新截图解析工具性能大提升

微软近日发布了其广受欢迎的截图解析工具OmniParser的重大版本更新——OmniParser v2.0。作为一款领先的视觉信息处理工具,新版本在Screenshot Pro基准测试中表现优异,展现了微软在计算机视觉和自然语言处理领域的技...

Read More
2025-05-02 talkingdev

OpenAI计划推出开源AI模型,支持云端大模型协同计算

OpenAI宣布将于今夏发布一款可自由下载的开源AI系统,旨在性能上超越Meta、DeepSeek等竞争对手。该模型拟引入革命性的'任务转交'功能,当遭遇复杂查询时可无缝衔接云端部署的更大规模OpenAI模型进行联合计算。这一技...

Read More
2025-05-02 talkingdev

[论文推荐]Fed-SB提出基于LoRA-SB的联邦学习微调方案,显著降低通信成本

Fed-SB研究团队在arXiv最新论文中提出了一种突破性的联邦学习框架LoRA-SB,该技术通过低秩自适应(Low-Rank Adaptation, LoRA)方法实现大型语言模型(LLM)的高效分布式微调。这一创新方案通过参数高效微调(PEFT)技术,...

Read More
  1. Prev Page
  2. 18
  3. 19
  4. 20
  5. Next Page