漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-06 talkingdev

LoRA无憾:低秩适配技术全面匹敌全参数微调,突破大模型高效训练瓶颈

思维机器实验室最新研究揭示了低秩适配技术(LoRA)在大语言模型微调领域的突破性表现。这项发表于权威平台的研究表明,当LoRA应用于模型所有层(尤其是MLP层)且不受数据集规模限制时,其性能可完全媲美传统全参数...

Read More
2025-10-04 talkingdev

Python PEP 810提案:引入显式惰性导入语法,提升大型项目性能

Python社区近日正式提出PEP 810提案,旨在通过引入显式惰性导入语法优化模块加载机制。该提案允许开发者通过特定语法声明延迟加载模块,仅在首次使用时执行导入操作,可显著改善大型Python应用的启动性能。目前该提...

Read More
2025-10-03 talkingdev

开源|Vision-Zero:基于视觉博弈策略的自监督VLM训练框架

Vision-Zero项目提出了一种突破性的视觉语言模型训练范式,通过生成式对抗游戏实现自监督学习。该框架的核心创新在于利用任意图像对构建竞争性视觉游戏,使模型在无需人工标注的情况下,通过策略性自我博弈持续优化...

Read More
2025-10-03 talkingdev

Comet浏览器全球正式发布:AI原生浏览器重塑网络交互体验

在经历高需求测试阶段后,Perplexity公司正式面向全球用户推出Comet浏览器。这款AI原生浏览器通过深度融合人工智能技术,旨在重构用户的在线交互范式。其核心突破在于将大语言模型能力与浏览器底层架构结合,实现智...

Read More
2025-10-02 talkingdev

谷歌发布Tunix:基于JAX的LLM后训练工具库,加速大模型生产部署

谷歌开发者博客最新推出开源项目Tunix,这是一个基于JAX框架原生设计的专业化工具库,致力于简化大型语言模型从预训练到完全对齐、生产就绪的完整流程。该库为开发者提供了一套全面且友好的工具集,支持大规模模型对...

Read More
2025-10-02 talkingdev

Thinking Machines实验室推出Tinker API:革新语言模型微调技术

Thinking Machines实验室近日正式发布Tinker API,这一创新平台为开源权重语言模型的精细化调优提供了灵活接口。该技术通过抽象化底层基础设施复杂度,显著降低了开发者部署大型语言模型的技术门槛。特别值得关注的...

Read More
2025-10-01 talkingdev

Anthropic提出AI代理上下文工程新范式:突破有限上下文窗口的智能管理策略

人工智能安全研究公司Anthropic最新发布了关于AI代理上下文工程的技术实践报告。该研究聚焦于在有限上下文窗口内优化令牌分配的核心挑战,提出通过系统指令、工具配置、数据筛选和对话历史的精准协同,实现推理效果...

Read More
2025-09-28 talkingdev

Manas AI再获2600万美元种子扩展融资,霍夫曼与穆克吉联手打造AI药物发现新势力

由LinkedIn联合创始人里德·霍夫曼与普利策奖得主、癌症研究员悉达多·穆克吉共同创立的AI药物发现公司Manas AI,在完成1月2460万美元种子轮融资后,近日再获2600万美元种子扩展资金。这家总部位于纽约的AI原生药物研...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page