漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-06-15 talkingdev

开源| Ponytail:让AI Agent像最懒的资深程序员一样思考,不写代码才是最高效的代码

在AI辅助编程日益普及的今天,如何让AI Agent生成更简洁、更高效的代码,避免过度工程化,成为开发者社区关注的热点。GitHub上一个名为Ponytail的新兴开源工具,以其反直觉的核心理念——“让你的AI Agent像房间里最懒...

Read More
2026-06-13 talkingdev

Moonshot AI发布Kimi K2.7-Code:推理令牌用量较K2.6降低30%,采用修改版MIT许可证开源

国内AI初创公司Moonshot AI于本周正式发布了其K2编程模型家族的最新开源版本——Kimi K2.7-Code。据该团队宣称,与上一代K2.6相比,新模型在保持高性能的同时,实现了推理过程中令牌(token)使用量降低30%的显著突破...

Read More
2026-05-20 talkingdev

AI2发布OlmoEarth v1.1:行星级遥感分析成本骤降3倍,性能不变

艾伦人工智能研究所(Ai2)最新发布的OlmoEarth v1.1模型家族,在遥感智能分析领域实现了显著的成本突破。该系列模型通过创新的序列长度优化技术,将处理遥感数据的计算成本最高降低至原来的三分之一(即3倍效率提升...

Read More
2026-05-18 talkingdev

开源|Semble:为AI智能体打造的代码搜索神器,Token消耗减少98%

Semble是一款由MinishLab开发的高性能代码搜索库,专为帮助AI智能体通过自然语言快速定位代码片段而设计。它的核心亮点在于大幅降低Token消耗——相比传统的‘grep+read’方法,Semble能减少约98%的Token使用量,同时保...

Read More
2026-05-08 talkingdev

AlphaEvolve:谷歌Gemini驱动的AI编码代理,正在多领域引发颠覆性突破

谷歌DeepMind团队近日发布了其最新成果AlphaEvolve,这是一个由Gemini大模型驱动的自主编码代理。与普通的代码助手不同,AlphaEvolve的核心能力在于设计并生成高级算法,而不仅仅是补全或改写现有代码。它已经能够在...

Read More
2026-05-06 talkingdev

12百万token上下文窗口被打破:Subquadratic发布超长上下文AI模型

上下文窗口的大小一直是大型语言模型在处理长文本任务时的关键瓶颈。近日,初创公司Subquadratic宣布推出一款全新的AI模型,其上下文窗口达到了惊人的1200万token(约合1200万个单词或代码标记),远超过当前主流模...

Read More
2026-04-14 talkingdev

论文推荐|DeepMind提出弹性循环Transformer:参数锐减4倍,视觉生成质量依然顶尖

DeepMind的研究团队近日在arXiv上发布了一项名为“弹性循环Transformer”的创新工作,为视觉生成模型领域带来了显著的效率突破。传统视觉生成模型通常依赖堆叠大量独立的Transformer层,导致参数量庞大。ELT的核心创新...

Read More
2026-03-26 talkingdev

前沿AI模型研发成本揭秘:最终训练仅占研发计算开销的少数

根据最新研究分析,AI前沿模型的最终训练运行只是漫长且昂贵研发过程中的最后一步。在最终训练之前,企业需投入大量计算资源进行多尺度实验、生成合成数据、测试新想法以及训练未发布的中间模型。因此,开发一个模型...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page