漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-03-13 talkingdev

Cursor揭秘AI代码助手模型评估体系:线上线下混合评测确保开发体验

AI代码助手Cursor近日公开了其核心的模型质量评估方法论,采用线上线下混合评估流程,旨在确保其对模型性能的理解与开发者的实际工作体验紧密对齐。该体系的核心在于其内部评估套件CursorBench,它基于Cursor工程团...

Read More
2026-03-09 talkingdev

开源|Karpathy发布AutoResearch项目:单GPU驱动的AI自主研究循环

知名AI研究员、前特斯拉AI总监Andrej Karpathy近日在GitHub上开源了AutoResearch项目,该项目旨在构建一个能够在单GPU小型LLM训练环境中运行的AI驱动自主研究循环系统。该系统允许AI智能体自动修改代码和指导文件,...

Read More
2026-01-23 talkingdev

小模型大作为:谷歌提出分解法,实现更优意图理解,兼顾效率与隐私

谷歌研究团队近日发布了一项关于提升智能体意图理解能力的技术成果。核心观点指出,要让AI智能体真正发挥作用,其底层模型必须精准理解用户交互时的真实意图。当前,大型多模态大语言模型虽已在此任务上表现不俗,但...

Read More
2025-11-29 talkingdev

[开源]FalkorDB发布超高速图数据库,专为LLM知识图谱应用打造

近日,开源社区迎来一款突破性的图数据库FalkorDB,该数据库底层采用GraphBLAS技术实现稀疏邻接矩阵图表示,展现出卓越的性能表现。作为专门针对大语言模型优化的知识图谱解决方案,FalkorDB旨在为GraphRAG(图检索...

Read More
2025-11-19 talkingdev

谷歌发布Antigravity:专为Gemini 3打造的“智能体优先”编程工具

谷歌最新推出的Antigravity是一款基于VSCode分支开发的免费集成开发环境,其核心创新在于采用“智能体优先”架构,专门为Gemini 3大模型优化设计。该工具能够同时运行多个自主AI智能体,并直接对接代码编辑器、终端和...

Read More
2025-11-13 talkingdev

深度解析微软AI战略全景:OpenAI合作、数据中心投资、Neocloud租赁与自研芯片Maia

半导体研究机构SemiAnalysis最新报告系统拆解了微软的AI战略布局。该战略以与OpenAI的深度合作为核心,结合数据中心扩建、Neocloud云服务租赁模式、GitHub Copilot开发者工具链、MAI系列模型及自研AI芯片Maia,构建...

Read More
2025-11-05 talkingdev

MCP代码执行技术:构建更高效AI代理的新突破

最新技术研究显示,通过模型上下文协议(MCP)实现的代码执行功能正在显著提升AI代理的运行效率。这项突破性技术使AI代理能够在连接多个MCP服务器时,大幅减少令牌消耗,最高可降低98.7%的上下文开销。传统方法中,...

Read More
2025-10-31 talkingdev

Kimi Linear技术报告发布:新型架构实现注意力机制效率突破

月之暗面(Moonshot AI)正式发布Kimi Linear技术报告,这项突破性架构通过创新设计实现了对传统全注意力机制的全面超越。该架构在保持同等性能水平下,将KV缓存使用量最高降低75%,在100万上下文长度场景中解码吞吐...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page