漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-23 talkingdev

AI推理新挑战:基准测试揭示智能体工作负载对引擎性能的深层影响

随着人工智能向智能体(Agent)方向演进,传统的大模型推理基准测试正面临根本性变革。智能体工作负载不再是简单的单轮问答,而是包含多轮交互、工具调用等复杂场景。这种变化给推理引擎带来了前所未有的压力,尤其...

Read More
2026-02-23 talkingdev

开源|突破显存限制:开发者实现单张RTX 3090运行Llama 3.1 70B,NVMe直连GPU绕过CPU

近日,在GitHub上开源名为“ntransformer”的高效大语言模型推理引擎项目,其核心创新在于探索并实现了通过NVMe存储设备直接与GPU通信,绕过CPU和系统内存的传统数据路径,从而在消费级显卡RTX 3090上成功运行了参数量...

Read More
2026-01-19 talkingdev

开源|Flux 2图像生成模型迎来纯C语言推理实现:性能与可移植性新突破

近日,知名开发者antirez在GitHub上开源了项目“flux2.c”,该项目实现了当前热门的Flux 2图像生成模型的纯C语言推理引擎。这一举措在技术社区引发了广泛关注,在Hacker News上获得了285点热度并积累了112条深度讨论。...

Read More
2025-12-22 talkingdev

卡帕西年度回顾:2025年大语言模型的五大范式变革

人工智能领域知名专家安德烈·卡帕西(Andrej Karpathy)近期发布了其对2025年大语言模型(LLM)发展的年度回顾,系统性地梳理了行业在过去一年中经历的深刻范式转变。报告指出,技术演进的核心驱动力已从单纯追求模...

Read More
2025-12-12 talkingdev

谷歌发布Gemini深度研究交互API,AI代理自主驾驭复杂信息搜索

谷歌近日正式向开发者开放了其强大的Gemini深度研究(Gemini Deep Research)功能,通过全新的交互API(Interactions API)提供服务。这一举措标志着AI在复杂信息处理与综合能力方面迈出了重要一步。Gemini深度研究...

Read More
2025-11-07 talkingdev

开源|月之暗面Kimi K2推理模型:多项基准超越GPT-5与Claude Sonnet 4.5

中国人工智能实验室月之暗面(Moonshot AI)近日开源其革命性推理模型Kimi K2,在关键基准测试中展现出与国际顶尖模型的竞争实力。该模型在衡量综合认知能力的‘人类终极考试’(Humanity's Last Exam)中取得44.9%的...

Read More
2025-11-04 talkingdev

Perplexity如何打造AI版Google:揭秘下一代答案引擎技术架构

Perplexity通过颠覆性的技术架构实现了对传统搜索引擎的革新。其核心是采用检索增强生成(RAG)技术路线,将实时网络搜索与大型语言模型深度整合。该系统首先通过Vespa AI引擎对超过2000亿个URL建立索引,随后通过智...

Read More
2025-10-13 talkingdev

开源|微软推出Edge AI入门课程:从模型优化到智能代理开发

微软近日在GitHub开源社区正式发布《Edge AI for Beginners》系列课程,该项目专为人工智能初学者设计,系统性地介绍了边缘计算与AI结合的完整技术栈。课程内容涵盖边缘AI基础架构、主流轻量级模型(如MobileNet、Ti...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page