漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-04 talkingdev

IBM TechXchange 2025大会:聚焦企业级AI开发实战与前沿技术

IBM TechXchange 2025大会即将开启,这是一场专为AI工程师打造的实战盛宴。与会者将有机会亲身体验代理模型(agentic models)的开发,探索MCP协议(Model Control Protocol)在模型集成中的创新应用,并深入了解为...

Read More
2025-07-09 talkingdev

Gemini Nano即将登陆Chrome 137:AI工程师必读指南

谷歌的Gemini Nano技术即将全面登陆Chrome 137浏览器,这标志着AI技术在浏览器端的应用迈出了重要一步。Gemini Nano最初被误认为将在Chrome 138中推出,但经过核实,该技术已从Chrome 137开始逐步向用户推送,且在某...

Read More
2025-06-24 talkingdev

SGLang集成Transformers后端:实现Hugging Face模型API与高性能引擎的无缝对接

近日,SGLang宣布成功集成Transformers后端技术,这一重大进展使开发者能够将Hugging Face的模型API与SGLang的高吞吐量、低延迟引擎相结合。该集成不仅显著提升了模型推理效率,还为自然语言处理(NLP)领域的实时应...

Read More
2025-06-17 talkingdev

CoRT-通过代码解释器增强大模型推理能力

GitHub最新开源项目CoRT(Code Interpreter Reasoning)提出了一种创新的方法,通过提示工程(hint engineering)对大语言模型进行后训练(post-train),使其能够将复杂计算任务智能分配给外部代码解释器执行。这一...

Read More
2025-05-23 talkingdev

基于LLM的智能体开发框架:评估驱动的新范式

近日,一篇关于构建基于大语言模型(LLM)的智能体系统的实践框架引发业内关注。该框架提出以评估为核心的开发方法论(Evaluation-centric Development),为AI智能体的研发提供了系统性指导。文章深入探讨了如何通...

Read More
2025-05-21 talkingdev

Klavis开源MCP集成方案,AI应用规模化部署

Klavis AI近日发布了一项突破性的生产级MCP(模型计算平台)集成解决方案,该方案通过GitHub开源仓库向开发者开放。这一技术显著降低了AI应用与MCP服务器的整合门槛,提供稳定连接、内置身份验证机制及多客户端支持...

Read More
2025-05-16 talkingdev

OpenAI工程师揭秘:ChatGPT图像功能如何在一周内应对1亿新用户

OpenAI工程师团队近期披露了ChatGPT图像功能在3月发布时的技术挑战与解决方案。该功能上线首周即吸引1亿新用户,生成7亿张图像,其中印度市场每小时新增用户峰值达100万。面对同步图像生成系统无法承受的突发流量,...

Read More
2025-04-16 talkingdev

[开源]Auto Deploy (GitHub Repo):NVIDIA推出PyTorch和Hugging Face模型高效部署新方案

NVIDIA在GitHub开源项目TensorRT-LLM中发布了名为Auto Deploy的创新工具,该技术实现了将PyTorch和Hugging Face模型转化为高效可部署格式的重大突破。通过TensorRT-LLM的优化编译器,模型推理速度可提升数倍,特别适...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page