漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-26 talkingdev

开源|SuperClaude框架爆火:月获14k星,降低30-50%上下文使用量

SuperClaude框架近日在GitHub掀起热潮,这是一个专为增强Claude Code能力设计的配置框架。该框架通过集成21个全新斜杠命令、14个专业AI智能体以及6个MCP服务器,为开发任务构建了高度结构化的高效工作流。其核心突破...

Read More
2025-08-25 talkingdev

马斯克旗下xAI开源Grok 2.5模型权重,Grok 3预计半年后开放

埃隆·马斯克旗下人工智能公司xAI于近日正式在Hugging Face平台开源了其去年推出的旗舰模型Grok 2.5的模型权重。这一举措标志着xAI在推动AI技术透明化和社区协作方面迈出重要一步。Grok系列模型以其强大的多模态处理...

Read More
2025-08-24 talkingdev

突破性进展:研究者用CUDA C++实现5090光速级Flash Attention算法

近日,一项名为《Writing Speed-of-Light Flash Attention for 5090 in CUDA C++》的技术研究引发广泛关注。该研究通过CUDA C++实现了针对5090硬件的光速级Flash Attention算法,显著提升了注意力机制的计算效率。Fl...

Read More
2025-08-20 talkingdev

深度解析GPU架构:从SM到Tensor Core及网络互联技术

这篇技术文章系统性地剖析了现代GPU的核心架构,重点阐述了流式多处理器(SM)的组织结构、CUDA核心与Tensor核心的协同工作机制,以及多层次内存体系的优化策略。文章不仅对比了历代GPU产品的规格演进,更从芯片层面深...

Read More
2025-08-20 talkingdev

开源|Lemonade:高性能本地大语言模型推理服务器

Lemonade是一个专为现代计算硬件优化的开源推理服务器,致力于帮助开发者和研究者在本地高效运行大型语言模型。该项目通过集成最先进的推理引擎,可自动适配不同厂商的NPU(神经网络处理器)和GPU硬件平台,实现计算...

Read More
2025-08-19 talkingdev

谷歌Gemini API新增URL上下文读取功能,大模型可直接获取网页原始内容

谷歌Gemini API最新推出的url_context工具引发行业关注,该功能允许大语言模型在响应提示时直接请求URL内容作为上下文补充。技术实现上,当模型调用该工具时,会通过谷歌官方IP向目标网页发起请求,并以原始HTML格式...

Read More
2025-08-18 talkingdev

中国开源大模型研发机构排名:DeepSeek领跑,Moonshot AI与智谱AI紧追其后

近日,一份针对中国19家人工智能实验室的排名报告引发行业关注。该排名并非基于模型原始性能,而是聚焦各机构对AI研究的贡献度。长期领跑的DeepSeek实验室虽近期相对低调,仍保持领先地位。值得注意的是,新兴力量如...

Read More
2025-08-15 talkingdev

Anthropic推出MCP协议:探索基础模型工具使用效能

Anthropic公司推出的模型上下文协议(Model Context Protocol,MCP)旨在标准化大型语言模型(LLM)对外部工具的使用方式,正迅速成为工具集成的行业规范。该开源框架通过结构化接口,使AI代理能够更高效地调用外部A...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page