漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-04 talkingdev

AI生成Metal内核将PyTorch在苹果设备推理速度提升87%

研究人员通过前沿AI技术实现了重大突破:利用自主生成的Metal GPU内核,将PyTorch在苹果设备上的推理速度平均提升1.87倍。这项研究测试了215个PyTorch模型,其中部分工作负载甚至达到基线性能的数百倍加速。该技术采...

Read More
2025-09-04 talkingdev

瑞士发布Apertus开源AI大模型:支持千种语言,仅用公开数据训练

瑞士近日正式推出名为Apertus的开源人工智能大模型,该模型仅使用公开可获取的数据进行训练,支持超过1000种语言,提供80亿和700亿两种参数规格版本。这一举措标志着主权国家首次以独立身份参与全球AI竞争。Apertus...

Read More
2025-09-03 talkingdev

防范提示注入攻击:六大设计模式守护AI智能体安全

提示注入攻击正成为大型语言模型面临的新型安全威胁,这种攻击通过操纵自然语言处理能力来利用系统漏洞,其原理类似于传统的SQL注入攻击。研究人员最新提出了六种核心设计模式来强化AI智能体的安全防护:行动选择器...

Read More
2025-09-03 talkingdev

MCP安全指南:早期采用者必读的安全实践与风险解析

随着Model Context Protocol(MCP)迅速成为连接大语言模型与外部工具数据的核心标准,其安全风险正引发行业高度关注。Wiz最新发布的研究指南指出,尽管MCP能显著提升LLM与外部系统的集成效率,但许多团队在缺乏明确...

Read More
2025-09-02 talkingdev

Meta考虑在Llama 5开发期间临时整合谷歌和OpenAI模型

据路透社报道,Meta正在采取一项战略性临时措施:在开发下一代大语言模型Llama 5期间,计划将谷歌和OpenAI的AI模型集成到其产品生态中。这一决策反映了当前AI军备竞赛中技术迭代与产品化需求之间的平衡策略。值得注...

Read More
2025-09-01 talkingdev

解密LLM工作机制:机制可解释性研究揭示大语言模型内部架构

最新研究通过机制可解释性方法深入解析了基于Transformer架构的大语言模型(LLM)的工作原理。研究表明,LLM并非简单的统计预测器,而是通过形成涌现电路结构来实现复杂任务处理。这些电路整合了学习统计规律、信息传...

Read More
2025-08-29 talkingdev

开源|oLLM:轻量级Python库实现消费级GPU运行100K上下文大模型

近日,GitHub上开源项目oLLM引发开发者社区广泛关注。该项目是一个专为大上下文语言模型推理设计的轻量级Python库,其核心突破在于仅需8GB显存的消费级GPU即可运行Llama-3.1-8B-Instruct等模型处理长达10万token的上...

Read More
2025-08-28 talkingdev

OpenAI与Anthropic达成AI安全互测协议,共筑行业安全新标准

OpenAI与Anthropic近日达成一项突破性合作,双方开放内部API接口进行交叉安全测试,旨在通过第三方视角发现彼此模型评估中的盲点。这一举措标志着AI行业从封闭式自查向开放式协作安全验证的重要转变。通过技术互鉴,...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page