漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-24 talkingdev

突破性进展:研究者用CUDA C++实现5090光速级Flash Attention算法

近日,一项名为《Writing Speed-of-Light Flash Attention for 5090 in CUDA C++》的技术研究引发广泛关注。该研究通过CUDA C++实现了针对5090硬件的光速级Flash Attention算法,显著提升了注意力机制的计算效率。Fl...

Read More
2025-08-19 talkingdev

GPT-5实现突破性进展:端到端复杂二进制解析器自动生成

最新技术动态显示,OpenAI的GPT-5在编程领域展现出前所未有的能力突破。该模型能够高效编写解决端到端实际问题的代码,特别是在处理复杂二进制格式解析这类传统上需要资深工程师深度参与的领域表现卓越。根据技术博...

Read More
2025-08-15 talkingdev

论文推荐|OpenCUA:计算机使用智能体的开源基础框架

OpenCUA项目近日发布了一套全面的开源工具包,旨在构建高效的计算机使用智能体。该工具包包含数据收集工具、训练流程,以及覆盖三大操作系统和200余款应用的2.2万条人类操作轨迹数据。其核心创新在于"反射式长链思维...

Read More
2025-08-13 talkingdev

Claude Sonnet 4上下文窗口突破100万tokens,开启大规模代码分析与文档合成新纪元

Anthropic公司宣布其Claude Sonnet 4模型现已支持高达100万tokens的上下文窗口,这一重大升级使其处理能力提升了5倍。这一突破性进展意味着该模型能够胜任更复杂、数据密集型的任务,如大规模代码库的深度分析和长文...

Read More
2025-07-28 talkingdev

全球首个由AI自主组织的活动成功举办,展现AI在活动管理中的潜力

近日,全球首个完全由AI自主组织的活动成功举办,标志着人工智能在复杂组织任务自动化方面迈出了重要一步。该活动由四个AI代理共同策划,目标为“撰写一个故事并邀请100人线下庆祝”。在数周的准备过程中,AI独立完成...

Read More
2025-07-24 talkingdev

[开源]GitHub推出Spark项目:无需代码即可创建AI应用

GitHub最新推出的Spark项目标志着软件开发领域的一次重大革新,该项目旨在通过人工智能技术实现"氛围编程"(vibe coding),让不具备专业编程技能的用户也能轻松创建个性化的"微应用"。这一创新工具整合了Anthropic...

Read More
2025-07-23 talkingdev

[开源]Qwen3-Coder:全球领先的智能编码代理模型问世

通义千问团队正式发布Qwen3-Coder,这是迄今为止最先进的智能编码代理模型。该模型采用4800亿参数的混合专家架构(Mixture-of-Experts),其中激活参数达350亿,并支持超长上下文处理。在智能编码、浏览器操作和工具...

Read More
2025-07-18 talkingdev

[论文推荐] 突破长文本限制:新型“Power”注意力机制实现高效训练

一项名为“Power”注意力的创新技术通过引入超参数p,实现了对状态大小的独立控制,有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力,并支持定制GPU内核,在64k上下文长度下速度...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page