漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-01 talkingdev

[论文推荐]《异经》:AI生成的“佛经”能否承载意义与价值?学者深度解析

近期,佛教学者对ChatGPT o3生成的一篇AI“佛经”进行了专业分析,发现其通过悖论解构等手法,呈现出复杂的哲学概念与意象,成功唤起了佛教核心教义如“空性”的思考。研究表明,尽管大语言模型(LLMs)能够复述佛法教义...

Read More
2025-08-01 talkingdev

亚马逊AI战略全面升级:千余项生成式AI应用重塑未来工作与生活

亚马逊正通过实用型生成式AI创新深刻改变人类工作与生活方式。作为拥有25年AI/ML模型部署经验的技术先驱,亚马逊已构建超1,000个生成式AI应用矩阵,覆盖从AWS云服务、Alexa智能语音到物流机器人等全业务场景。其AI人...

Read More
2025-07-29 talkingdev

构建生产级AI代理的六大核心原则

最新技术文章揭示了构建生产级AI代理系统的关键方法论。文章指出,开发可靠的AI代理需要设计清晰详细的系统提示,并通过策略性上下文管理避免模型过载。同时,工具接口必须简洁直观,且需建立基于领域特定验证的强健...

Read More
2025-07-28 talkingdev

阿里开源Qwen3-235B思维模型:数学竞赛92.3%准确率,推理效率超越传统密集模型

阿里巴巴最新开源的Qwen3-235B思维模型在技术领域取得重大突破,该模型在AIME25数学竞赛中达到92.3%的准确率,与OpenAI的O4-mini性能相当,并在编码基准测试中以74.1%的LiveCodeBench得分实现超越。这一2350亿参数的...

Read More
2025-07-23 talkingdev

[开源] Any LLM:Mozilla推出统一接口库,轻松切换不同大语言模型

Mozilla AI实验室近日在GitHub开源了Python库Any LLM,该项目旨在为开发者提供与多种大语言模型(如Mistral、OpenAI等)交互的统一接口。该工具通过标准化API调用方式显著降低了模型切换的技术门槛,其核心优势包括...

Read More
2025-07-23 talkingdev

[开源]Qwen3-Coder:全球领先的智能编码代理模型问世

通义千问团队正式发布Qwen3-Coder,这是迄今为止最先进的智能编码代理模型。该模型采用4800亿参数的混合专家架构(Mixture-of-Experts),其中激活参数达350亿,并支持超长上下文处理。在智能编码、浏览器操作和工具...

Read More
2025-07-22 talkingdev

阿里通义千问团队发布升级版Qwen3-235B模型,取消混合推理模式

阿里云旗下通义千问(Qwen)团队近日宣布对Qwen3-235B-A22B模型进行重大更新,新版本编号为Qwen3-235B-A22B-2507。此次更新的核心变化是取消了原先的混合思维模式(hybrid thinking mode),转而采用将指令模型(Instruct...

Read More
2025-07-18 talkingdev

[论文推荐] 突破长文本限制:新型“Power”注意力机制实现高效训练

一项名为“Power”注意力的创新技术通过引入超参数p,实现了对状态大小的独立控制,有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力,并支持定制GPU内核,在64k上下文长度下速度...

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page