漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-18 talkingdev

Clerk推出Next.js MCP服务器支持:快速集成AI工具并保障数据安全

Clerk最新发布的Next.js MCP服务器支持功能,为开发者提供了一种安全高效的方式将AI工具集成到应用中。该功能允许开发者在Next.js应用中快速添加符合规范的MCP端点,使大型语言模型(LLM)能够在用户同意的情况下访...

Read More
2025-07-18 talkingdev

[论文推荐] 突破长文本限制:新型“Power”注意力机制实现高效训练

一项名为“Power”注意力的创新技术通过引入超参数p,实现了对状态大小的独立控制,有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力,并支持定制GPU内核,在64k上下文长度下速度...

Read More
2025-07-18 talkingdev

苹果发布2025技术报告:揭秘驱动Apple Intelligence的多语言多模态基础模型

苹果公司近期在其机器学习研究官网发布了《Apple Intelligence Foundation Language Models Tech Report 2025》技术报告,正式公开了支撑Apple Intelligence功能的两大核心基础模型。报告显示,这两个模型具备多语言...

Read More
2025-07-17 talkingdev

谷歌搜索迎来Gemini 2.5 Pro与深度搜索功能,AI订阅服务再升级

谷歌宣布为其AI Pro和AI Ultra订阅用户推出搜索功能的重大升级,集成Gemini 2.5 Pro模型并引入深度搜索(Deep Search)技术。这一更新标志着搜索引擎正式进入多轮复杂交互时代,支持用户提交更长查询语句及连续追问...

Read More
2025-07-16 talkingdev

AI代理究竟能做什么?探索LLM驱动的智能工具应用场景

当前,以大型语言模型(LLM)为核心的AI技术正在引发新一轮产业变革。最新技术分析指出,AI代理系统通过LLM实现三大核心功能:情境评估、工具建议与调用、以及工具使用的流程控制。在客户支持和故障分类等实际场景中...

Read More
2025-07-16 talkingdev

开源Goose AI代理:支持任意LLM后端,覆盖全流程开发

Block公司近日在GitHub开源了Goose AI代理项目,这是一个突破性的开源AI开发工具。与传统代码建议工具不同,Goose作为可扩展的AI代理,支持包括本地模型在内的任意大型语言模型(LLM)作为后端,提供桌面和命令行(C...

Read More
2025-07-15 talkingdev

[论文推荐]基于能量的Transformer模型:可扩展的学习与思考者

一项名为'基于能量的Transformer'(Energy-Based Transformers)的新型架构在机器学习领域取得突破性进展。该技术摒弃了传统的直接预测方式,转而采用学习验证函数来评估输入与候选输出之间的兼容性得分。这种创新架...

Read More
2025-07-14 talkingdev

《RL万亿级扩展路线图:解锁AI大模型从互联网推理的潜力》

近期,一篇关于强化学习(RL)如何扩展至惊人10^26 FLOPs(每秒浮点运算次数)的探讨引起了业界广泛关注。文章指出,强化学习被视为构建前沿AI模型,尤其是大型语言模型(LLMs)的下一个核心训练技术。传统观点认为...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page