漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-18 talkingdev

[论文推荐] 突破长文本限制:新型“Power”注意力机制实现高效训练

一项名为“Power”注意力的创新技术通过引入超参数p,实现了对状态大小的独立控制,有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力,并支持定制GPU内核,在64k上下文长度下速度...

Read More
2025-07-18 talkingdev

Hugging Face推出FutureBench:评估AI代理预测未来事件的能力

Hugging Face最新推出的FutureBench是一个专门用于测试AI代理在预测未来事件方面能力的基准测试平台。该平台覆盖科学、地缘政治和技术等多个领域,旨在评估AI系统在复杂多变的环境中预测未来趋势的准确性和可靠性。F...

Read More
2025-07-18 talkingdev

ChatGPT Agent正式发布:连接研究与行动的全新智能助手

OpenAI最新推出的ChatGPT Agent标志着人工智能助手能力的重大飞跃。该产品深度融合了Operator的网页浏览功能和Deep Research的分析能力,并配备专属虚拟计算机系统,能够自主完成多步骤复杂任务。从技术架构来看,Ch...

Read More
2025-07-18 talkingdev

苹果发布2025技术报告:揭秘驱动Apple Intelligence的多语言多模态基础模型

苹果公司近期在其机器学习研究官网发布了《Apple Intelligence Foundation Language Models Tech Report 2025》技术报告,正式公开了支撑Apple Intelligence功能的两大核心基础模型。报告显示,这两个模型具备多语言...

Read More
2025-07-17 talkingdev

Reflection AI推出代码研究智能体Asimov,革新工程知识管理

由前OpenAI和DeepMind研究人员创立的Reflection AI公司,继三月成功融资1.3亿美元后,正式发布其突破性产品Asimov代码研究智能体。该智能体通过深度索引整个代码库及团队知识体系,能够精准回答工程问题并提供引用来...

Read More
2025-07-16 talkingdev

Uzu:专为苹果芯片优化的高性能AI模型推理引擎

GitHub开源项目Uzu为Apple Silicon平台带来突破性AI推理解决方案。该项目采用混合GPU/MPSGraph架构,显著提升计算效率,同时提供简洁API和统一模型配置,支持Swift及命令行接口绑定。其核心创新在于实现可追踪的计算...

Read More
2025-07-16 talkingdev

开源Goose AI代理:支持任意LLM后端,覆盖全流程开发

Block公司近日在GitHub开源了Goose AI代理项目,这是一个突破性的开源AI开发工具。与传统代码建议工具不同,Goose作为可扩展的AI代理,支持包括本地模型在内的任意大型语言模型(LLM)作为后端,提供桌面和命令行(C...

Read More
2025-07-16 talkingdev

Mistral AI推出开源音频模型Voxtral,开启语音理解新纪元

Mistral AI近日发布了其首个开源音频模型套件Voxtral,标志着开源语音理解技术迈入新阶段。该套件包含两个关键版本:24B参数的大规模应用模型和3B参数的边缘计算优化版本。24B模型凭借庞大参数规模,可处理复杂语音...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page