漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-06 talkingdev

OpenRouter年度重磅报告:推理模型已占AI使用量半壁江山,开源模型采用率持续攀升

根据AI模型聚合平台OpenRouter发布的最新年度研究报告,通过对过去一年内超过100万亿个令牌(tokens)的实证分析,揭示了当前AI模型使用格局的重大转变。报告指出,以Claude 3.5 Sonnet、GPT-4o和o1系列为代表的“推...

Read More
2025-11-11 talkingdev

Moonshot AI开源Kimi K2思维模型:320亿激活参数,性能达非思维模型前沿水平

近日,前沿开源实验室Moonshot AI正式发布其新一代Kimi K2思维模型,该模型采用混合专家架构,具备320亿激活参数与1万亿总参数的庞大规模。在技术性能方面,Kimi K2在前沿知识理解、数学推理及代码生成领域均达到当...

Read More
2025-10-21 talkingdev

生产级RAG系统实战:处理超500万文档的经验总结

在构建面向Usul AI和企业客户的大规模检索增强生成(RAG)系统过程中,开发者处理了超过1300万页文档的实践经验揭示了关键洞见。初期使用Langchain和LlamaIndex框架虽能快速验证概念,但在实际生产环境中处理海量数...

Read More
2025-10-14 talkingdev

InferenceMAX开源推理基准发布:NVIDIA与AMD芯片性能正面交锋

业界瞩目的开源AI推理基准测试工具InferenceMAX正式亮相,该工具通过夜间自动化测试对Llama 70B、DeepSeek R1等主流大模型进行持续性能评估。其核心价值在于量化AI推理中的关键权衡:吞吐量(每GPU每秒处理令牌数)...

Read More
2025-10-13 talkingdev

OpenRouter:统一API集成500+主流AI模型,开启智能路由新纪元

近日,AI模型集成平台OpenRouter推出突破性技术方案,通过单一API接口整合GPT、Claude、Gemini、Llama、Mistral等500余个主流人工智能模型。该平台实现了请求级别的模型动态切换能力,支持根据实时价格、响应延迟等...

Read More
2025-10-08 talkingdev

开源|LlamaFarm:本地快速部署AI模型与RAG应用的全栈框架

近日,GitHub开源项目LlamaFarm发布,为开发者提供了一套生产级AI应用构建框架。该框架支持在本地环境中快速部署任意AI模型、智能体、数据库及RAG(检索增强生成)管道,最快可在数分钟内完成全流程搭建。其核心优势...

Read More
2025-09-26 talkingdev

Ollama推出Web搜索API,赋能模型实时信息获取与减少幻觉

Ollama近日发布了一项创新的Web搜索API,旨在为其AI模型提供实时信息访问能力,从而显著减少模型生成内容中的幻觉现象。该API通过REST端点提供,并已集成到Ollama的Python和JavaScript库中,使模型能够执行长时间的...

Read More
2025-09-02 talkingdev

Meta考虑在Llama 5开发期间临时整合谷歌和OpenAI模型

据路透社报道,Meta正在采取一项战略性临时措施:在开发下一代大语言模型Llama 5期间,计划将谷歌和OpenAI的AI模型集成到其产品生态中。这一决策反映了当前AI军备竞赛中技术迭代与产品化需求之间的平衡策略。值得注...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page