漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-26 talkingdev

Ollama推出Web搜索API,赋能模型实时信息获取与减少幻觉

Ollama近日发布了一项创新的Web搜索API,旨在为其AI模型提供实时信息访问能力,从而显著减少模型生成内容中的幻觉现象。该API通过REST端点提供,并已集成到Ollama的Python和JavaScript库中,使模型能够执行长时间的...

Read More
2025-09-26 talkingdev

谷歌发布Gemini 2.5 Flash与Flash-Lite升级版:效率提升50%,推理速度再突破

谷歌DeepMind团队近日在Google AI Studio和Vertex AI平台推出了Gemini 2.5 Flash及Flash-Lite模型的升级版本。此次更新聚焦于模型效率与性能的协同优化:Gemini 2.5 Flash-Lite的输出令牌数量减少50%,而标准版Flash...

Read More
2025-09-26 talkingdev

OpenAI推出GDPval:衡量AI模型在44个职业中真实任务表现的新基准

OpenAI近日发布了名为GDPval的创新评估基准,该基准专注于测试人工智能模型在44种不同职业领域内具有经济价值的真实任务上的性能。这一评估体系突破了传统学术基准的局限,通过模拟律师文档分析、会计师报表处理、客...

Read More
2025-09-26 talkingdev

OpenAI强化微调技术RFT成本暴增700倍,仅编码任务表现突出引争议

OpenAI最新推出的强化微调技术RFT旨在通过强化学习提升o4-mini模型在特定任务中的性能。该技术允许工程师通过灵活的评分器配置自定义奖励机制,理论上可在适用场景下实现显著性能突破。然而,其成本高达监督微调的70...

Read More
2025-09-26 talkingdev

AI编程基准测试真相:流行评测到底在衡量什么?

最新技术分析揭示,当前流行的AI编程基准测试(如SWE-bench)实际测量范围远窄于其名称所暗示的能力。研究表明,Claude在SWE-bench获得80%评分并不等同于能一次性解决80%的实际编程任务。本文深度剖析SWE-bench Veri...

Read More
2025-09-26 talkingdev

Perplexity发布Search API,开放其百亿级网页检索基础设施

人工智能公司Perplexity正式推出全新Search API服务,该API允许开发者直接调用其公共问答引擎背后的大规模基础设施,实现对数千亿网页的高质量信息检索。这一技术突破意味着第三方开发者能够利用Perplexity经过优化...

Read More
2025-09-26 talkingdev

职业发展新趋势:专家建议定期更新简历与LinkedIn,以把握AI与数字化浪潮下的潜在机遇

在人工智能和数字化转型加速发展的当下,职业规划专家提出一项前瞻性建议:即使未处于求职期,也应定期更新个人简历和LinkedIn档案。这一策略的核心价值在于应对科技行业快速迭代的特性——新兴技术如生成式AI、云计算...

Read More
2025-09-25 talkingdev

开源|Apache SedonaDB发布:专注地理空间数据的单机分析数据库引擎

Apache社区最新推出SedonaDB——一款基于Rust构建的开源单节点分析数据库引擎,其革命性突破在于将地理空间数据提升为“第一优先”。该引擎深度集成Apache Arrow列式内存计算框架与DataFusion查询引擎,原生支持空间数据...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page