漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-24 talkingdev

评估长上下文问答系统的挑战与方法

本文深入探讨了长上下文问答系统的评估方法,包括指标设计、数据集构建以及人工或大语言模型(LLM)评估技术。文章重点分析了该领域面临的四大核心挑战:信息过载问题、证据分散现象、多跳推理需求以及幻觉生成风险。...

Read More
2025-06-23 talkingdev

基于Tantivy和多查询融合的智能代理搜索方案

近日,一种创新的AI搜索方法引发业界关注。该方法通过结合Tantivy(基于Rust语言开发的高性能搜索引擎)的全文检索能力和多查询融合技术,有效规避了传统语义嵌入的分块限制。技术核心在于让智能代理同时生成多个查...

Read More
2025-06-20 talkingdev

EnrichMCP-为AI智能体打造的数据驱动ORM框架

Featureform团队近日开源了EnrichMCP项目,这是一个专为AI智能体设计的Python ORM框架。该框架基于MCP(Model Context Protocol)构建,能够将数据模型转化为类型安全、可内省的结构化接口,使智能体能够像开发者操...

Read More
2025-06-18 talkingdev

谷歌Gemini 2.5 Pro与Flash全面开放,新增Flash-Lite预览版及可控“思考预算”功能

谷歌近日宣布其人工智能模型Gemini 2.5 Pro和Flash版本已全面开放使用,同时推出预览版Flash-Lite。此次更新最引人注目的是引入了可控的“思考预算”机制,该技术通过动态分配计算资源,在保证推理精度的同时为开发者...

Read More
2025-06-17 talkingdev

开源AI模型数据库Models.dev上线,提供模型规格、定价与能力查询

近日,一个名为Models.dev的开源网站正式上线,该平台致力于构建一个开放的AI模型数据库,详细收录各类人工智能模型的规格参数、定价信息以及功能特性。这一举措为开发者、研究人员和企业提供了便捷的模型检索和比较...

Read More
2025-06-13 talkingdev

Bria 3.2新一代AI图像模型开放早期体验:100%合规数据训练,突破文本渲染技术

Bria最新发布的3.2版本AI图像生成模型在文本渲染领域实现技术突破,该模型采用100%经过授权的合规数据进行训练,为企业用户提供符合知识产权法规的AI解决方案。这一创新显著提升了生成图像中文本元素的准确性和自然...

Read More
2025-06-03 talkingdev

[开源]Penny-1.7B:基于GRPO的单卡A6000训练的《爱尔兰便士杂志》风格迁移模型

开发者dleemiller近日在Hugging Face平台发布了Penny-1.7B语言模型,该模型通过创新性的训练方法实现了对19世纪《爱尔兰便士杂志》古英语风格的精准模仿。项目采用纯GRPO(一种新型优化算法)训练策略,仅用单张NVID...

Read More
2025-05-27 talkingdev

OpenAI Cookbook发布:利用强化微调模型提升医疗任务性能

OpenAI最新发布的Cookbook教程详细介绍了如何通过强化微调技术(RFT)提升o4-mini模型在医疗任务中的表现。该教程不仅涵盖了技术实现步骤,还重点探讨了如何应对奖励机制滥用(reward hacking)和模型评分不准确等关...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page