数据训练的相关内容 - 漫话开发者

2025-09-19 talkingdev

WEIRD in, WEIRD out：AI的文化偏见危机

最新研究显示，当前主流生成式AI工具存在严重的文化偏见，其底层模型过度偏向代表"WEIRD"（西方化、高教育水平、工业化、富裕、民主）尤其是美国价值观的数据训练集。这种系统性偏差导致AI在非WEIRD文化区域的应用中...

2025-09-04 talkingdev

瑞士近日正式推出名为Apertus的开源人工智能大模型，该模型仅使用公开可获取的数据进行训练，支持超过1000种语言，提供80亿和700亿两种参数规格版本。这一举措标志着主权国家首次以独立身份参与全球AI竞争。Apertus...

2025-07-10 talkingdev

视觉AI平台服务商Bria近日在Hugging Face发布新一代开源文本生成图像模型BRIA-3.2，其技术突破引发行业关注。该模型仅用4B参数即实现与Adobe Firefly 4.0和Flux[Dev]相当的图像生成质量，且模型体积缩小至三分之一，...

2025-06-27 talkingdev

视觉AI平台服务商Bria推出新一代开源文本生成图像（T2I）模型，其技术突破引发行业关注。该模型仅用4B参数即实现与Adobe Firefly 4.0和Flux[Dev]相当的生成质量，同时模型体积缩减67%。核心技术亮点包括：集成Contro...

2025-06-19 talkingdev

DeepNVMe最新版本实现了多项突破性升级：首先扩展了对模型检查点（checkpointing）和推理工作负载的支持，使深度学习框架能更高效地管理训练中间状态；其次新增PCIe Gen5 NVMe的扩展能力，显著提升存储带宽以应对大...

2025-06-13 talkingdev

Bria最新发布的3.2版本AI图像生成模型在文本渲染领域实现技术突破，该模型采用100%经过授权的合规数据进行训练，为企业用户提供符合知识产权法规的AI解决方案。这一创新显著提升了生成图像中文本元素的准确性和自然...

2025-05-24 talkingdev

近期大型推理模型的显著成果常被归功于思维链（CoT）技术，尤其是通过从基础大语言模型（LLM）中采样CoT进行训练以发现新推理模式的过程。然而，一项最新研究对这种解释提出了质疑。该研究通过系统性地调查中间标记...

2025-05-09 talkingdev

Freepik近日发布了名为F Lite的AI图像生成模型，该模型是与Fal.ai合作开发，并利用64块Nvidia H100 GPU进行训练。F Lite的独特之处在于其训练数据全部来自经过授权的、适合工作场景的图像，确保了生成内容的合法性和...