漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-13 talkingdev

论文推荐|Meta提出“早期经验”训练新范式,突破语言智能体自主学习瓶颈

Meta研究团队在最新论文中提出名为“早期经验”的创新训练范式,为解决语言智能体在复杂现实任务中的自主学习难题提供了突破性方案。传统方法依赖专家演示数据进行监督微调,存在泛化能力弱、数据多样性不足的缺陷。而...

Read More
2025-10-10 talkingdev

仅需250份样本即可毒害任意规模大语言模型,Anthropic研究揭示数据投毒攻击风险

Anthropic联合英国AI安全研究所与艾伦·图灵研究所的最新研究表明,大语言模型面临严重的数据投毒威胁。实验发现,仅需在训练数据中插入250份被篡改的文档(仅占训练总量的0.00016%),就能在参数规模从6亿到130亿不...

Read More
2025-09-19 talkingdev

WEIRD in, WEIRD out:AI的文化偏见危机

最新研究显示,当前主流生成式AI工具存在严重的文化偏见,其底层模型过度偏向代表"WEIRD"(西方化、高教育水平、工业化、富裕、民主)尤其是美国价值观的数据训练集。这种系统性偏差导致AI在非WEIRD文化区域的应用中...

Read More
2025-09-04 talkingdev

瑞士发布Apertus开源AI大模型:支持千种语言,仅用公开数据训练

瑞士近日正式推出名为Apertus的开源人工智能大模型,该模型仅使用公开可获取的数据进行训练,支持超过1000种语言,提供80亿和700亿两种参数规格版本。这一举措标志着主权国家首次以独立身份参与全球AI竞争。Apertus...

Read More
2025-07-10 talkingdev

Bria开源T2I模型BRIA-3.2:参数仅4B却媲美Flux画质

视觉AI平台服务商Bria近日在Hugging Face发布新一代开源文本生成图像模型BRIA-3.2,其技术突破引发行业关注。该模型仅用4B参数即实现与Adobe Firefly 4.0和Flux[Dev]相当的图像生成质量,且模型体积缩小至三分之一,...

Read More
2025-06-27 talkingdev

Bria开源新一代T2I模型:4B参数媲美Flux质量,体积缩小三分之二

视觉AI平台服务商Bria推出新一代开源文本生成图像(T2I)模型,其技术突破引发行业关注。该模型仅用4B参数即实现与Adobe Firefly 4.0和Flux[Dev]相当的生成质量,同时模型体积缩减67%。核心技术亮点包括:集成Contro...

Read More
2025-06-19 talkingdev

DeepNVMe重大升级:扩展模型检查点与推理支持,引入PCIe Gen5 NVMe扩展能力

DeepNVMe最新版本实现了多项突破性升级:首先扩展了对模型检查点(checkpointing)和推理工作负载的支持,使深度学习框架能更高效地管理训练中间状态;其次新增PCIe Gen5 NVMe的扩展能力,显著提升存储带宽以应对大...

Read More
2025-06-13 talkingdev

Bria 3.2新一代AI图像模型开放早期体验:100%合规数据训练,突破文本渲染技术

Bria最新发布的3.2版本AI图像生成模型在文本渲染领域实现技术突破,该模型采用100%经过授权的合规数据进行训练,为企业用户提供符合知识产权法规的AI解决方案。这一创新显著提升了生成图像中文本元素的准确性和自然...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page