漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-26 talkingdev

BoothIQ实践:AI生成15万行Elixir生产代码的得与失

科技公司BoothIQ近期披露了一项引人注目的技术实践:其整个Elixir代码库——总计15万行生产代码——完全由人工智能生成。这一大规模实验揭示了当前AI编码技术在特定场景下的巨大潜力与固有局限。Elixir语言因其语法简洁...

Read More
2026-01-26 talkingdev

开源|TTT-Discover:推理时强化学习新范式,让大模型实时自适应任务

近日,一个名为TTT-Discover的开源项目在GitHub上发布,其核心创新在于将强化学习(Reinforcement Learning)技术应用于大型语言模型(LLMs)的推理(Inference)阶段,而非传统的训练阶段。这一“测试时训练”(Test-...

Read More
2026-01-10 talkingdev

OpenAI被曝要求承包商上传过往工作内容以训练AI办公助手,引发数据隐私与合规性质疑

据《连线》杂志报道,人工智能领军企业OpenAI正通过其承包商网络,收集来自真实办公场景的数据,以训练其下一代AI办公助手。根据获取的内部文件显示,OpenAI要求承包商上传他们当前或过往工作中的实际项目文件,用于...

Read More
2026-01-08 talkingdev

开源|NitroGen:基于互联网游戏视频训练的通用游戏智能体基础模型发布

近日,由MineDojo团队在GitHub上开源的项目NitroGen引起了人工智能与游戏交叉领域的广泛关注。该项目提出了一个旨在成为“通用游戏智能体”的基础模型。其核心创新在于,模型并非针对单一游戏进行专门训练,而是通过大...

Read More
2026-01-08 talkingdev

开源|Hugging Face发布FinePDFs:从PDF中解放3万亿高质量训练令牌

在开源人工智能社区中,PDF文档长期以来被视为一座未被充分挖掘的高质量数据金矿。近日,Hugging Face团队正式发布了其开创性的预训练数据集项目——FinePDFs,成功从海量PDF文档中提取并构建了一个规模超过3万亿令牌...

Read More
2025-12-30 talkingdev

开源|Crawl4AI:专为大型语言模型设计的开源网页抓取与解析工具

近日,一个名为Crawl4AI的开源项目在GitHub上发布,旨在为大型语言模型(LLM)提供友好、高效的网页抓取与内容解析解决方案。该项目由开发者unclecode主导,其核心目标是简化从复杂网页中提取结构化信息的流程,并将...

Read More
2025-12-19 talkingdev

开源|History LLMs:训练于1913年前文本的“历史专家”大语言模型项目引发热议

一个名为“History LLMs”的开源项目在技术社区引发了广泛关注。该项目旨在训练迄今为止规模最大的、专门基于1913年之前历史文本的大型语言模型。其核心构想是通过构建一个纯净的“前现代”语料库——即排除所有1913年之后...

Read More
2025-12-16 talkingdev

英伟达发布Nemotron 3开源模型家族,以开放生态挑战OpenAI等巨头

英伟达近日正式发布了Nemotron 3系列开源模型,该家族包含Nano(300亿参数,30亿活跃参数)、Super(1000亿参数)和Ultra(5000亿参数)三个版本,其中Super和Ultra型号计划于2026年初推出。尤为引人注目的是,当前...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page