训练数据的相关内容 - 漫话开发者

2026-03-05 talkingdev

微软发布Phi-4推理视觉模型：15B参数实现多模态推理，懂得“何时思考”以提升效率

微软近日发布了Phi-4-reasoning-vision-15B，这是一款开源的、权重开放的多模态视觉AI模型。该模型仅包含150亿参数，却在数学、科学、文档及用户界面（UI）推理任务上，达到了与参数量大数倍的模型相当甚至更优的性...

2026-03-04 talkingdev

随着生成式人工智能在软件开发领域的应用日益深入，一个根本性问题浮出水面：当AI开始编写世界上大部分软件时，谁来承担验证、审计和确保其安全可靠的责任？这一问题已引发技术社区的广泛讨论。原文章及Hacker News...

2026-01-26 talkingdev

科技公司BoothIQ近期披露了一项引人注目的技术实践：其整个Elixir代码库——总计15万行生产代码——完全由人工智能生成。这一大规模实验揭示了当前AI编码技术在特定场景下的巨大潜力与固有局限。Elixir语言因其语法简洁...

2026-01-26 talkingdev

近日，一个名为TTT-Discover的开源项目在GitHub上发布，其核心创新在于将强化学习（Reinforcement Learning）技术应用于大型语言模型（LLMs）的推理（Inference）阶段，而非传统的训练阶段。这一“测试时训练”（Test-...

2026-01-10 talkingdev

据《连线》杂志报道，人工智能领军企业OpenAI正通过其承包商网络，收集来自真实办公场景的数据，以训练其下一代AI办公助手。根据获取的内部文件显示，OpenAI要求承包商上传他们当前或过往工作中的实际项目文件，用于...

2026-01-08 talkingdev

近日，由MineDojo团队在GitHub上开源的项目NitroGen引起了人工智能与游戏交叉领域的广泛关注。该项目提出了一个旨在成为“通用游戏智能体”的基础模型。其核心创新在于，模型并非针对单一游戏进行专门训练，而是通过大...

2026-01-08 talkingdev

在开源人工智能社区中，PDF文档长期以来被视为一座未被充分挖掘的高质量数据金矿。近日，Hugging Face团队正式发布了其开创性的预训练数据集项目——FinePDFs，成功从海量PDF文档中提取并构建了一个规模超过3万亿令牌...

2025-12-30 talkingdev

近日，一个名为Crawl4AI的开源项目在GitHub上发布，旨在为大型语言模型（LLM）提供友好、高效的网页抓取与内容解析解决方案。该项目由开发者unclecode主导，其核心目标是简化从复杂网页中提取结构化信息的流程，并将...