大语言模型(LLM)通过Tokenization技术将文本分解为更小的单元,再转换为数值表示进行处理。这一过程涉及BPE(字节对编码)、WordPiece和SentencePiece等主流算法,直接影响模型的计算成本、上下文理解能力和多语言处理...
Read MoreOpenCUA项目近日发布了一套全面的开源工具包,旨在构建高效的计算机使用智能体。该工具包包含数据收集工具、训练流程,以及覆盖三大操作系统和200余款应用的2.2万条人类操作轨迹数据。其核心创新在于"反射式长链思维...
Read MoreBaseten近日推出其Model APIs服务,旨在为开发者提供高性能的开源大语言模型部署解决方案。该服务支持包括Kimi K2、GPT-OSS、DeepSeek、Qwen 3等在内的多款前沿开源模型,承诺提供行业领先的性能表现和极具竞争力的...
Read More艾伦人工智能研究所(AI2)近日开源了MolmoAct模型,这是首个基于Molmo框架构建的、专注于三维空间推理的动作理解系统。该模型通过创新的三维空间表征学习方法,实现了对复杂指令的精准环境交互能力,在SpatialQA等...
Read MoreVercel宣布将其AI应用构建平台v0.dev升级为v0.app,这是一个基于代理型人工智能(Agentic AI)技术的创新平台,能够通过单一提示创建和部署功能完备的应用程序。新版平台的最大突破在于其自主处理复杂开发任务的能力...
Read More针对OpenAI发布GPT-5引发的行业震动,本文提出三项关键预判:首先,类比计算器未使学生丧失运算能力,大语言模型(LLM)不会导致人类思维退化,但产业与年轻从业者需经历技术适应期;其次,通用人工智能(AGI)短期...
Read MoreOpenAI首席执行官Sam Altman近日宣布,公司将恢复ChatGPT中的GPT-4o模型,并提高免费和Plus用户的推理模型使用限制。这一举措被视为对用户反馈的积极回应,尤其是在推理模型使用量激增的背景下。GPT-4o作为OpenAI的...
Read More由多个研究实验室联合开展的可解释性项目取得重大进展,科学家首次实现追踪AI模型推理时的内部计算路径,其精细程度堪比观察脑部神经元的激活过程。这项发表在Neuronpedia平台的研究通过交互式教材形式,系统演示了...
Read More