漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-15 talkingdev

揭秘大语言模型(LLM)的文本处理机制:Tokenization如何塑造AI世界观

大语言模型(LLM)通过Tokenization技术将文本分解为更小的单元,再转换为数值表示进行处理。这一过程涉及BPE(字节对编码)、WordPiece和SentencePiece等主流算法,直接影响模型的计算成本、上下文理解能力和多语言处理...

Read More
2025-08-15 talkingdev

论文推荐|OpenCUA:计算机使用智能体的开源基础框架

OpenCUA项目近日发布了一套全面的开源工具包,旨在构建高效的计算机使用智能体。该工具包包含数据收集工具、训练流程,以及覆盖三大操作系统和200余款应用的2.2万条人类操作轨迹数据。其核心创新在于"反射式长链思维...

Read More
2025-08-15 talkingdev

Baseten推出高性能开源大模型API服务,支持Kimi K2、GPT-OSS等前沿模型

Baseten近日推出其Model APIs服务,旨在为开发者提供高性能的开源大语言模型部署解决方案。该服务支持包括Kimi K2、GPT-OSS、DeepSeek、Qwen 3等在内的多款前沿开源模型,承诺提供行业领先的性能表现和极具竞争力的...

Read More
2025-08-13 talkingdev

AI2发布MolmoAct:首个支持3D空间推理的动作理解模型

艾伦人工智能研究所(AI2)近日开源了MolmoAct模型,这是首个基于Molmo框架构建的、专注于三维空间推理的动作理解系统。该模型通过创新的三维空间表征学习方法,实现了对复杂指令的精准环境交互能力,在SpatialQA等...

Read More
2025-08-12 talkingdev

Vercel发布v0.app:AI驱动的全自动应用开发平台

Vercel宣布将其AI应用构建平台v0.dev升级为v0.app,这是一个基于代理型人工智能(Agentic AI)技术的创新平台,能够通过单一提示创建和部署功能完备的应用程序。新版平台的最大突破在于其自主处理复杂开发任务的能力...

Read More
2025-08-11 talkingdev

AI三大宏观预测:从GPT-5发布看技术演进与行业适应

针对OpenAI发布GPT-5引发的行业震动,本文提出三项关键预判:首先,类比计算器未使学生丧失运算能力,大语言模型(LLM)不会导致人类思维退化,但产业与年轻从业者需经历技术适应期;其次,通用人工智能(AGI)短期...

Read More
2025-08-11 talkingdev

OpenAI宣布恢复ChatGPT的GPT-4o模型并提高免费和Plus用户的推理模型限制

OpenAI首席执行官Sam Altman近日宣布,公司将恢复ChatGPT中的GPT-4o模型,并提高免费和Plus用户的推理模型使用限制。这一举措被视为对用户反馈的积极回应,尤其是在推理模型使用量激增的背景下。GPT-4o作为OpenAI的...

Read More
2025-08-07 talkingdev

AI模型内部计算路径首次可视化:多机构联合发布可解释性研究突破

由多个研究实验室联合开展的可解释性项目取得重大进展,科学家首次实现追踪AI模型推理时的内部计算路径,其精细程度堪比观察脑部神经元的激活过程。这项发表在Neuronpedia平台的研究通过交互式教材形式,系统演示了...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page