编码的相关内容 - 漫话开发者

2025-04-18 talkingdev

Meta发布多项AI新成果：图像编码器、视觉语言模型及3D物体定位系统

Meta公司近日重磅推出四项人工智能领域的重要技术成果：1）高性能图像编码器，可优化视觉数据的特征提取效率；2）视觉语言模型（VLM），实现跨模态理解与生成；3）基于联合嵌入预测架构（JEPA）的3D物体定位模型，突...

2025-04-18 talkingdev

近日，一项名为REPA-E的技术突破引发了机器学习领域的广泛关注。该技术通过创新的表示对齐损失函数，首次实现了变分自编码器(VAE)与潜在扩散模型的稳定联合训练。这种端到端的训练方法在ImageNet数据集上取得了当前...

2025-04-18 talkingdev

谷歌研究院与加州大学团队在arXiv最新发表的论文提出3D CoCa框架，这一突破性技术通过整合视觉语言对比学习（Contrastive Learning）与场景描述（Captioning）两大前沿方向，实现了对三维场景的多模态联合理解。该框...

2025-04-18 talkingdev

AI可解释性领域领军企业Goodfire近日宣布完成5000万美元A轮融资。该公司在稀疏自编码器（SAEs）等机械可解释性技术上具有深厚积累，致力于通过与闭源及开源模型提供方的深度合作，系统性地解析、引导和控制AI模型的...

2025-04-15 talkingdev

当前大多数针对连续信号的生成模型由于计算限制，通常需要在潜在空间中进行操作。然而，这项研究引入了一系列级联结构，使得生成过程可以直接在像素空间中进行。这一创新不仅显著提升了生成效率，还消除了对预训练变...

2025-04-15 talkingdev

OpenAI近日在其API中推出了三款全新模型：GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这些模型在编码和指令遵循方面表现优异，全面超越了之前的GPT-4o和GPT-4o mini。新模型不仅具备更大的上下文窗口，支持高达100万toke...

2025-04-09 talkingdev

历经38年研发的知识表示系统Cyc项目近日正式终止，标志着人工智能发展史上一个重要篇章的完结。由Douglas Lenat于1984年创立的Cyc项目，旨在通过人工编码的常识知识库实现机器推理能力，其知识库最终包含超过2500万...

2025-04-07 talkingdev

Sparks是一套创新的字体系统，它允许用户在文本中嵌入sparklines（迷你图表），而无需编写任何代码。通过利用OpenType字体的上下文交替功能，Sparks能够对数字进行简单的替换操作以生成图表。该字体适用于桌面和网络...