神经网络的相关内容 - 漫话开发者

2025-04-01 talkingdev

[论文推荐]LLM敏感内容选择性遗忘技术取得突破

最新发表在arXiv的论文提出了一种创新的模型融合技术，能够从大型语言模型(LLM)中精准移除敏感内容，同时保持模型的通用知识能力。这项突破性研究通过参数空间分析，识别并分离与敏感信息相关的神经网络连接，实现了...

2025-03-26 talkingdev

视觉几何基础Transformer（Visual Geometry Grounded Transformer，简称VGGT）是一种前馈神经网络，能够直接从场景的一个、几个甚至数百个视角中推断出所有关键的3D属性，包括外部和内部相机参数、点云图、深度图以...

2025-03-25 talkingdev

Jane Street的机器学习研究员In Young Cho在最新一期的播客中，深入探讨了在低数据量、高噪音的环境下应用机器学习所面临的挑战。她详细解析了从线性模型到神经网络的技术转变，并分享了在实际应用中的经验与见解。C...

2025-03-13 talkingdev

Hugging Face 团队近日发布了其 DeepSeek 推理模型的开源复制项目 OpenR1 的最新更新。此次更新揭示了一个有趣的发现：当针对竞争性编程进行专门调优时，小型模型的表现可以超越更大规模的模型。这一发现不仅挑战了...

2025-03-13 talkingdev

近期，一项名为CATANet的创新技术在高分辨率图像生成领域取得了重要进展。该技术通过聚合长距离内容相似的标记（tokens），显著提升了图像超分辨率的效果。传统的超分辨率方法通常依赖于局部特征的处理，而CATANet则...

2025-02-15 talkingdev

在技术发展的长河中，GPU（图形处理单元）一直被视为图形渲染的专用硬件。然而，随着人工智能和机器学习领域的迅猛发展，GPU的角色已经发生了根本性的转变。最初，GPU设计用于加速图形处理，但其并行处理能力使其成...

2025-02-11 talkingdev

近日，一项创新性研究提出了一种改进神经网络训练的新方法，该方法通过将回归任务重新构建为分类问题，利用学习到的目标编码器-解码器对来实现。与传统回归方法相比，这种新方法通过分布目标表示和平滑插值技术，显...

2025-01-31 talkingdev

近日，Reqo推出了一款全新的查询优化模型，该模型结合了双向图神经网络（Bi-GNN）与概率机器学习（ML）技术，旨在提升查询成本估算的准确性。与传统方法不同，Reqo引入了一种创新的可解释性技术，能够突出查询子图的...