算法的相关内容 - 漫话开发者

2025-02-25 talkingdev

Moonshot推出Block Attention混合算法，提升长上下文LLM性能

近日，Moonshot发布了一项名为Block Attention混合算法的创新技术，该算法在长上下文语言模型（LLM）中的应用表现卓越，被认为可与NSA相媲美。Block Attention混合算法通过优化注意力机制，显著提升了模型在处理长文...

2025-02-25 talkingdev

近日，一项名为Cast4的技术在3D场景生成领域取得了重要突破。该技术通过复杂的算法流程，能够从单张RGB图像中生成完整的3D场景，尤其适用于室内场景的建模。传统方法在从单张图像生成3D场景时面临诸多挑战，而Cast4...

2025-02-24 talkingdev

近日，DeepSeek NSA论文因其可扩展且高效的长上下文注意力算法引发了广泛关注。然而，该论文并未提供相关代码。为此，一项基于Triton的实现应运而生，该实现可无缝集成到任何PyTorch代码库中。Triton作为一种高效的G...

2025-02-24 talkingdev

近日，一项关于如何仅用四个数字2构造任意整数的数学挑战在技术圈引发广泛讨论。该问题不仅考验数学家的创造力，也为算法设计和逻辑推理提供了新的思路。通过结合数学运算符、括号以及指数等工具，参与者可以尝试构...

2025-02-21 talkingdev

在LLM的预训练过程中，网络爬虫获取的数据往往因文本提取效率低下而被大量丢弃。然而，近期一项开源项目在GitHub上发布，显著提升了文档的保存率，并利用这些数据在少量爬取内容的基础上训练出更强大的模型。该项目...

2025-02-20 talkingdev

近期，研究人员开发出了一种新型算法，用以解决图书馆书籍排序问题，即如何在最短时间内将新书放置到书架上，并保持某种排序顺序。这一问题同样适用于硬盘和数据库中文件的排列。该算法的效率接近理论上的理想状态，...

2025-02-19 talkingdev

近日，DeepSeek公司推出了一项名为Native Sparse Attention的创新算法技术，旨在加速传统的二次Attention计算。该技术通过硬件对齐和原生可训练的稀疏Attention机制，实现了高达11倍的计算速度提升，同时保持了整体...

2025-02-13 talkingdev

谷歌DeepMind最近发布了一段视频，展示了微型人形机器人进行一对一足球比赛的能力。这些机器人不仅能够理解足球比赛的规则，还能预测球的运动方向以及何时拦截对手的射门。这段15秒的视频充分展示了DeepMind在机器人...