漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-25 talkingdev

Moonshot推出Block Attention混合算法,提升长上下文LLM性能

近日,Moonshot发布了一项名为Block Attention混合算法的创新技术,该算法在长上下文语言模型(LLM)中的应用表现卓越,被认为可与NSA相媲美。Block Attention混合算法通过优化注意力机制,显著提升了模型在处理长文...

Read More
2025-02-25 talkingdev

Cast4技术突破:单张RGB图像生成完整3D场景

近日,一项名为Cast4的技术在3D场景生成领域取得了重要突破。该技术通过复杂的算法流程,能够从单张RGB图像中生成完整的3D场景,尤其适用于室内场景的建模。传统方法在从单张图像生成3D场景时面临诸多挑战,而Cast4...

Read More
2025-02-24 talkingdev

Triton实现Naive Sparse Attention,助力高效长上下文注意力算法

近日,DeepSeek NSA论文因其可扩展且高效的长上下文注意力算法引发了广泛关注。然而,该论文并未提供相关代码。为此,一项基于Triton的实现应运而生,该实现可无缝集成到任何PyTorch代码库中。Triton作为一种高效的G...

Read More
2025-02-24 talkingdev

仅用四个数字2,如何构造任意整数?数学挑战引发热议

近日,一项关于如何仅用四个数字2构造任意整数的数学挑战在技术圈引发广泛讨论。该问题不仅考验数学家的创造力,也为算法设计和逻辑推理提供了新的思路。通过结合数学运算符、括号以及指数等工具,参与者可以尝试构...

Read More
2025-02-21 talkingdev

高效网络爬虫技术助力LLM预训练,Crawl4LLM数据提取新突破

在LLM的预训练过程中,网络爬虫获取的数据往往因文本提取效率低下而被大量丢弃。然而,近期一项开源项目在GitHub上发布,显著提升了文档的保存率,并利用这些数据在少量爬取内容的基础上训练出更强大的模型。该项目...

Read More
2025-02-20 talkingdev

新型图书排序算法接近完美,提升信息存储效率

近期,研究人员开发出了一种新型算法,用以解决图书馆书籍排序问题,即如何在最短时间内将新书放置到书架上,并保持某种排序顺序。这一问题同样适用于硬盘和数据库中文件的排列。该算法的效率接近理论上的理想状态,...

Read More
2025-02-19 talkingdev

DeepSeek推出Native Sparse Attention技术,显著提升Attention计算效率

近日,DeepSeek公司推出了一项名为Native Sparse Attention的创新算法技术,旨在加速传统的二次Attention计算。该技术通过硬件对齐和原生可训练的稀疏Attention机制,实现了高达11倍的计算速度提升,同时保持了整体...

Read More
2025-02-13 talkingdev

谷歌DeepMind展示微型人形机器人足球赛

谷歌DeepMind最近发布了一段视频,展示了微型人形机器人进行一对一足球比赛的能力。这些机器人不仅能够理解足球比赛的规则,还能预测球的运动方向以及何时拦截对手的射门。这段15秒的视频充分展示了DeepMind在机器人...

Read More
  1. Prev Page
  2. 38
  3. 39
  4. 40
  5. Next Page