Figure公司近日展示了一款新型Vision-Language-Action(VLA)模型,专为人形机器人设计。VLA模型通过结合视觉和语言命令处理信息,使得机器人能够通过视频和大型语言模型的组合进行训练。Figure的Helix模型特别引人...
Read More近日,一项关于表示容量极限的研究引起了广泛关注。该研究尝试将尽可能多的Token嵌入到一个固定大小的向量中,成功实现了将1568个Token压缩至单一向量。这一突破不仅展示了embedding技术的强大潜力,也为LLM和agent...
Read More近日,DeepSeek公司推出了一项名为Native Sparse Attention的创新算法技术,旨在加速传统的二次Attention计算。该技术通过硬件对齐和原生可训练的稀疏Attention机制,实现了高达11倍的计算速度提升,同时保持了整体...
Read More近日,一款名为Kreuzberg的现代异步Python库在技术社区中引起了广泛关注。该库专注于文档文本提取,旨在为开发者提供高效、灵活的解决方案。Kreuzberg通过异步编程模型,显著提升了文本提取的速度和效率,尤其适用于...
Read More近日,一项名为Mask-Enhanced Autoregressive Prediction(MEAP)的技术在GitHub上发布,该技术通过将Masked Language Modeling(MLM)整合到仅解码器的Transformer中,显著提升了信息检索任务的性能,同时保持了强...
Read More近日,Meta在Hugging Face Hub上发布了其最新研发的MobileLLM模型检查点。这一系列模型专为移动设备优化,尽管体积小巧,但性能强大,能够在资源受限的环境中高效运行。MobileLLM的推出标志着Meta在移动端AI技术领域...
Read More近日,Mistral发布了一款名为Mistral le Chat的全新聊天助手,其处理速度高达每秒1000字,成为目前市场上最快的聊天助手之一。该助手基于Mistral强大的先进编码模型,结合直观的用户界面,能够高效协助用户完成多种...
Read More近日,QLASS推出了一种创新的Q引导逐步搜索方法,旨在提升语言agent的决策能力。该方法通过提供中间奖励,显著提高了推理效率,并减少了对标注数据的依赖。这一技术突破不仅优化了语言agent的搜索过程,还为复杂任务...
Read More