近日,Character AI在其大规模推理系统中成功减少了KV缓存的使用,并在一个简化版的GPT模型中实现了这一优化。通过这一技术改进,内存使用量减少了40%。这一优化不仅提升了系统的运行效率,还为未来更大规模的AI模型...
Read More近日,EmbodiedEval作为一种全面且交互式的基准测试工具正式亮相,旨在评估多模态大语言模型(MLLMs)在具身任务中的表现。具身任务是指模型需要在物理环境中执行具体操作的任务,这对模型的感知、推理和执行能力提...
Read More近日,Chicory作为一款JVM原生的WebAssembly运行时技术,引起了广泛关注。WebAssembly(Wasm)作为一种高效的二进制指令格式,旨在为Web应用提供接近原生的性能。Chicory的独特之处在于其直接在Java虚拟机(JVM)上...
Read More近日,技术社区中出现了一项引人注目的进展:将Python嵌入到Elixir中。这一技术融合不仅展示了两种语言之间的互操作性,还为开发者提供了更多的灵活性和功能扩展的可能性。通过这种方式,开发者可以在Elixir项目中直...
Read More近日,Browser Use (YC W25) 宣布推出其开源项目——Web Agents,旨在通过自动化技术提升用户在浏览器中的操作效率。该项目基于先进的LLM和agent技术,能够模拟人类在网页上的操作行为,如点击、滚动、填写表单等。通...
Read More近日,Framework发布了其首款台式机产品,这款产品以其独特的迷你ITX设计引起了广泛关注。作为一家以模块化和可升级性著称的公司,Framework此次推出的台式机延续了其品牌理念,旨在为用户提供高度定制化的游戏体验...
Read More近日,Moonshot发布了一项名为Block Attention混合算法的创新技术,该算法在长上下文语言模型(LLM)中的应用表现卓越,被认为可与NSA相媲美。Block Attention混合算法通过优化注意力机制,显著提升了模型在处理长文...
Read More近日,一项名为Light Thinker的技术引起了广泛关注。该技术旨在将冗长的推理轨迹压缩为更小、更紧凑的表示形式,从而节省上下文空间,同时仍能有效引导模型。这一创新不仅提升了模型的效率,还为处理复杂任务时的资...
Read More