性能的相关内容 - 漫话开发者

2025-02-26 talkingdev

Character AI在NanoGPT中实现内存优化，KV缓存使用减少40%

近日，Character AI在其大规模推理系统中成功减少了KV缓存的使用，并在一个简化版的GPT模型中实现了这一优化。通过这一技术改进，内存使用量减少了40%。这一优化不仅提升了系统的运行效率，还为未来更大规模的AI模型...

2025-02-26 talkingdev

近日，EmbodiedEval作为一种全面且交互式的基准测试工具正式亮相，旨在评估多模态大语言模型（MLLMs）在具身任务中的表现。具身任务是指模型需要在物理环境中执行具体操作的任务，这对模型的感知、推理和执行能力提...

2025-02-26 talkingdev

近日，Chicory作为一款JVM原生的WebAssembly运行时技术，引起了广泛关注。WebAssembly（Wasm）作为一种高效的二进制指令格式，旨在为Web应用提供接近原生的性能。Chicory的独特之处在于其直接在Java虚拟机（JVM）上...

2025-02-26 talkingdev

近日，技术社区中出现了一项引人注目的进展：将Python嵌入到Elixir中。这一技术融合不仅展示了两种语言之间的互操作性，还为开发者提供了更多的灵活性和功能扩展的可能性。通过这种方式，开发者可以在Elixir项目中直...

2025-02-26 talkingdev

近日，Browser Use (YC W25) 宣布推出其开源项目——Web Agents，旨在通过自动化技术提升用户在浏览器中的操作效率。该项目基于先进的LLM和agent技术，能够模拟人类在网页上的操作行为，如点击、滚动、填写表单等。通...

2025-02-26 talkingdev

近日，Framework发布了其首款台式机产品，这款产品以其独特的迷你ITX设计引起了广泛关注。作为一家以模块化和可升级性著称的公司，Framework此次推出的台式机延续了其品牌理念，旨在为用户提供高度定制化的游戏体验...

2025-02-25 talkingdev

近日，Moonshot发布了一项名为Block Attention混合算法的创新技术，该算法在长上下文语言模型（LLM）中的应用表现卓越，被认为可与NSA相媲美。Block Attention混合算法通过优化注意力机制，显著提升了模型在处理长文...

2025-02-25 talkingdev

近日，一项名为Light Thinker的技术引起了广泛关注。该技术旨在将冗长的推理轨迹压缩为更小、更紧凑的表示形式，从而节省上下文空间，同时仍能有效引导模型。这一创新不仅提升了模型的效率，还为处理复杂任务时的资...