漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-26 talkingdev

开源|ThinkMesh:为大语言模型引入并行思维,置信度门控与策略驱动的推理新框架

ThinkMesh 是一个创新的Python开源库,旨在提升大语言模型(LLM)的推理能力。该框架通过并行运行多样化的推理路径,并利用内部置信度信号对每条路径进行评分,动态地将计算资源重新分配给最有潜力的分支,最后通过...

Read More
2024-05-15 talkingdev

论文:深度学习新模型,无状态序列并行推理

深度学习领域有了一项新的突破。研究人员开发出了一个新的状态空间模型,这一模型使用双重转移函数表示。其主要特点是一个无状态的序列并行推理算法。这种新的推理算法能够在处理大规模数据时,有效提高计算效率和准...

Read More
2023-07-11 talkingdev

树莓派集群上运行llama 65B模型?(GitHub议题)

GGML是一个开源库,用于在低资源设备上运行语言模型。最近,团队已经进行了并行推理的MPI(Message Passing Interface)工作。现在,随着这些变化的实施,团队正在努力在树莓派集群上推理llama 65B模型。这一行动可...

Read More