arXiv的相关内容 - 漫话开发者

2025-05-02 talkingdev

[论文推荐]Fed-SB提出基于LoRA-SB的联邦学习微调方案，显著降低通信成本

Fed-SB研究团队在arXiv最新论文中提出了一种突破性的联邦学习框架LoRA-SB，该技术通过低秩自适应(Low-Rank Adaptation, LoRA)方法实现大型语言模型(LLM)的高效分布式微调。这一创新方案通过参数高效微调(PEFT)技术，...

2025-05-01 talkingdev

最新研究表明，通过在大语言模型（LLM）的残差流中实施简单的表征控制向量干预，可显著调节其推理性能。这项发表于arXiv的突破性研究揭示了神经网络内部表征与逻辑推理能力的直接关联，为可解释AI领域提供了新工具。...

2025-04-29 talkingdev

来自arXiv的最新研究论文提出ReLearn框架，通过创新的数据增强和微调技术，解决了大语言模型（LLMs）中的关键挑战——'遗忘学习'（Unlearning）。该技术可精准移除模型训练数据中的特定信息，同时保持整体性能，对数据...

2025-04-29 talkingdev

近期发表于arXiv的一篇研究论文提出了一种针对缺失标签的多重填补方法，为机器学习领域中的分类器评估提供了创新解决方案。该方法通过多重填补技术生成预测分布，即使在数据缺失非随机（MNAR）的复杂条件下，仍能保...

2025-04-28 talkingdev

DisenGCD作为认知诊断领域的前沿模型，通过创新的解耦图学习框架（Disentangled Graph Learning Framework），实现了对学生、习题及概念表征的三元关系深度建模。该技术突破性地将传统认知诊断中的耦合特征进行解耦...

2025-04-28 talkingdev

华为研究人员在arXiv最新论文中提出了一种创新性的轻量级神经应用控制技术，该技术利用视觉语言模型(VLMs)实现Android设备的应用控制，且仅需极少的额外系统配置。这一突破性进展标志着多模态AI在移动终端交互领域的...

2025-04-26 talkingdev

来自arXiv的最新研究论文提出了一种名为DFloat11的动态长度浮点无损压缩框架，通过创新性地利用LLM权重中BFloat16格式的低熵特性，实现了30%的模型体积缩减，同时保持输出结果与原始模型的比特级一致性。该技术采用...

2025-04-25 talkingdev

近日，一项名为GEMCODE的新型AI系统在药物研发领域引发关注。该系统通过人工智能技术实现了共晶筛选的自动化流程，有望大幅缩短药物开发周期。共晶技术作为药物固态研发的重要手段，能显著改善活性药物成分的溶解度...