大语言模型优化的相关内容 - 漫话开发者

2025-11-29 talkingdev

[开源]FalkorDB发布超高速图数据库，专为LLM知识图谱应用打造

近日，开源社区迎来一款突破性的图数据库FalkorDB，该数据库底层采用GraphBLAS技术实现稀疏邻接矩阵图表示，展现出卓越的性能表现。作为专门针对大语言模型优化的知识图谱解决方案，FalkorDB旨在为GraphRAG（图检索...

2025-08-10 talkingdev

据彭博社报道，以Anthropic和OpenAI为代表的人工智能初创公司正在加速从华尔街金融机构招募量化研究员，提供极具竞争力的薪酬和福利。在曼哈顿下东区的一个屋顶酒吧，约150名量化研究员与Anthropic的员工进行了会面...

2025-08-01 talkingdev

亚马逊正通过实用型生成式AI创新深刻改变人类工作与生活方式。作为拥有25年AI/ML模型部署经验的技术先驱，亚马逊已构建超1,000个生成式AI应用矩阵，覆盖从AWS云服务、Alexa智能语音到物流机器人等全业务场景。其AI人...

2025-06-26 talkingdev

近期GitHub上开源的ConciseHint项目提出了一种创新的大语言模型推理优化技术。该技术通过在生成过程中注入学习或手工设计的简洁提示，能够在保持模型性能的前提下显著提升推理过程的简洁性。这一突破性方法解决了当...

2025-06-16 talkingdev

PyTorch官方博客最新发布的ParetoQ训练算法在低比特量化领域取得重大突破。该技术首次实现了二元（1-bit）、三元（1.58-bit）和2至4位量化的统一框架，并在所有量化级别上均达到当前最优性能。这一突破性进展尤其适...

2025-05-14 talkingdev

大型语言模型（LLMs）在代码生成领域已取得显著成就，但其输出仍常因缺乏形式化约束而出现编译错误。针对这一挑战，研究者提出了一种创新的类型约束解码方法，通过类型系统引导代码生成。该研究开发了新型前缀自动机...

2025-04-15 talkingdev

由Tianyi实验室发布的C3PO项目在GitHub开源了一种创新的测试时优化技术，该技术通过基于相似参考样本重新混合专家权重，显著提升了混合专家（Mixture-of-Experts，MoE）大语言模型的准确性。这一突破性方法不仅优化...