在人工智能领域,通用大模型(LLMs)虽然功能强大,但对于特定任务而言,其庞大的计算资源消耗和较高的成本并不总是最优选择。为此,Fastino公司推出了专精任务的语言模型(TLMs),旨在为特定任务提供更高效、更精...
Read More近日,开发者社区热议一款名为“ZLinq”的新型LINQ库,其主打零内存分配特性,专为.NET平台设计。LINQ(Language Integrated Query)作为.NET生态中数据查询的核心技术,长期面临性能损耗问题,尤其在频繁操作时易产生...
Read More近日,开发者dipampaul17在GitHub上发布了KVSplit项目,该项目通过差异化精度的KV缓存量化技术,在苹果芯片(M1/M2/M3/M4)上实现了更长上下文的LLM推理。研究发现,LLM推理中的KV缓存中,键(Keys)和值(Values)...
Read MoreBLIP3-o作为一种新型的扩散Transformer架构,通过序列预训练方法实现了技术突破,并在多模态基准测试中取得了当前最优异的成绩。该研究不仅发布了完整的代码和权重文件,还附带了一个包含6万条指令的微调数据集,为...
Read MoreMeta旗下FAIR(基础人工智能研究)团队近日宣布推出多项重要开源成果,涵盖三大前沿领域:1) 分子属性预测数据集与模型,将加速药物发现与材料科学研发流程;2) 扩散模型(Diffusion Models)相关资源,为当前最热门...
Read More人工智能研究机构Ai2近日推出其最新研发的小型AI模型Olmo 2 1B,该模型拥有10亿参数,在关键基准测试中表现优异,超越了谷歌和Meta等科技巨头发布的同规模模型。这一突破性进展展示了小型化AI模型的巨大潜力,表明在...
Read MoreHelixDB是一款基于Rust构建的开源图向量数据库,专为RAG(检索增强生成)和AI应用设计。它原生整合了图和向量数据类型,无需牺牲性能。HelixDB的初始目标是为RAG提供支持,其基准测试显示,在向量查询方面与Pinecone...
Read More大型语言模型(LLMs)在代码生成领域已取得显著成就,但其输出仍常因缺乏形式化约束而出现编译错误。针对这一挑战,研究者提出了一种创新的类型约束解码方法,通过类型系统引导代码生成。该研究开发了新型前缀自动机...
Read More