DeepEval 是一个提供 Pythonic 方式进行离线评估的工具,可以帮助您方便地将 LLM 流水线投入生产。LLM 流水线是一种机器学习模型开发流程,通过使用 DeepEval,开发者可以在不连接网络的情况下,对其进行评估和优化...
Read More在软件开发中,提交信息起着至关重要的作用,但很多提交信息都缺乏详细的描述。最近有一篇论文提出了一个新的方法,利用过去的提交历史,而非简单地生成提交信息。这篇论文提出了一个新的数据集,名为CommitChronicl...
Read More在一张图片中,计算机有时会将同一对象识别为多个。现在,一个新的项目开发出一种方法,帮助计算机识别并聚焦于对象的单一完整版本。这种方法的出现,将对计算机视觉和图像理解能力的提升起到关键作用,不仅可以优化...
Read More近日,一项研究引入了一种名为Solo Performance Prompting(SPP)的方法。该方法利用LLMs中的多个角色模拟认知协同,这是一种提高问题解决能力的协作过程。通过使用经过精细调整的角色,SPP使LLMs能够处理需要深度领...
Read More本文概述了十个关键的AI开发者工具设计原则,这些原则来自于GitHub在设计、发布和扩展Copilot的经验。这些原则包括利用自然语言、解决开发者的痛点、收集有意义的反馈、承认偏见,并优先考虑定制化、可访问性、性能...
Read More最近,一款名为OpenDream的新技术在GitHub仓库中引起了大量的关注。OpenDream的核心优势在于,它为稳定扩散工作流带来了多种新的特性。首先,OpenDream引入了层次化的设计,这让开发者能够更好地组织和管理他们的代...
Read MoreChidori是一个用于构建AI Agents的反应式运行时。它提供了一个框架,可以构建出反应式、可观察和强大的AI代理。该框架支持使用Node.js,Python和Rust构建代理。Chidori的目标是使得开发者可以构建出具有高度可靠性和...
Read More近日,GitHub上发布了一款名为U-CREAT的新工具,该工具采用事件提取技术,能更快、更准确地找到相关的历史法律案例。同时,该工具还展示了IL-PCR语料库,这是一个包含大量印度法律案例的庞大集合。不仅在印度法律系...
Read More