最近的研究表明,像Othello-GPT这样的大型语言模型(LLM)能够构建世界模型,这意味着它们在一定程度上理解了世界。该网络通过在没有明确游戏规则的情况下对游戏动作进行训练,识别出了基础的8x8棋盘结构和游戏规则...
Read MoreParea AI是一个开发者工具包,专门用于调试和监控LLM应用。用户可以以版本化的方式实验提示和模型配置。在较大规模上,使用自定义的Python评估指标来评估提示。通过API监控LLM应用,并在仪表板上查看分析数据。Parea...
Read MoreMagentic是一款强大的工具,它可以帮助开发者轻松地将大型语言模型(LLMs)集成到Python代码中。Magentic的特点在于,它将提示模板处理为函数,使用类型注释来指定结构化输出。然后,您可以无缝地将LLM查询和函数调...
Read More在大型语言模型(LLMs)的助力下,生成式AI系统取得了显著的发展。GitHub近日发布的开源工具SimplyRetrieve,为用户提供了一种易用的方法,可以通过使用检索中心生成(Retrieval-Centric Generation)方法,将私人数...
Read MoreAnthropic近日发布了更新版本的快速、经济的文本生成模型Claude Instant。此模型能生成更长、结构更严谨的回复,更好地遵循格式指示,并在引用提取、多语种能力和问答方面表现出改善。Claude Instant已通过API可供使...
Read MoreAgentflow是一个旨在为用户提供创建和执行由大语言模型驱动的工作流的强大但易用的工具。它是以开源形式在GitHub上发布的一个项目,旨在通过复杂的工作流程来增强大语言模型的使用。这个工具的主要优势在于,用户无...
Read More该项目引入了AgentBench,一个用于测试大型语言模型(LLMs)在各种交互环境中的基准工具。在对25个LLMs进行的初步测试中,结果显示商业模型的表现超过了开源模型。这项研究为我们理解和评估大型语言模型的交互性能提供...
Read More英伟达宣布推出GH200,一款专为运行人工智能模型设计的新芯片。它与H100使用相同的GPU,但搭配了141GB内存和一个72核的ARM中央处理器。额外的内存将允许更大的人工智能模型在单个系统上运行,并显著降低推理成本。GH...
Read More