Anthropic最近推出了Claude 3.5 Sonnet,其在多项基准测试中的性能超过了GPT-4o和Gemini,同时增加了速度和扩展了功能。此次更新还引入了Artifacts功能,增强了用户与AI输出的交互。Claude旨在从一个聊天机器人转变...
Read MorePyTorch是构建模型的强大工具。然而,在实际使用中,一些常见的bug可能会大幅降低模型的性能。为此,我们提供了一份实用的列表,帮助您在调试模型代码时找到问题并解决。该列表内容详尽、实用性强,无论是在建模过程...
Read More纽约大学(NYU)最近推出了一种全面公开、性能卓越的视觉模型Cambrian-1。此模型对文本编码器和数据混合进行了大规模的消融研究。这一技术的开发,将对视觉模型的研发产生深远影响,推动相关技术向前发展。全面开放...
Read MoreLlama Agents是一个以异步为首的框架,用于构建、迭代和生产多智能体系统,包括多智能体通信,分布式工具执行,人在环中等等。Llama Agents的目标是提供一个强大、灵活且易于使用的框架,以支持开发者在各种场景中快...
Read MoreMosaic团队已与PyTorch合作,撰写关于如何扩展他们的MoEs模型至数千个GPU的文章。MoEs,全称Mixture of Experts,是一种深度学习的模型结构,其核心思想是将复杂的问题分解为若干个相对简单的子问题,然后由专家系统...
Read MoreMUMU视觉模型是一种创新的生成图像模型,它的特点在于能够将文本和图像交织在一起进行更强的条件化处理。这种独特的方法使得MUMU视觉模型在性能上超越了纯文本条件化模型。MUMU视觉模型的核心优势在于,它不仅仅是将...
Read MoreMeta LLM编译器是一种新型编译器,采用神经网络进行优化和反汇编,能够显著提高代码的性能和可读性。该编译器可以自动检测代码中的瓶颈,并通过神经网络进行优化,从而提高代码的运行速度。此外,Meta LLM编译器还可...
Read MoreMatText是一套专为评估材料科学中语言模型性能的基准测试工具和数据集。这套工具和数据集的设计目标,是使研究者能够更有效地理解和评估语言模型在材料科学应用中的表现。语言模型在材料科学中的应用,可以帮助科学...
Read More我们很高兴地宣布,Gemma 2系列的两款新型号——9B和27B现已正式上市。这两款新型号均秉承了Gemma 2系列的一贯优良传统,将先进的技术与优雅的设计完美融合。无论是在性能、可靠性还是易用性方面,Gemma 2的9B和27B都...
Read MoreALPBench是一个专门设计用来对积极学习查询策略进行标准化基准测试的工具。积极学习是一种机器学习技术,其目标是通过选择最有用的数据进行训练,从而提高学习效率。然而,确定哪些数据最有用却是一项具有挑战性的任...
Read More