本网站包含来自80多家公司的300个案例研究,分享了实际的机器学习用例和设计机器学习系统的经验。数据库可以按行业或机器学习用例进行筛选。还提供基于重复主题的标签。这些案例研究可以帮助开发人员更好地了解机器...
Read MoreMamba是一种非Transformer的模型,其性能惊人。它经过了SFT的聊天调优,并且似乎具有比同等大小的Transformer更好的开箱即用的检索能力。
Read More最近,Mistral发布了一个使用MLX生成文本的示例,这是一种基于人工智能的技术,它可以生成高质量的自然语言文本。该示例代码可以在GitHub上找到,它展示了如何使用Mistral的MLX库来生成文本。MLX库是Mistral的核心开...
Read More仅仅在苹果公司推出MLX框架的一天后,人们已经成功将Llama 2模型运行在了新框架上。据悉,这是由于MLX框架的开放性,使得用户可以更加方便地进行模型的迁移和使用。同时,这也展示了MLX框架在机器学习领域的强大性能...
Read More一种名为OneLLM的新型AI模型正在掀起波澜,它使用一种独特的方法将所有这些模态与语言对齐,理解包括图像、音频甚至脑活动在内的八种不同类型的数据。OneLLM的这种多模态理解方法可能会推动AI在语义理解方面的进一步...
Read MoreAnthropic最近发布的Claude拥有200k个词汇的上下文。它似乎遭受了语言模型在外部评估中的“迷失在中间”的问题,这意味着它只有27%的标准问题的检索性能。但是,如果在提示中添加句子“助手:这是上下文中最相关的句子...
Read MoreKandinsky 3.0是一种文本转图像模型,它可以从文本中生成更加真实的图像。Kandinsky 3.0采用了最新的生成对抗网络(GAN)模型,通过学习图像语义和语法,从而生成更加逼真、高质量的图像。该技术的应用将会在电影、...
Read More谷歌宣布推出Cloud TPU v5p,这是目前谷歌最强大、可扩展和灵活的AI加速器。TPU用于训练和提供AI产品。谷歌还宣布推出AI超级计算机,这是一种超级计算机架构,采用性能优化硬件、开放软件、领先的ML框架和灵活的消费...
Read More