Abacus AI开发的一款名为“Smaug-72B”的新型开源语言模型,源自阿里巴巴集团的Qwen团队开发的“Qwen-72B”,现在领导Hugging Face的自然语言处理排行榜。在各种基准测试中,Smaug-72B胜过了已经成熟的模型,如GPT-3.5和...
Read MoreGitHub仓库发布了一个名为DeepSeekMath 7B的语言模型,专门设计用于解决复杂的数学问题。该模型训练了大量以数学为重点的内容,它可以理解数学问题的语法和语义,并根据其推理出答案。DeepSeekMath 7B是一个重要的AI...
Read MoreRoblox开发了一种AI模型,能够实时翻译16种语言的文本聊天,以打破语言壁垒,增强用户参与度。该模型利用基于转换器的大型语言模型,在混合专家架构中实现了高效的资源利用,同时保持了其隐私和安全流程。
Read MoreKahneman-Tversky Optimization(KTO)是一种新的方法,用于训练AI模型以更好地与人类思维对齐。通过利用Kahneman&Tversky的前景理论概念,KTO侧重于最大化效用而不仅仅是偏好可能性。这种新的方法可以帮助AI模型更...
Read MoreIBM咨询和Casper Labs正在共同开发一种由区块链驱动的开创性AI治理工具。该工具是基于IBM的watsonx.governance平台构建的,它将为企业使用的AI模型引入AI版本控制、高级监控、许可和访问控制。对于那些希望在遵守内...
Read MoreAI社区因HuggingFace和4chan分享的一个名为“miqu-1-70b”的泄漏大型语言模型而感到兴奋。该模型表现出能与OpenAI的GPT-4相媲美的性能,并与Mistral的Mixtral 8x7b有关。Mistral的CEO确认这是一位热情的客户泄露的,这...
Read More谷歌似乎要完全放弃“Bard”品牌,并全面转向“Gemini”。本周早些时候,Bard的所有电话体验都更名为“Gemini”。 现在,移动设备和Web上的应用程序都显示“Bard现在是Gemini”。Bard由Gemini Pro提供支持,这是谷歌最新的AI...
Read More苹果正在为iOS 18准备重大的人工智能功能。它正在使用OpenAI的ChatGPT API进行内部测试,以开发自己的AI模型。iOS 17.4的第一个测试版揭示了一个新的SiriSummarization框架,它将AI集成到Messages应用程序中,实现了...
Read More本周,Mistral公司的CEO确认了Mistral的一个量化版本文件在HuggingFace上泄露,该技术使得在较弱的电脑和芯片上运行某些AI模型成为可能。据报道,该模型在EQ-Bench上超过了全球所有其他LLM模型,仅次于GPT-4。Mistra...
Read More研究人员通过在训练手部注释图像中添加三个额外通道,改善了生成模型(例如GAN和扩散模型)创建逼真手部图像的能力。这种方法利用了手部形态的先验知识,可以应用于许多手部相关的任务,例如手语翻译和手势识别。此...
Read More