法国AI初创公司Mistral宣布推出新的API模型,并与Azure达成合作。Mistral Large在多语言任务方面表现出色,在MMLU上仅比GPT-4差了几个百分点,性能强大。该初创公司还在其API中添加了一个新的mistral-small模型。
Read MoreSam Altman提出的7万亿美元的要求旨在支持推进GPT等生成式AI模型的成本迅速上升,这表明未来迭代的资源需求呈指数增长。这一雄心壮志凸显了人工智能发展的关键时刻,需要平衡快速技术进步和快速推进对安全和社会准备...
Read MoreOpenCodeInterpreter模型基于CodeLlama和DeepSeek Coder,通过训练合成多轮数据集和使用人类反馈,能够在编程HumanEval基准测试中获得85%以上的准确率。
Read MoreREINFORCE是一种简单、标准且易于理解的强化学习方法。然而,在模拟器中使用它很难稳定地进行训练。PPO在一般情况下更为高效和稳定。Gemini使用REINFORCE算法,而据信GPT-4使用PPO算法。
Read MoreOpenAI正在研发一个网络搜索引擎,直接与谷歌展开竞争。目前尚不清楚这一产品是独立的还是作为ChatGPT的一部分。随着Copilot在Bing上的加入、Perplexity等新进公司的涌现以及谷歌的Gemini Copilot,搜索领域的竞争正...
Read MoreMistral AI推出了一款名为Mistral Large的新型语言大模型,以与GPT-4和Claude 2等顶级模型竞争。该公司还推出了一项名为Le Chat的新服务,以与ChatGPT竞争。通过该公司的API,访问Mistral Large的成本为每百万输入令...
Read MoreMMedLM 2是一种开创性的多语言语言模型,专为医学领域量身定制。它是在覆盖六种语言的新的255亿令牌语料库上训练的。在医学问答任务中,MMedLM 2的表现优于其他模型,包括GPT-4。
Read MorePhind的70B代码模型在人类评估中获得83%的高分,与GPT-4表现相当。关键是它拥有显著较少的慵懒回应和拒绝。34B模型即将发布,更大的70B模型也将在未来发布。
Read More