漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-28 talkingdev

法国AI初创公司Mistral宣布推出新API模型并与Azure合作

法国AI初创公司Mistral宣布推出新的API模型,并与Azure达成合作。Mistral Large在多语言任务方面表现出色,在MMLU上仅比GPT-4差了几个百分点,性能强大。该初创公司还在其API中添加了一个新的mistral-small模型。

Read More
2024-02-27 talkingdev

Sam Altman呼吁提供7万亿美元支持人工智能发展

Sam Altman提出的7万亿美元的要求旨在支持推进GPT等生成式AI模型的成本迅速上升,这表明未来迭代的资源需求呈指数增长。这一雄心壮志凸显了人工智能发展的关键时刻,需要平衡快速技术进步和快速推进对安全和社会准备...

Read More
2024-02-27 talkingdev

OpenCodeInterpreter模型接近GPT-4的代码性能

OpenCodeInterpreter模型基于CodeLlama和DeepSeek Coder,通过训练合成多轮数据集和使用人类反馈,能够在编程HumanEval基准测试中获得85%以上的准确率。

Read More
2024-02-27 talkingdev

论文:简单的强化学习算法战胜PPO

REINFORCE是一种简单、标准且易于理解的强化学习方法。然而,在模拟器中使用它很难稳定地进行训练。PPO在一般情况下更为高效和稳定。Gemini使用REINFORCE算法,而据信GPT-4使用PPO算法。

Read More
2024-02-27 talkingdev

OpenAI挑战谷歌搜索?竞争激烈!

OpenAI正在研发一个网络搜索引擎,直接与谷歌展开竞争。目前尚不清楚这一产品是独立的还是作为ChatGPT的一部分。随着Copilot在Bing上的加入、Perplexity等新进公司的涌现以及谷歌的Gemini Copilot,搜索领域的竞争正...

Read More
2024-02-27 talkingdev

Mistral AI发布新模型,与GPT-4和自己的聊天助手竞争

Mistral AI推出了一款名为Mistral Large的新型语言大模型,以与GPT-4和Claude 2等顶级模型竞争。该公司还推出了一项名为Le Chat的新服务,以与ChatGPT竞争。通过该公司的API,访问Mistral Large的成本为每百万输入令...

Read More
2024-02-26 talkingdev

MMedLM-医学领域新突破,多语种医学语言模型

MMedLM 2是一种开创性的多语言语言模型,专为医学领域量身定制。它是在覆盖六种语言的新的255亿令牌语料库上训练的。在医学问答任务中,MMedLM 2的表现优于其他模型,包括GPT-4。

Read More
2024-02-26 talkingdev

Phind 70B Code Model表现卓越,人类评估得分83%

Phind的70B代码模型在人类评估中获得83%的高分,与GPT-4表现相当。关键是它拥有显著较少的慵懒回应和拒绝。34B模型即将发布,更大的70B模型也将在未来发布。

Read More
  1. Prev Page
  2. 37
  3. 38
  4. 39
  5. Next Page