漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-09-11 talkingdev

利用Google Cloud TPUs调优LLaMa3.1的创新方案

在技术社区中,近日有开发者分享了利用Google Cloud TPUs对LLaMa3.1进行调优的经验和方法。这一过程不仅展示了TPUs在处理大型模型时的卓越性能,还强调了调优过程中的一些关键技术细节。调优LLaMa3.1的过程中,开发...

Read More
2024-07-10 talkingdev

论文:将系统2精炼为系统1:COT新思维链模型提升计算和推理效率

系统2模型是一种使用类似于思维链的方法,通过更多的测试时间计算来提升推理的模型。最新的研究发现,我们可以将这种行为提炼为一个系统1模型,使其运行速度更快,而准确性相似。系统1模型的主要优势在于其高效的运...

Read More
2024-06-24 talkingdev

OpenAI GPT-5推迟至2025年发布,将具备博士学位水平能力

OpenAI的下一代人工智能模型GPT-5预计将比当前的GPT-4更加智能。据透露,该模型的发布尚需至少一年半的时间。GPT-5将具备先进的记忆和推理能力,部分任务的处理智能将达到博士学位水平。OpenAI首席技术官Mira Murati...

Read More
2024-04-16 talkingdev

OpenAI与Meta计划推出具备更强推理能力的新AI模型

据报道,OpenAI和Meta正在准备推出新一代的人工智能模型,预计将具备更强的推理和规划能力。这些模型被称为GPT-5和Llama 3,目的是向人工通用智能迈进。然而,具体的发布时间线和应用细节尚不明确。鉴于过去AI领域过...

Read More
2024-04-12 talkingdev

Mistral推出新型8x22B模型,性能卓越

Mistral公司近日发布了一款新型的8x22B模型,并通过磁力链接供用户下载体验。根据社区首批基准测试结果显示,该模型作为基础模型表现突出,其77 MMLU(与推理能力密切相关的指标)得分令人瞩目。这一新模型的出现,...

Read More
2024-04-09 talkingdev

神经网络局限性阻碍通用人工智能发展

当前神经网络在超出其训练数据的情况下泛化能力有限,这限制了它们的推理和可靠性。为了实现人工通用智能(AGI),我们需要寻找替代方法。专家认为,尽管深度学习和神经网络在特定任务上取得了显著成就,但它们距离...

Read More
2024-04-01 talkingdev

xAI发布新一代模型Grok 1.5,提升编程与检索能力

人工智能公司xAI近日宣布推出其最新模型Grok 1.5,该模型具有128k的上下文长度,能够更好地理解复杂的问题并提供准确的回答。Grok 1.5的推理能力得到了显著提升,尤其在信息检索和编程领域表现出色。这使得开发者和...

Read More
2024-03-28 talkingdev

英伟达GPU在MLPerf推理测试中夺魁

近日,英伟达的GPU在MLPerf推理测试中取得了优异的成绩,尤其是H200型号。MLPerf推理测试是业界公认的深度学习性能评估基准,对AI系统的推理能力进行全方位评测。在此次测试中,英伟达的GPU展现了其在处理复杂机器学...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page