漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-10 talkingdev

实践教程:探索Gemma 3n与MatFormer的弹性推理能力

Google最新发布的Gemma 3n和MatFormer模型采用了创新的嵌套Transformer架构,通过Mix-n-Match技术实现弹性推理功能。该技术允许模型在运行时动态调整计算资源分配,显著提升推理效率并降低计算成本。本实践教程详细...

Read More
2025-07-09 talkingdev

Hugging Face发布SmolLM3:小型多语言长上下文推理模型

Hugging Face最新推出的SmolLM3是一款完全开源的3B参数语言模型,支持六种语言,具备强大的推理能力和长上下文处理能力。该模型旨在小型模型领域实现高性能,为多语言处理和复杂推理任务提供了新的解决方案。SmolLM3...

Read More
2025-07-04 talkingdev

李飞飞:空间智能将成为AI领域的下一个前沿方向[视频]

斯坦福大学教授、AI领域权威专家李飞飞在最新演讲中指出,空间智能(Spatial Intelligence)是人工智能发展的下一个关键突破口。这段发布在YouTube的演讲视频(观看量已超26万)引发了技术社区的广泛讨论,Hacker Ne...

Read More
2025-07-03 talkingdev

Gemini 2.5模型为机器人技术与具身智能带来突破性进展

谷歌最新发布的Gemini 2.5模型在机器人技术和具身智能领域实现了重要突破。该模型通过增强的编码能力、推理能力和多模态处理能力,特别是基于空间理解的技术创新,为开发者提供了强大的工具。开发者可利用Gemini 2.5...

Read More
2025-06-28 talkingdev

[开源] SymbolicAI:从神经符号视角探索大语言模型的组合式可微分编程库

ExtensityAI团队在GitHub开源了SymbolicAI项目,这是一个基于神经符号系统(Neuro-Symbolic)架构设计的组合式可微分编程库,旨在为大语言模型(LLMs)提供结构化推理能力。该项目通过将符号逻辑与神经网络梯度优化...

Read More
2025-06-27 talkingdev

Meta挖角OpenAI强化学习先驱,加速超级智能研发

据最新报道,Meta已秘密招募OpenAI前强化学习专家Trapit Bansal加入其新成立的AI超级智能部门。这一动作虽未获官方确认,但业内人士分析指出,Bansal的加盟将显著提升Meta在前沿推理模型领域的研发能力。作为深度强...

Read More
2025-06-24 talkingdev

小模型逆袭!7B参数模型通过强化学习教师机制超越671B大模型

一项突破性研究展示了小模型通过创新训练方法战胜巨型模型的可能。日本Sakana.AI团队开发的"教师模型"采用全新范式——这些模型不需要自行解决问题,而是被直接提供问题和正确答案,专注于生成清晰易懂的解决方案解释...

Read More
2025-06-20 talkingdev

语言模型推理经济学:为何当前扩展方法遭遇瓶颈

首份关于大语言模型(LLM)服务经济学的综合模型揭示,随着AI公司竞相部署高token消耗的推理模型和智能体,当前扩展推理能力的方法比预期更快遭遇瓶颈。研究发现,网络延迟而非带宽成为主要瓶颈,阻碍了公司通过简单...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page