Hugging Face最新推出的SmolLM3是一款完全开源的3B参数语言模型,支持六种语言,具备强大的推理能力和长上下文处理能力。该模型旨在小型模型领域实现高性能,为多语言处理和复杂推理任务提供了新的解决方案。SmolLM3...
Read More艾伦人工智能研究所(AI2)近日推出OLMo 2全开源语言模型家族,标志着大模型开源生态取得重大突破。该系列包含32B、13B、7B和1B四种参数规模,其中旗舰型号OLMo 2 32B成为首个在主流基准测试中同时超越GPT-3.5 Turbo...
Read More德国知名技术咨询公司TNG Technology Consulting GmbH近日发布了其最新研发的DeepSeek-TNG R1T2 Chimera模型。这一突破性进展在人工智能领域引起广泛关注,该模型不仅显著提升了处理速度达200%,同时大幅减少了输出t...
Read More斯坦福大学教授、AI领域权威专家李飞飞在最新演讲中指出,空间智能(Spatial Intelligence)是人工智能发展的下一个关键突破口。这段发布在YouTube的演讲视频(观看量已超26万)引发了技术社区的广泛讨论,Hacker Ne...
Read More华为宣布将开源其PanguAI系列中的两个核心模型及部分推理技术,这一战略举措旨在推动全球人工智能技术的普及与应用。作为中国AI领域的领军企业,华为此次开源不仅展示了其在自然语言处理和多模态AI领域的技术积累,...
Read MoreSentence Transformers最新升级引入对稀疏嵌入模型训练的支持,这一技术突破特别适用于混合搜索和重排序场景。该博客详细解析了模型的核心组件与训练步骤,并重点介绍了基于SPLADE架构的现成模型。稀疏编码技术通过...
Read MoreTauricResearch团队在GitHub上开源了TradingAgents项目,这是一个基于多智能体大语言模型(LLM)的金融交易框架。该框架通过结合多个智能体的协同决策能力,旨在提升金融交易的智能化水平和决策效率。TradingAgents...
Read More近日,一项名为ContinualFlow的创新技术为生成模型领域带来突破性进展。该技术通过流向能量重加权目标的匹配方法,直接从模型分布中剔除不需要的区域,从而避免了传统方法所需的完整模型重新训练过程。这一技术的核...
Read More