艾伦人工智能研究所(AI2)近日推出OLMo 2全开源语言模型家族,标志着大模型开源生态取得重大突破。该系列包含32B、13B、7B和1B四种参数规模,其中旗舰型号OLMo 2 32B成为首个在主流基准测试中同时超越GPT-3.5 Turbo...
Read More德国知名技术咨询公司TNG Technology Consulting GmbH近日发布了其最新研发的DeepSeek-TNG R1T2 Chimera模型。这一突破性进展在人工智能领域引起广泛关注,该模型不仅显著提升了处理速度达200%,同时大幅减少了输出t...
Read More斯坦福大学教授、AI领域权威专家李飞飞在最新演讲中指出,空间智能(Spatial Intelligence)是人工智能发展的下一个关键突破口。这段发布在YouTube的演讲视频(观看量已超26万)引发了技术社区的广泛讨论,Hacker Ne...
Read More华为宣布将开源其PanguAI系列中的两个核心模型及部分推理技术,这一战略举措旨在推动全球人工智能技术的普及与应用。作为中国AI领域的领军企业,华为此次开源不仅展示了其在自然语言处理和多模态AI领域的技术积累,...
Read MoreSentence Transformers最新升级引入对稀疏嵌入模型训练的支持,这一技术突破特别适用于混合搜索和重排序场景。该博客详细解析了模型的核心组件与训练步骤,并重点介绍了基于SPLADE架构的现成模型。稀疏编码技术通过...
Read MoreTauricResearch团队在GitHub上开源了TradingAgents项目,这是一个基于多智能体大语言模型(LLM)的金融交易框架。该框架通过结合多个智能体的协同决策能力,旨在提升金融交易的智能化水平和决策效率。TradingAgents...
Read More近日,一项名为ContinualFlow的创新技术为生成模型领域带来突破性进展。该技术通过流向能量重加权目标的匹配方法,直接从模型分布中剔除不需要的区域,从而避免了传统方法所需的完整模型重新训练过程。这一技术的核...
Read More最新技术分析指出,当前自然语言处理中的分词技术(Tokenization)存在显著局限性,亟需被能够更好利用计算资源和数据的一般性方法所取代。本文深入剖析了分词技术的核心作用及其脆弱性,系统论证了淘汰该技术的必要性...
Read More