近期发表于arXiv的研究ThinkLite-VL通过创新性地应用蒙特卡洛树搜索(MCTS)技术量化样本难度,在视觉语言模型(VLM)领域取得突破性进展。该方法仅需11,000个训练样本即可显著提升模型推理能力,且无需依赖知识蒸馏...
Read MoreInteractVLM作为新一代视觉语言模型(VLM),实现了从2D到3D的交互推理跨越。该模型通过创新性地利用强大的基础模型,结合多视角渲染技术,将2D推理能力提升至3D空间,能够精准分析人类与物体在三维环境中的接触关系。...
Read More近日,一项创新性技术方案引发开发者社区关注:通过单一SQLite数据库表与少量cron定时任务即可构建完全可定制的AI助手系统。该方案突破传统AI agent复杂的架构设计,仅需基础组件即可实现对话记忆、任务调度等核心功...
Read More近日,DeepSeek宣布将逐步推进其推理引擎的开源计划,这一举措旨在推动AI技术的普及与创新。DeepSeek推理引擎以其高效的模型推理能力和低延迟特性,在业界广受关注。开源后,开发者将能够自由访问和优化该引擎,进一...
Read MoreOpenAI正在准备发布GPT-4.1及其o3推理模型的完整版本。GPT-4.1是对GPT-4o的重新设计版本,并计划推出更小尺寸的mini和nano版本。尽管OpenAI目前尚未实现盈利,但其当前估值已达到3000亿美元。上个月,ChatGPT成为应...
Read More历经38年研发的知识表示系统Cyc项目近日正式终止,标志着人工智能发展史上一个重要篇章的完结。由Douglas Lenat于1984年创立的Cyc项目,旨在通过人工编码的常识知识库实现机器推理能力,其知识库最终包含超过2500万...
Read More谷歌宣布其新一代多模态大模型Gemini 2.5 Pro正式进入公测阶段,开发者现可通过Google AI Studio的Gemini API进行体验,而企业级平台Vertex AI的支持也即将上线。作为Gemini系列的最强版本,2.5 Pro在跨模态理解、长...
Read MoreDeepSeek最新研究论文《Inference-Time Scaling for Generalist Reward Modeling》提出了一种创新方法,通过推理时缩放技术优化奖励模型,从而引导更强大的推理模型生成。该技术标志着这家中国初创公司的一项战略布...
Read More