近日,GitHub上开源项目last30days-skill引发科技界广泛关注。该项目是一个AI智能体技能,能够针对用户指定的任何主题,自动在Reddit、X(原Twitter)、YouTube、Hacker News、Polymarket以及整个开放网络中进行实时...
Read More百度近期在GitHub上开源了其企业级视觉语言模型系列——千帆VL(Qianfan-VL)。该系列模型并非通用型多模态模型的简单变体,而是针对工业场景进行了深度优化和增强的专用模型。其核心设计目标是解决企业级应用中的实际...
Read More人工智能公司Anthropic正式宣布,其旗舰模型Claude Opus 4.6和Sonnet 4.6现已全面开放100万上下文窗口的常规使用。此次更新的核心在于,标准定价将适用于完整的100万token上下文窗口,彻底取消了此前针对长上下文的...
Read More谷歌近日正式推出了其新一代多模态嵌入模型Gemini Embedding 2,标志着人工智能在跨模态语义理解领域迈出了关键一步。该模型通过Gemini API和Vertex AI平台提供服务,其核心突破在于首次将文本、图像、视频、音频及...
Read More微软近日发布了Phi-4-reasoning-vision-15B,这是一款开源的、权重开放的多模态视觉AI模型。该模型仅包含150亿参数,却在数学、科学、文档及用户界面(UI)推理任务上,达到了与参数量大数倍的模型相当甚至更优的性...
Read More近日,通义千问团队在Hugging Face平台正式发布了Qwen3.5-35B-A3B模型。该模型集成了当前人工智能领域的多项前沿技术突破,旨在通过开源方式推动AI技术的民主化与普及。其核心亮点在于原生支持高达262,144个令牌的上...
Read More近日,开发者基于Rust语言重构了OpenClaw助手模式,推出了名为LocalGPT的本地化AI助手项目。该项目在四天内完成开发,编译后仅生成约27MB的单一可执行文件,无需依赖Node.js、Docker或Python环境,体现了轻量级与高...
Read More近日,由zai-org团队在Hugging Face平台开源了GLM-OCR模型,这是一款专为复杂文档理解设计的先进多模态OCR系统。该模型的核心创新在于其精巧的三段式架构:首先,它采用了在大规模图文数据上预训练的CogViT视觉编码...
Read More