智谱AI正式发布了其新一代开源大模型GLM-5,该模型以MIT许可证开源,参数量达到惊人的7540亿,是前代GLM-4.7(3680亿参数)规模的两倍以上。在技术性能上,GLM-5在广泛的学术基准测试中相比GLM-4.7实现了显著提升,...
Read More近日,月之暗面(Moonshot AI)在GitHub上正式开源了Kimi Agent SDK,为开发者提供了与Kimi CLI进行程序化交互的官方接口。该SDK是一套多语言库,旨在将Kimi Code智能体运行时能力暴露给应用程序,使开发者能够基于...
Read More近日,一个名为TTT-Discover的开源项目在GitHub上发布,其核心创新在于将强化学习(Reinforcement Learning)技术应用于大型语言模型(LLMs)的推理(Inference)阶段,而非传统的训练阶段。这一“测试时训练”(Test-...
Read MoreAnthropic公司近期为其Claude Code开发工具推出了一项名为“MCP工具搜索”的重要功能更新。该功能的核心创新在于,它允许Claude Code根据实际需求,动态地将模型上下文协议工具加载到工作上下文中,而非传统的一次性全...
Read More近日,一个名为Crawl4AI的开源项目在GitHub上发布,旨在为大型语言模型(LLM)提供友好、高效的网页抓取与内容解析解决方案。该项目由开发者unclecode主导,其核心目标是简化从复杂网页中提取结构化信息的流程,并将...
Read More近日,一个名为Crawl4AI的开源项目在GitHub上发布,旨在为大型语言模型(LLM)提供友好的网络爬虫与数据抓取解决方案。该项目由开发者unclecode主导,其核心目标是简化从网页中提取结构化信息的过程,并将这些数据高...
Read More谷歌Angular团队正式开源Web Codegen Scorer工具,专门用于评估大语言模型生成的网页代码质量。该工具通过构建成功率、安全漏洞检测、编码规范遵循等核心维度,对LLM生成的HTML/CSS/JavaScript代码进行量化评分。开...
Read More思维机器实验室最新研究揭示了低秩适配技术(LoRA)在大语言模型微调领域的突破性表现。这项发表于权威平台的研究表明,当LoRA应用于模型所有层(尤其是MLP层)且不受数据集规模限制时,其性能可完全媲美传统全参数...
Read More