大模型应用的相关内容 - 漫话开发者

2026-02-12 talkingdev

智谱发布GLM-5：7540亿参数开源巨兽，引领智能体工程新范式

智谱AI正式发布了其新一代开源大模型GLM-5，该模型以MIT许可证开源，参数量达到惊人的7540亿，是前代GLM-4.7（3680亿参数）规模的两倍以上。在技术性能上，GLM-5在广泛的学术基准测试中相比GLM-4.7实现了显著提升，...

2026-01-28 talkingdev

近日，月之暗面（Moonshot AI）在GitHub上正式开源了Kimi Agent SDK，为开发者提供了与Kimi CLI进行程序化交互的官方接口。该SDK是一套多语言库，旨在将Kimi Code智能体运行时能力暴露给应用程序，使开发者能够基于...

2026-01-26 talkingdev

近日，一个名为TTT-Discover的开源项目在GitHub上发布，其核心创新在于将强化学习（Reinforcement Learning）技术应用于大型语言模型（LLMs）的推理（Inference）阶段，而非传统的训练阶段。这一“测试时训练”（Test-...

2026-01-15 talkingdev

Anthropic公司近期为其Claude Code开发工具推出了一项名为“MCP工具搜索”的重要功能更新。该功能的核心创新在于，它允许Claude Code根据实际需求，动态地将模型上下文协议工具加载到工作上下文中，而非传统的一次性全...

2025-12-30 talkingdev

近日，一个名为Crawl4AI的开源项目在GitHub上发布，旨在为大型语言模型（LLM）提供友好、高效的网页抓取与内容解析解决方案。该项目由开发者unclecode主导，其核心目标是简化从复杂网页中提取结构化信息的流程，并将...

2025-12-25 talkingdev

近日，一个名为Crawl4AI的开源项目在GitHub上发布，旨在为大型语言模型（LLM）提供友好的网络爬虫与数据抓取解决方案。该项目由开发者unclecode主导，其核心目标是简化从网页中提取结构化信息的过程，并将这些数据高...

2025-10-24 talkingdev

谷歌Angular团队正式开源Web Codegen Scorer工具，专门用于评估大语言模型生成的网页代码质量。该工具通过构建成功率、安全漏洞检测、编码规范遵循等核心维度，对LLM生成的HTML/CSS/JavaScript代码进行量化评分。开...

2025-10-06 talkingdev

思维机器实验室最新研究揭示了低秩适配技术（LoRA）在大语言模型微调领域的突破性表现。这项发表于权威平台的研究表明，当LoRA应用于模型所有层（尤其是MLP层）且不受数据集规模限制时，其性能可完全媲美传统全参数...