语言模型的相关内容 - 漫话开发者

2025-10-28 talkingdev

开源|TOON：专为LLM设计的轻量级数据结构表示法，令牌成本减半

近日，GitHub上开源项目TOON（Token-Oriented Object Notation）引发开发者社区广泛关注。这一由开发者johannschopplich推出的新型数据格式，专为大语言模型（LLM）输入优化设计，通过精简的结构化数据表示方式，显...

2025-10-27 talkingdev

Anthropic研究团队在《Circuits Updates – October 2025》中披露了令人振奋的发现：其大型语言模型Claude的内部神经元展现出跨模态理解能力。实验表明，当模型处理文字“眼睛”时激活的特定神经元，在遇到用@符号排列...

2025-10-26 talkingdev

开发者RohanAdwankar近日开源了基于Rust语言构建的图表工具OxDraw，创新性地将声明式图表生成与交互式编辑能力融合。该工具解决了技术文档创作中的核心痛点：传统代码驱动图表工具（如Mermaid.js）虽能快速生成基础...

2025-10-24 talkingdev

PyTorch团队正式推出颠覆性分布式编程框架PyTorch Monarch，该技术通过创新的‘资源本地化’设计理念，将集群编程体验提升至单机Python开发级别。框架采用网格化资源管理架构，支持在数千个GPU上实现分布式张量计算，...

2025-10-24 talkingdev

谷歌Angular团队正式开源Web Codegen Scorer工具，专门用于评估大语言模型生成的网页代码质量。该工具通过构建成功率、安全漏洞检测、编码规范遵循等核心维度，对LLM生成的HTML/CSS/JavaScript代码进行量化评分。开...

2025-10-24 talkingdev

加州大学伯克利分校研究团队开发的进化编码智能体OpenEvolve，成功将大型语言模型转化为自主代码优化器，在混合专家模型负载平衡任务中取得重大突破。该系统通过模拟自然选择机制，使LLM能够自主探索算法空间，最终...

2025-10-24 talkingdev

Encord公司近期在美国和英国多地推出专属AI技术交流会“AI After Hours”，为开发者社群搭建高质量的线下交流平台。活动聚焦人工智能领域的前沿动态，通过行业专家的闪电演讲、世界级AI领袖的圆桌讨论，促进技术见解的...

2025-10-23 talkingdev

浙江大学团队推出的LightMem开源项目，为大型语言模型智能体提供了一套轻量级记忆增强生成解决方案。该系统通过创新的记忆管理架构，实现了长期记忆的存储、检索和更新功能，显著降低了传统记忆模块的计算开销。技术...