TeX的相关内容 - 漫话开发者

2026-07-24 talkingdev

哪款AI真的在读取你的网站？Evil Martians 团队实测两月LLM流量，ChatGPT与Claude行为截然相反

近日，开发者服务公司 Evil Martians 在其团队博客公布了为期两个月的服务器端追踪数据，对 web 流量中人类访客与 AI 爬虫的行为差异进行了量化分析。数据显示，AI 代理请求量达到 26.8 万次，远超同期 10.7 万次的...

2026-07-23 talkingdev

自然语言转SQL（Text-to-SQL）被认为是让非技术用户轻松与数据库交互的关键技术，然而现有评测基准大多在干净、规范的数据集上进行，严重脱离企业真实数据仓库的复杂状况。近日公布的新基准Beaver直接源于真实业务数...

2026-07-20 talkingdev

月之暗面（Moonshot AI）在GitHub正式开源了一款名为Kimi Code CLI的终端AI编程工具，它被定位为“下一代智能体的起点”。该工具本质上是一个运行在命令行终端中的AI编程智能体，能够自主阅读和编辑代码、执行Shell命...

2026-07-13 talkingdev

一项针对AI编程工具Claude Code与OpenCode的测评显示，在开始读取用户提示之前，Claude Code的系统级指令和工具定义等前置开销就已达到约33000个Token，而OpenCode仅为7000个Token，前者是后者的4.7倍。这一差异源于...

2026-06-29 talkingdev

近日，一款名为Textbee的开源项目在GitHub上引发了广泛关注。该项目旨在打破传统短信服务的封闭性，通过将普通安卓手机转化为功能完备的SMS网关，为用户提供了一种低成本、高灵活性的短信收发解决方案。Textbee允许...

2026-06-23 talkingdev

在 AI 大模型竞争白热化的当下，开源模型与闭源旗舰的性能差距一直是业界关注的焦点。知名科技评测媒体 Tech Stackups 发布了一项引人注目的对比测试：将智谱开源的大型语言模型 GLM-5.2 与 Anthropic 的顶级闭源模...

2026-06-03 talkingdev

中国AI创企MiniMax近日正式推出了其最新一代的M3大语言模型，并通过API和Token计划向开发者开放。该模型最引人注目的特点之一是拥有高达100万token的超长上下文窗口，并且官方承诺API至少保证提供51.2万个token的处...

2026-05-29 talkingdev

在生产环境中部署基于大语言模型（LLM）的智能体（Agent）时，如何准确评估其在复杂、长上下文任务中的表现一直是个难题。传统LLM评测员（Judge）在处理涉及多步推理、状态验证和动态调整的Agent轨迹时，常出现事实...