自动化的相关内容 - 漫话开发者

2026-01-05 talkingdev

开源|Agentic Coding Flywheel Setup：30分钟将全新VPS武装为AI驱动的智能编码环境

近日，GitHub上开源了一个名为‘Agentic Coding Flywheel Setup’（ACFS）的系统工具，旨在为希望获得智能体工程能力的初学者和团队提供一站式解决方案。该工具的核心价值在于，能够在大约30分钟内，将一个全新的Ubunt...

2025-12-24 talkingdev

近日，GitHub上开源了一个名为Stirrup的新型轻量级框架，专为构建高级智能体（Agent）而设计。该框架的核心创新在于其“模型自主决策”理念：不同于传统框架严格规定执行流程，Stirrup允许AI模型根据任务情境，自行选...

2025-12-24 talkingdev

近日，一款名为X-ray的Python开源工具在技术社区引发关注。该项目由freelawproject开发，核心功能是自动检测PDF文档中是否存在“无效涂黑”问题。所谓“无效涂黑”，是指文档编辑者试图通过黑色矩形块遮盖敏感信息，但因...

2025-12-22 talkingdev

人工智能领域知名专家安德烈·卡帕西（Andrej Karpathy）近期发布了其对2025年大语言模型（LLM）发展的年度回顾，系统性地梳理了行业在过去一年中经历的深刻范式转变。报告指出，技术演进的核心驱动力已从单纯追求模...

2025-12-22 talkingdev

Anthropic近日开源了名为Bloom的工具，这是一个专门用于对AI模型进行自动化行为评估的开源解决方案。该工具通过创建特定场景并量化不同模型中的行为发生率，能够系统性地评估如自我偏好偏见、蓄意破坏等具体行为模式...

2025-12-21 talkingdev

人工智能模型评估机构METR发布的最新数据显示，Anthropic公司推出的Claude Opus 4.5大型语言模型在任务处理时效性上取得了显著突破。根据METR的评估框架，Claude Opus 4.5的“50%任务完成时间视界”约为4小时49分钟，...

2025-12-21 talkingdev

人工智能公司Anthropic近日正式发布了“Claude in Chrome”浏览器扩展，标志着其旗舰AI助手Claude进一步向日常生产力工具渗透。该扩展允许用户直接在Chrome浏览器中调用Claude的对话与推理能力，实现实时问答、网页内...

2025-12-20 talkingdev

据TechCrunch报道，由前Splunk高管创立的初创公司Resolve AI，已成功完成A轮融资。此轮融资引人注目的亮点在于其采用了多层级估值方案，其中最高估值层级达到了10亿美元。Resolve AI的核心产品是一款旨在实现自主化...