近日,GitHub上开源了一个名为Claw-Eval的评估框架,专门用于评估大型语言模型作为智能体的能力。该框架的核心价值在于其构建了一个全面且经过人类验证的基准测试集,涵盖了139项多样化的真实世界任务。与以往许多依...
Read MoreMeta公司近日正式推出了名为Muse Spark的新型多模态推理模型,标志着其在追求个人超级智能(Personal Superintelligence)的道路上迈出了关键一步。该模型集成了三大前沿技术能力:工具使用、视觉思维链以及多智能体...
Read More近日,一个名为Clicky的开源项目在GitHub上发布,为macOS用户带来了一种新颖的人机交互体验。该项目本质上是一个运行在光标侧的AI“教师”或“伙伴”,能够实时“看到”用户屏幕内容,并通过语音与用户交流,甚至能直接“指...
Read More近日,GitHub上开源了一个名为TriAttention的项目,其核心是一种创新的KV(键值)缓存压缩技术。该技术旨在解决大语言模型在处理长上下文任务时,因KV缓存占用内存巨大而难以在消费级或内存受限的GPU上高效部署的行...
Read More在人工智能技术深刻重塑网络安全格局的当下,一项名为“Project Glasswing”(玻璃翼项目)的重大倡议正式启动,旨在为全球最关键软件提供安全保障,并为防御方在即将到来的AI驱动安全时代建立持久优势。该项目的核心...
Read More近日,一个名为Hippo Memory的开源项目在GitHub上发布,旨在为AI智能体构建一个受生物学启发的记忆系统,以解决其在长期交互中遗忘关键上下文信息的核心难题。该项目灵感来源于人类大脑中的海马体,通过模拟记忆衰减...
Read More近日,一款名为Defuddle的开源工具在GitHub上发布,旨在解决网页信息过载的痛点。该工具能够智能识别并剥离网页中的侧边栏、广告、导航菜单等干扰性元素,精准提取出文章或页面的核心正文内容,并将其转换为结构清晰...
Read More近期,软件开发者社区中出现了一种被称为“氛围编程”的实践模式,其核心是开发者仅凭对代码的“感觉”或AI生成结果进行工作,而避免深入审查源代码。这种模式虽然看似提升了初期开发速度,但实质上是一种危险的选择,它...
Read More