漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-26 talkingdev

开源|TTT-Discover:推理时强化学习新范式,让大模型实时自适应任务

近日,一个名为TTT-Discover的开源项目在GitHub上发布,其核心创新在于将强化学习(Reinforcement Learning)技术应用于大型语言模型(LLMs)的推理(Inference)阶段,而非传统的训练阶段。这一“测试时训练”(Test-...

Read More
2026-01-01 talkingdev

开源|Ensue Memory Network:为LLM构建持久化知识树,终结对话“重置”难题

近日,GitHub上开源项目Ensue Memory Network引发人工智能领域开发者关注。该项目旨在为大型语言模型(LLM)提供一个持久化且可不断生长的“知识树”系统,从根本上解决当前LLM在每次新对话中“重置”上下文、无法积累长...

Read More
2025-12-26 talkingdev

专访公民实验室创始人罗纳德·戴伯特:美国如何效仿威权数字监控,以及二十年网络威胁追踪的启示

《麻省理工科技评论》近日对多伦多大学公民实验室创始人罗纳德·戴伯特进行了深度专访。在过去的二十年里,戴伯特及其领导的公民实验室研究团队,一直致力于揭露全球范围内日益严峻的数字威胁与监控技术滥用。访谈核...

Read More
2025-12-23 talkingdev

智谱AI发布GLM-4.7:新一代开源编码模型刷新SOTA,推理与多模态能力全面升级

近日,智谱AI正式发布了其通用语言模型系列的最新力作——GLM-4.7。作为一款高端基础模型,GLM-4.7的核心定位在于处理复杂的推理任务、专业级代码生成以及多模态工作负载。相较于前代版本,此次更新在多个维度实现了显...

Read More
2025-12-21 talkingdev

评估报告:Claude Opus 4.5任务处理“半衰期”达4小时49分,性能较前代翻倍

人工智能模型评估机构METR发布的最新数据显示,Anthropic公司推出的Claude Opus 4.5大型语言模型在任务处理时效性上取得了显著突破。根据METR的评估框架,Claude Opus 4.5的“50%任务完成时间视界”约为4小时49分钟,...

Read More
2025-12-12 talkingdev

OpenAI发布GPT-5.2:专为专业工作与长期智能体设计的顶尖前沿模型

人工智能研究机构OpenAI正式发布了其最新的前沿模型GPT-5.2,该模型被定位为专为专业知识工作和长期运行的智能体(agents)而设计的最先进系统。根据官方介绍,GPT-5.2在多个关键领域树立了新的性能标杆,包括代码生...

Read More
2025-12-12 talkingdev

谷歌发布Gemini深度研究交互API,AI代理自主驾驭复杂信息搜索

谷歌近日正式向开发者开放了其强大的Gemini深度研究(Gemini Deep Research)功能,通过全新的交互API(Interactions API)提供服务。这一举措标志着AI在复杂信息处理与综合能力方面迈出了重要一步。Gemini深度研究...

Read More
2025-12-12 talkingdev

OpenAI发布GPT-5.2:专为专业工作与长期智能体优化的前沿模型

OpenAI正式推出其新一代前沿模型GPT-5.2,该模型被定位为专为专业工作场景和长期运行的智能体(agent)工作流而优化的最先进模型。相较于前代,GPT-5.2在多个关键维度实现了显著提升:其一,在知识工作领域,模型展...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page