漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-28 talkingdev

GPT-5.5系统卡发布:性能逼近Claude Opus,事实查询与任务执行成亮点

OpenAI最新发布的GPT-5.5模型系统卡(System Card)揭示了其性能表现与安全评估结果。这份详尽的报告显示,GPT-5.5在多项基准测试中表现出色,尤其在事实性查询、网络搜索和结构化任务执行上,已能与业界顶尖模型Cla...

Read More
2026-04-28 talkingdev

Talkie:一款源自1930年的13B参数“复古”语言模型引发热议

近期,一款名为Talkie的语言模型在技术社区引起了广泛关注。值得注意的是,该模型并非诞生于当前大模型竞赛的浪潮中,而是宣称其设计理念和数据源自1930年代的文献与知识体系,拥有13B参数。这一独特的“时间胶囊”式...

Read More
2026-04-24 talkingdev

OpenAI发布GPT-5.5:更智能、更高效,专为复杂任务打造

OpenAI宣布推出其最新一代大语言模型GPT-5.5,号称是目前最智能的版本。该模型在推理能力、工具调用效率和多任务处理性能上均实现了显著提升。尽管保持了与前代模型相当的响应延迟,GPT-5.5在编程、知识检索和数据分...

Read More
2026-04-23 talkingdev

上下文是软件,权重是硬件:AI学习的核心差异比你想象的更重要

在大型语言模型领域,一种新的视角正在引发讨论:将上下文视为“软件”,而将权重视为“硬件”。这种比喻揭示了模型运作的本质差异。上下文(如KV缓存)动态地调节模型的激活值,为特定任务提供临时性的“编程”,从而实现...

Read More
2026-04-23 talkingdev

开源|Broccoli:用Claude和Codex将Linear工单自动转化为GitHub PR,数据安全跑在你的Google Cloud上

Broccoli 是一个新颖的开源工具,旨在通过AI代理(包括Claude和Codex)自动化软件开发中的工程工作流。其核心功能是可以直接将Linear项目管理工具中的工单(Tickets)自动转化为GitHub上的拉取请求(Pull Requests)...

Read More
2026-04-21 talkingdev

通义千问Qwen3.6-Max-Preview发布:世界知识更强,代码能力大幅进化

阿里云旗下通义千问团队近日发布了其大型语言模型的最新预览版本——Qwen3.6-Max-Preview。该版本在多个核心能力上实现了显著提升,尤其是在世界知识的掌握与指令遵循的准确性方面表现突出。更为关键的是,模型在广泛...

Read More
2026-04-21 talkingdev

月之暗面发布Kimi K2.6系列模型,宣称多项基准超越GPT-5.4与Claude Opus

中国人工智能公司月之暗面(Moonshot AI)近日正式推出其新一代大模型系列Kimi K2.6,并已在Kimi Chat对话平台及API接口上线。该系列模型的核心突破在于强化了长上下文编程能力与智能体(Agent)执行支持,旨在为开...

Read More
2026-04-20 talkingdev

独家揭秘:Anthropic发布Claude Opus 4.7,系统提示词更新细节曝光

在人工智能领域,系统提示词(System Prompt)是塑造大型语言模型行为与输出的核心指令,通常被各大AI实验室视为高度机密。然而,Anthropic公司却独树一帜,成为唯一一家持续公开其面向用户的聊天系统(如Claude)完...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page