大语言模型的相关内容 - 漫话开发者

2025-10-23 talkingdev

OutSystems推出Agent Workbench：用低代码平台构建可交付的关键任务AI智能体

低代码开发平台领导者OutSystems近日发布AI智能体工作台（Agent Workbench），为企业提供构建可部署生产环境的关键任务型AI智能体的统一平台。该平台通过可视化拖拽界面实现多智能体工作流编排，支持与企业内部数据...

2025-10-22 talkingdev

OpenAI正式推出创新浏览器产品ChatGPT Atlas，标志着人工智能与网页浏览的深度融合迈出关键一步。该浏览器通过内置ChatGPT侧边栏，实现了对任意网页内容的即时智能交互：用户可一键获取文章摘要、进行多维度数据解析...

2025-10-22 talkingdev

最新行业观察指出，尽管AI辅助编程技术展现出令人瞩目的代码生成能力，但其可能正在解决软件开发领域的错误命题。基于大语言模型的AI编码工具受限于训练数据分布，往往倾向于重复生成现有代码库中的模式，未能真正推...

2025-10-21 talkingdev

DeepSeek-AI团队最新开源的DeepSeek-OCR项目在长上下文压缩技术领域实现重要突破。该项目通过创新的光学二维映射技术，探索将长文本上下文进行高效压缩的可行性。系统由DeepEncoder核心引擎和DeepSeek3B-Moe-A570M解...

2025-10-21 talkingdev

近日，谷歌DeepMind团队发布的Gemini Diffusion实验性语言模型引发学界关注。该模型突破传统GPT逐词生成范式，采用扩散模型技术通过逐步去噪的方式直接生成完整文本块。研究人员在研读《大语言扩散模型》论文时发现...

2025-10-17 talkingdev

斯坦福大学研究人员提出的递归语言模型（RLMs）实现了突破性的推理架构创新。该模型通过REPL环境将输入上下文分解为可交互变量，实现了对无限长上下文的递归处理。在OOLONG基准测试中，基于GPT-5-mini构建的RLMs模型...

2025-10-17 talkingdev

来自大规模实验的研究团队发布了名为ScaleRL的创新框架，这是首个针对大型语言模型强化学习计算扩展的系统性研究方法。该研究通过超过40万GPU小时的实验数据，构建了可预测的S型计算-性能曲线，揭示了RL训练中算法改...

2025-10-14 talkingdev

最新研究表明，新一代大语言模型在字符级文本处理任务上取得显著突破。相比早期版本，GPT-5和Claude Sonnet 4.5等模型在字符计数、字符替换、密码解码等需要精细化文本操作的任务中表现出色。这一进步表明模型正在从...