语言模型的相关内容 - 漫话开发者

2025-10-23 talkingdev

OutSystems推出Agent Workbench：用低代码平台构建可交付的关键任务AI智能体

低代码开发平台领导者OutSystems近日发布AI智能体工作台（Agent Workbench），为企业提供构建可部署生产环境的关键任务型AI智能体的统一平台。该平台通过可视化拖拽界面实现多智能体工作流编排，支持与企业内部数据...

2025-10-22 talkingdev

OpenAI正式推出创新浏览器产品ChatGPT Atlas，标志着人工智能与网页浏览的深度融合迈出关键一步。该浏览器通过内置ChatGPT侧边栏，实现了对任意网页内容的即时智能交互：用户可一键获取文章摘要、进行多维度数据解析...

2025-10-22 talkingdev

最新行业观察指出，尽管AI辅助编程技术展现出令人瞩目的代码生成能力，但其可能正在解决软件开发领域的错误命题。基于大语言模型的AI编码工具受限于训练数据分布，往往倾向于重复生成现有代码库中的模式，未能真正推...

2025-10-22 talkingdev

随着大型语言模型和人工智能技术的迅猛发展，编程行业正面临根本性的身份认同危机。传统程序员作为工匠的核心价值——创造性解决问题和系统架构设计能力，正被“氛围编程”和“规范工程”等新型工作模式逐渐消解。这种转变...

2025-10-21 talkingdev

DeepSeek-AI团队最新开源的DeepSeek-OCR项目在长上下文压缩技术领域实现重要突破。该项目通过创新的光学二维映射技术，探索将长文本上下文进行高效压缩的可行性。系统由DeepEncoder核心引擎和DeepSeek3B-Moe-A570M解...

2025-10-21 talkingdev

近日，谷歌DeepMind团队发布的Gemini Diffusion实验性语言模型引发学界关注。该模型突破传统GPT逐词生成范式，采用扩散模型技术通过逐步去噪的方式直接生成完整文本块。研究人员在研读《大语言扩散模型》论文时发现...

2025-10-20 talkingdev

阿里云最新推出的Aegaeon GPU池化技术系统在AI算力领域实现重大突破，通过创新的资源调度机制将大模型推理所需的英伟达GPU数量从1192片缩减至213片，降幅达82%。该系统目前已在阿里云模型市场完成beta测试，其核心技...

2025-10-17 talkingdev

斯坦福大学研究人员提出的递归语言模型（RLMs）实现了突破性的推理架构创新。该模型通过REPL环境将输入上下文分解为可交互变量，实现了对无限长上下文的递归处理。在OOLONG基准测试中，基于GPT-5-mini构建的RLMs模型...