大语言模型的相关内容 - 漫话开发者

2026-06-18 talkingdev

大模型输出不稳定？WorkOS用评估系统（evals）解决AI代码生成不一致难题

在AI辅助编程日益普及的今天，一个令人头疼的问题浮出水面：相同的输入和提示词，却总能得到不同的输出结果。这种不确定性严重阻碍了AI代理（Agent）在代码编写中的可靠性。知名身份认证平台WorkOS的工程师Nick Nisi...

2026-06-15 talkingdev

近日，巴西里约热内卢市政府下属机构IplanRIO发布的“自研”大语言模型Rio-3.5-Open-397B陷入争议。GitHub社区及技术专家发现，该模型并非如其宣传所言“完全原创”，其权重实际上是通过对现有模型——Nex-AGI团队的Nex-N2...

2026-06-14 talkingdev

美国政府针对人工智能公司Anthropic的最新出口管制措施，在印度引发了新一轮关于其AI发展路径的辩论。这一事件的核心在于，印度日益增长的AI雄心正越来越依赖于美国研发和监管的技术。Anthropic在接到美国政府指令后...

2026-06-14 talkingdev

智谱AI（Zhipu AI）联合创始人兼CEO张鹏（jietang）在社交媒体X上正式宣布，GLM系列最新大语言模型GLM 5.2现已完全开源。这一举动在AI社区引发广泛关注。张鹏在声明中强调，当前某些前沿模型突然因非技术原因被限制...

2026-06-13 talkingdev

知名人工智能公司Anthropic近日发布声明称，已按照美国政府基于国家安全授权发布的出口管制指令，全面停止向所有客户提供其大语言模型Fable 5和Mythos 5的访问权限。这意味着这两款在AI领域引发广泛关注的前沿模型将...

2026-06-13 talkingdev

人工智能初创公司 Anthropic 近日遭遇了一场波及全球的技术出口管制风波。据路透社报道，美国政府已下令 Anthropic 暂停所有外国公民对其最新旗舰大语言模型 Mythos 5 和 Fable 5 的访问权限。Anthropic 在周五迅速...

2026-06-12 talkingdev

近日，一位独立开发者分享了一项极具工程教育意义的项目：从零开始构建一个“复古风格”的大语言模型（LLM）。项目不仅涵盖了基础训练与微调脚本的自主编写，还包括完整的数据处理管线以及定制数据集的构建。令人瞩目...

2026-06-08 talkingdev

阿里巴巴近日在GitHub上开源了一款名为Open Code Review的AI驱动代码审查工具，引发了开发者社区的广泛关注。该工具的核心突破在于其独特的“混合架构”：它并非单纯依赖大语言模型（LLM）的生成能力，而是将确定性的...