AI系统的相关内容 - 漫话开发者

2026-05-06 talkingdev

论文推荐|Google重新定义AI幻觉：从“知识缺陷”转向“不确定性表达”

谷歌最新研究为人工智能领域的“幻觉”问题提供了一个颠覆性的理论框架。该论文指出，大语言模型（LLM）产生幻觉的核心并非传统认知中的“知识缺陷”或信息错误，而是模型在输出时未能有效表达其内在的不确定性。研究提...

2026-05-06 talkingdev

近日，一篇来自JAX-ML团队的《Scaling Book》引起了AI领域的广泛关注。该书深入探讨了语言模型扩展背后的科学原理，为从业者提供了一份从硬件到实践的全景式指南。内容不仅详细解析了TPU与GPU的工作原理及其相互通信...

2026-05-05 talkingdev

最新报告指出，人工智能正迅速迈向其自身研发（R&D）的全流程自动化。在编程、实验执行以及长期任务自主性方面，AI 已取得重大突破。基准测试显示，当前模型不仅能处理复杂的工程和科学工作流程，还能有效管理其他智...

2026-05-05 talkingdev

与传统软件不同，AI系统的问题往往并非代码逻辑错误，而是模型行为与预期之间的偏差。正因如此，仅仅依赖传统监控手段很难快速定位“为什么刚上线的改动就搞崩了生产环境”。Braintrust 正是为解决这一痛点而设计的AI...

2026-05-03 talkingdev

马里兰州成为美国首个立法禁止超市利用AI技术实施“监控定价”（Surveillance Pricing）的州。该法案针对零售商利用摄像头、人脸识别、购物历史数据等AI系统，实时分析消费者行为并动态调整商品价格的做法。这种技术不...

2026-05-01 talkingdev

智谱AI团队发布的最新研究成果GLM-5V-Turbo，在人工智能领域迈出了关键一步。该模型的核心创新在于将多模态感知能力直接内嵌到模型的推理过程和工具使用中，而非作为独立的预处理步骤。这意味着模型能够同时处理并理...

2026-05-01 talkingdev

OpenAI在一项最新研究中揭示了GPT-5.1模型一个有趣的行为现象：随着使用频率增加，模型在生成文本时越来越倾向于使用“哥布林”（goblin）风格的隐喻表达。研究表明，这一“哥布林怪癖”并非模型随机涌现的幻觉，而是直...

2026-04-27 talkingdev

来自arxiv的最新研究提出了一种名为Vision Banana的通用视觉模型，该模型的核心创新在于将传统的视觉感知任务重新表述为图像生成问题。通过指令微调（instruction-tuning）的图像生成模型，Vision Banana能够在多种...