世界知识的相关内容 - 漫话开发者

2026-04-21 talkingdev

通义千问Qwen3.6-Max-Preview发布：世界知识更强，代码能力大幅进化

阿里云旗下通义千问团队近日发布了其大型语言模型的最新预览版本——Qwen3.6-Max-Preview。该版本在多个核心能力上实现了显著提升，尤其是在世界知识的掌握与指令遵循的准确性方面表现突出。更为关键的是，模型在广泛...

2025-07-14 talkingdev

《RL万亿级扩展路线图：解锁AI大模型从互联网推理的潜力》

近期，一篇关于强化学习（RL）如何扩展至惊人10^26 FLOPs（每秒浮点运算次数）的探讨引起了业界广泛关注。文章指出，强化学习被视为构建前沿AI模型，尤其是大型语言模型（LLMs）的下一个核心训练技术。传统观点认为...

2025-04-03 talkingdev

2024年最热门AI模型盘点：功能解析与应用指南

本文梳理了2024年以来最具影响力的AI模型，深入解析其技术特性与应用场景。OpenAI推出的GPT-4.5 Orion凭借其强大的世界知识建模能力成为通用AI领域的标杆；Google的Gemini 2.5 Pro则专注于代码生成与理解，为开发者...

2025-02-06 talkingdev

谷歌发布全新AI模型Gemini 2.0，推动AI思考能力发展

谷歌本周三推出了Gemini 2.0 Pro Experimental实验版，并在其推理模型Gemini 2.0 Flash Thinking上进行了更新，用户可以在Gemini应用中使用。Gemini 2.0 Pro Experimental将在谷歌的AI开发平台Vertex AI和Google AI...

2024-07-18 talkingdev

ReasonVOS：基于世界知识的视频对象分割技术

推理视频对象分割（ReasonVOS）是一项新的任务，它使用隐式文本查询生成分割掩码。这需要复杂的推理和世界知识。在这个工作中，我们提出一个新的任务：基于世界知识的视频对象分割。这项任务的主要挑战在于，它需要...

2024-02-02 talkingdev

Llava 1.6发布，OCR、推理和世界知识得到改进

Llava是一种视觉语言模型，最新版本为1.6，经过改进后，其OCR、推理和世界知识等方面有了很大提升，甚至在某些任务上可以与Gemini相媲美。Llava团队计划发布数据、代码和模型，以便更多人能够使用。

2023-05-22 talkingdev

利用真实世界知识提升语言模型表现：新的微调方法

研究人员设计了一种新方法，使用虚拟模拟器为语言模型提供“具身体验”，以培养其对真实世界的理解和规划能力。这种新方法显著提高了模型的能力，使得小型模型的表现与 ChatGPT 等大型模型相当甚至更好。 ## 三个核心...