腾讯混元3D团队开源首个面向世界模型的强化学习后训练框架「WorldCompass」,是一个专为长时序、交互式世界模型设计的强化学习(RL)后训练框架。「WorldCompass」通过引入强化学习机制,直接「引导」模型如何更准确地遵循用户指令探索世界,并保持长时序的视觉一致性。(hc/j)