在过去几天里,来自中国和新加坡的研究人员通过将最先进的人工智能与具有挑战性的视频游戏《荒野大镖客2》(Red Dead Redemption II,简称RDR2)进行对战,引发了已经炽热的人工智能社区的争议。这项名为《通往通用计算机控制:OpenAI的GPT-4V与CRADLE多模态Agent在Red Dead Redemption II中的集成研究》的研究,研究了用于多人游戏探索的“模型选择算法”,并以视频游戏《荒野大镖客2》为案例进行研究。
理解通用计算机控制
通用计算机控制(GCC)为形成人工通用智能(AGI)铺平了道路,其中AI系统通过与人类用户一样的能力和理解来展示其处理任务的熟练程度。通过包含视觉和听觉数据的计算机输入系统,AI扮演了一个更精通计算机的角色。此外,这种技术为AI提供了在动态情况下决策行为的手段,即在没有先前有关其操作环境的知识的情况下,通过恰当地识别和反应于各种信息,测试AI在学习过程中的可重现性。
RDR2,也称为GM,以其丰富的环境和意外事件而闻名,是我们进行这项研究的最佳起点。该游戏提供了一个模拟的人员管理系统,具有复杂的控制系统和用户界面组件,从交互式对话到特殊的游戏内提示或指导,以节省时间并提升用户体验,从而使AI的评估可信。
AI游戏中的行为和进展
这项研究的关键是CRADLE框架,它是一个原型AI系统,旨在不仅具有游戏性,而且以后还要处理不同类型的软件应用程序。CRADLE通过实现目标来使AI熟悉随机化的游戏过程;它完全基于人类学习模式,而不知道任何内部状态或API。
然而,我没有预料到发展过程不会一帆风顺。在一些需要快速处理视觉空间意识和实时决策的任务中,AI面临了困难,比如复杂的战斗任务和由紧密相连的走廊组成的室内地图。这些挑战明显揭示了AI系统的心智模型与需要在处理双重任务时具有精确细致处理能力的游戏引擎之间的区别,这涉及到类似人类的视觉和理解游戏对象的相似性。
未来的挑战和影响
尽管所有提到的问题都在游戏过程中完全同步,CRADLE还是成功完成了故事部分,因此应该将其视为AI游戏中的一个高水平标志。该研究的结果不仅突显了AI实施这些密集任务模拟的能力,还告诉我们仍然可以建立在此基础上的方面,特别是开发良好的空间识别和视觉光谱方面。
AI是持久的,随着其演进,它的应用领域涵盖了新的地平线,其中游戏是其他更深层次挑战中的最初争议点。能够理解和反应复杂平台系统的AI系统成为了机器人学和实时战略系统等领域进步的工具。下面的研究无疑将被视为进一步研究的基础,以改进AI的功能,并突破通用计算机控制应用的限制。研究和尝试解决现有的限制,并使AI系统更加敏感、反应迅速和智能,将有助于创建一个可广泛应用的AI资源。
本文最初发表于Tom’s Hardware。