AI巨头Facebook悄悄参赛却被完虐,《星际争霸》是简单的推理游戏还是AI试金石?

发布时间:2017-10-10 12:13:00 来源 DeepTech深科技

上周日,由美国人工智能协会(AAAI)所赞助的、第十三届人工智能和交互数字娱乐大会(Conference on Artificial Intelligence and Interactive Digital Entertainment 简称 AIIDE'17)举办的星际争霸 AI 比赛闭幕了。


本届比赛的亮点莫过于 Facebook 的参赛:本届一个叫 CherryPi 的星际争霸 AI 是由 8 名  Facebook 人工智能研究实验室(FAIR Facebook AI Research Lab)的员工和相关人员创造的。不过,比 Facebook 毫无声息的参赛更惊人的是,比赛的结果显示 Facebook 竟然被超越了:本届前三名全是独立的发烧友,而 CherryPi 连前五都没进,只是第六名。

仅仅从 Facebook 参加这个著名的比赛这一举动来看,科技巨头争夺“XX 智力游戏首胜人类冠军”这一头衔已经越来越激烈化了。先有 IBM 的“深蓝”计算机于 1997 年战胜国际象棋世界冠军,后有谷歌的 AlphaGo 于去年战胜围棋世界冠军。而现在,人工智能界的下一个目标则是即时战略游戏了。在今年 8 月,谷歌旗下人工智能公司(也是 AlphaGo 的创造者)DeepMind 就曾公开宣布,星际争霸 2 将会是其下一个目标。
 
图丨 DeepMind 与 8 月 9 日在其技术博客上公开宣布将与暴雪游戏合作,开发星际争霸 2 的 AI 机器学习工具组:SC2LE(星际 2 学习环境)
 
而之所选择星际争霸 2,也是因为其作为即时战略游戏中的“即时”和“战略”恰恰是人工智能在创新之路上需要挑战的。

就拿“即时”来说。或许对于人类,星际 2 的那 300 多个基础操作的“操作空间”(Action Space)并不庞大。但是对于机器,星际 2 的分级操作,外加“升科技”所带来指令的变化,再加上地图的体积,其操作空间是无穷大的。比如“农民建房子”这个简单的行动就有 6 个不同的步骤:点击滑动鼠标选择单位,B 选择建造,S 选择供给站,滑动鼠标选择位置,点击建造。仅在一个 84x84 的屏幕上,机器的操作空间有大约 1 亿个可能的操作。面对着如此大的操作量,机器该如何有效的进行即时控制正是 DeepMind 和暴雪所推出的工具试图解决的。
 
图丨来自 DeepMind 官博的农民建房子动图
 
DeepMind 表示,其 PySC2 环境包装可以为 AI 玩家提供一个“灵活又简单的界面”。在初版的工具中,游戏中的每个元素,比如每种单位、血量、地图上可见的部分等都会拥有一个单独的特征层。这意味着研究人员们可以针对不同的特征(元素)进行开发和优化,有效的提高 AI 玩家的即时控制能力。
 
当然,星际 2 还有一些难题暂时没有技术手段解决,比如“战略”。作为一个战略游戏,很多时候,玩家做出的决定往往只会在十几甚至几十分钟之后才会产生效果。因此,AI 玩家需要学会计划。
 

而虽然 AIIDE 的比赛所使用的是星际争霸 1,但这并不意味着它更简单。毕竟这款游戏所要求的核心技术与星际争霸 2 无差。目前,由著名人工智能学者、卷积神经网络发明人 Yann Lecun 所带领、旗下有着超过 150 名顶尖研究员的  Facebook 人工智能研究实验室一共只发表了三篇跟星际争霸有关的论文。不过,虽然 Facebook 没有任何公开的宣言,但是很显然他们并不打算将“星际争霸 AI 冠军”这一成就拱手相让。
 
图丨 Facebook 人工智能实验室主任 Yann Lecun

众所周知,扎克伯格曾提过 Facebook 的未来有三个主要的发展方向,:连接世界、人工智能和虚拟现实。而毫无疑问, Facebook 人工智能研究实验室就承担了人工智能的重任,他们并没有近期产品的开发压力,专注于基础科学和长期方向上的研究。而且,为了争夺在人工智能领域的制高点,Facebook 还宣布对 AI 领域的投资额提高三倍,除此以外,Facebook 旗下目前还有由机器学习专家 Joaquin Candela 领导的应用机器学习部门(AML),他们对人工智能的重视由此可见一斑。
 

但是从本届比赛的成绩来看,Facebook“争霸”之路似乎没有那么简单。本届的冠军软件——ZZZKBot——是由来自澳大利亚珀斯的 Chris Coxe、一位软件开发者独自完成的。他曾在最终成绩揭晓前一天表示“它本来是一个概念验证。它的源代码挺烂的。”(当然,它和所有星际争霸 AI 一样,人类专业选手,甚至技术好的业余选手都可以将它轻易战胜。)

不过,Facebook 和谷歌对于星际争霸 AI 的思路与独立发烧友的思路并不一样。目前领先的星际争霸 AI 都是基于开发者人工编写的规则和策略。就拿本届的冠军来说,Coxe 表示,ZZZKBot 中最强大的功能也只是一个简单的学习功能:它可以针对一个对手尝试多个事先编好的策略,找出其中最有效的策略,然后在复赛中直接采取这个策略。


科技巨头们则计划在其星际争霸 AI 中注重使用机器学习,让它们可以通过观察海量的比赛数据和进行尝试后,自主创造出策略。而这也是让谷歌 AlphaGo 登顶的核心技术。(有趣的是,Facebook 并没有在 CherryPi 中采取这一方式。)

不过,随着谷歌和 Facebook 等技术巨头陆续进场,由技术发烧友独自开发出可以获胜的星际争霸 AI 软件的好日子不会有多久了。至于人类世界冠军,按照人工智能技术井喷式的发展速度,估计也不会有太多的优势了。
  
见习编辑 曹园园 总值班 万鹏

重庆晚报慢新闻APP,全心关注重庆,深度解读重庆,名家名记名专栏齐聚,做最有重庆特色的小、精、深原创客户端。并且还能加入重庆晚报抗癌爱心互助会,为家人健康做一个保障哦!扫描二维码下载
免责声明:
1、重庆晚报网是重庆晚报社唯一官方网站,未经重庆晚报社许可,任何人不得非法使用重庆晚报(含下属频道作品)以及本网自有版权作品。
2、本网转载其他媒体之稿件,以及由用户发表上传的作品,不代表本网赞同其观点和对其真实性负责。
3、如因作品版权和其它问题可联系本网,本网确认后将在24小时内移除相关争议内容。

分享到:


  • 重庆晚报

  • 都市热报

  • 慢新闻

  • 重庆一分钟

  • 重庆走走族

  • 文创联盟

  • 法律帮帮帮

  • 重庆六一班

  • 轨客网

  • 重庆单身狗

  • 爱真相

  • 影友会

  • 妙人志

  • CQ慢生活

  • 重庆房生活

  • 重晚副刊

  • 重晚体育

  • 大石化报

晚报简介  |  报纸广告  |  联系我们  |  晚报发行
重庆晚报 版权所有  经营性网站备案号: 渝ICP备17003974号-1  渝公网安备 50011202500889号 
地址:渝北区同茂大道416号重报集团21-24楼  互联网违法和不良信息举报电话:023-966988 互联网出版许可证:新出网证(渝)字004号