埃隆·马斯克的人工智能击败了冠军玩家

#科技10:22180

众译鸣谢

原文字幕:杨•玄德很于2017.09.18制作完成

译文字幕:zxr于2017.10.05制作完成

审核过程:11

字幕详情

你正在观看ColdFusion TV
[音乐]
你好 欢迎收看最新期的ColdFusion TV
众所周知 人工智能正在迅猛发展
似乎每隔几周
就会有一个意想不到的发展
让人们大吃一惊
开始逐渐清晰的一点是
我们正在接近一个
包含了人工智能的新时代的开端
那些关注的人
很可能
对未来几年可能发生的事感到吃惊
一些人已经发出关于
危险和安全措施的呼声
这些措施必须与发展强大的人工智能相结合
最引人关注的声音之一来自埃隆马斯克
令人奇怪的是 埃隆的非营利性人工智能
创业公司OpenAI刚刚取得了
一项非凡的成就
在这个视频中 我们将带你们看看究竟发生了什么
所以故事的背景是什么呢
每年游戏开发者Valve都要
为Dota2的专业玩家举办竞赛
Dota2是一款流行的在线多人游戏
这场比赛聚集了来自世界各地的专业玩家
他们都在为了2400万美元的特奖而战
今年有一个特殊的非人类嘉宾参赛者
它是埃隆马克斯的初创公司OpenAI的工程师培训的人工智能
当一对一对抗
世界上最优秀的Dota2玩家之一
并深受大众喜爱的登迪时 人工智能赢了
甚至在一年以前还没人确定
人工智能是可能的
登迪对于人工智能能够打败人类很惊讶
他说这个人工智能感觉有点像人类
但是又像其他别的东西
这个成就是
人工智能仅仅两周的实时学习实现的
工程师说在培训期间
人工智能积累了丰富的经验
他们也说Dota的规则非常复杂以至于
如果你只是编写了预编程的规则
然后编写了一些代码来执行它
那么最终它甚至还不如普通玩家
人工智能是从零开始训练的
对游戏一无所知
它一遍遍的玩 和自身对抗
直到掌握了游戏规则
一台计算机究竟是怎样学会玩Dota的
是的 所以这个机器人和你们之前见过的很不一样
我们只训练它通过自我对决学习
我们没有在对战策略中使用脚本规则
我们没有让它向人类的专业玩家学习
从一开始 它就只是不断地与自身的副本进行对赛
它从完全随机模型态开始
然后取得了很小的进步
最后达到了专业水平
这些是职业玩家 这些是人类的大脑
所以你告诉我这个机器人已经失败了很多次
它确实比职业Dota玩家更厉害
它打游戏积累了很多的经验
而且打了那么多场Dota比赛
它已经摸索出许多不同的策略
学会了怎么打 怎样利用打败别人的人
它在连续决策空间上比人类更快
马斯克对这一成就表示称赞
这是人工智能首次能够在
竞争激烈的电子竞技领域击败专业人士
由于电子竞技可能成为2024年奥林匹克项目
那这就变得很有意思了
这不是OpenAI首次取得显著的成绩
他们在过去还做了一些非常酷的事
这个公司实际上发明了一种方法
让人类可以和人工智能互动
就像教人类一样来教人工智能
下面看看这是怎么操作的
首先人类戴着VR设备
完成一个动作任务 机器人看着
然后同时模仿这个
之前从来没有做过的动作任务
在这个例子里 机器人学习如何搭乐高积木
这对人类来说听起来很容易
但是对一台机器来说实际十分困难
人工智能成功地通过它的视觉神经网络
合成成千上万的图像进行训练
以此来确定积木在模拟环境是什么样的
然后第一个视觉网络提供数据给
另一个叫做模仿网络的神经网络
在经过仅仅一次的原始演示之后
这个机器人现在可以搭积木
即便每次不同颜色的积木放在不同的位置
这意味着机器人不得不而且确实
能对看到的场景执行不同的动作脚本
最终的目标是创造一个
能适应新的和不可预测的环境的人工智能
好了 回到OpenAI最近创造的成就
埃隆在特推上说他用
OpenAI击败世界顶级Dota玩家
要比在国际象棋和围棋中胜利复杂得多
现在我不太确定我是否同意埃隆
觉得电子竞技比围棋复杂的说法
国际象棋确实如此 但是围棋也许不是这样
有人觉得围棋是有史以来最佳的智力比赛
围棋是一项有3000年历史的中国棋盘比赛
一个由DeepMind公司开发的叫做AlphaGo的人工智能
最近在一系列的季后赛中打败了世界冠军
这一事件被认为是人工智能领域
最重要的时刻
下面是DeepMind的首席执行官丹尼斯 哈撒比斯
在介绍围棋复杂性的片段
现在想想围棋是什么 它只有两个规则
我可以在五分钟之内教你这个比赛的规则
但是这也导致了它令人难以置信的复杂性
它可能是人类设计的最优雅的比赛
在亚洲 韩国 日本或者中国的情况是
如果你在大概五六岁的时候
就对围棋表现出很有潜力
你会从正常的学校退学然后进入围棋学校
你在这里一周7天一天12小时的学习围棋
和同样也想成为职业选手的同龄人一起
这是非常严肃的
已经持续了几百年
现在一种用来阐述围棋有多复杂的
方法是围棋里的布棋方式
比宇宙中的原子更多
所以你不可能
通过"暴力计算"解决这个比赛
这实在太复杂了
即便你集中全世界所有的计算能力
运算几百年
也没有足够的计算力
算出围棋中所有的变化
如果孩子真的从学校退学
花他们人生一半时间去训练精通围棋
我不能简单地就忽略围棋然后说Dota2更复杂
当然 这可能取决于你对复杂事物的定义
但是这只是一种想法
关于DeepMind的话题
我想你们中的一些人可能对更新的这几条
有关于DeepMind公司的AlphaGo感兴趣
同时人类从
世界围棋冠军
被人工智能打败的时刻学到了什么
在AlphaGo获胜的那场与围棋冠军的比赛中
它用了一些非常奇怪的下法
最终让它有优势赢得比赛
更明确地说 在人类3000多年
学习围棋和对弈的历史中
从没有思考过AlphaGo那样的下法
现在AlphaGo的下法已经被用在围棋学校
来训练学生并扩展他们下棋的思维方式
除此之外
DeepMind计划将AlphaGo的算法用在更通用的功能上
因为它显现了它巨大的学习能力
我认为人工智能是非常强大的工具
它能增强人类的创造力并释放我们的潜力
事实上 你可以这样理解人工智能 AlphaGo像
我觉得它和哈勃望远镜很像
也就是一种拿来探索宇宙的终极工具
当然对于围棋选选手来说AlphaGo
指引他们去探索围棋世界里的宇宙
我认为现实世界里许多其他的领域
也在经历这种像围棋届一样的组合爆炸
很显然 就像我一开始说的
我们在游戏里测试我们的系统
因为这是开发人工智能算法最便捷的方式
但显然 最后我们不仅仅只对它擅长比赛感兴趣
我们想把这些算法应用到真实世界里
并发挥作用对这个世界产生巨大的影响
我们相信我们能做到的原因之一是
我们正在建立通用的学习系统
它们不是为了某个比赛而创造的 比如说 国际象棋
它们实际上 我们实际上创造 我们相信通用的算法
可以从我们在人工智能上测试的比赛中获得
然后应用于现实世界
我们把这些算法应用到其他领域 卫生保健 机器人技术
甚至是优化数据中心
所以我们用了AlphaGo的一种进化形式 去年夏天
我们将其应用于谷歌的数据中心
我们成功减少了
这些数据中心15%的耗电量
通过更有效地控制制冷系统
所以你明白了吧
一如既往 这是人工智能领域一个非常有趣的时刻
人工智能通过比赛
来学习似乎是个很好的方法
但是更重要的是
从比赛中学得的知识可以被应用到其他领域
使得比赛这一行为比我们一开始理解的更重要
DeepMind和OpenAl都按照这个策略发展
所以你的看法是什么
你对这些感到惊讶吗
或者目前为止这对你来说都很平常
如果你是这个频道的订阅用户
我相信你对此已经习惯了
无论如何 视频到这里就要结束了 非常谢谢观看
如果你刚偶然发现这个频道 敬请订阅
我是Ben Dagogo 你正在收看的是ColdFusion
我们下个视频见
希望大家有个好心情
[音乐]
以下内容有剧透 , 请注意打开姿势

精彩推荐

  • YouTube有多大

    16:57244

  • 智能手机的未来

    12:09310

  • 【三星NOTE7电池爆炸门】对三星意味着什么

    05:05277

  • 诺基亚的沉浮part2

    09:20277

  • 特斯拉创始人-埃隆·马斯克的故事

    12:26993

  • 迪士尼到底有多大?

    14:17363

  • 特斯拉电动车是如何工作的

    10:04550

  • 未来的地铁会是怎样

    02:32398

更多视频, 请移步译学馆APP欣赏  GET APP