未登录,请登录后再发表信息
最新评论 (0)
播放视频

计算机语言处理和人类理解语言的差距

The Sentences Computers Can't Understand, But Humans Can

Winograd模式是一个测试
旨在将计算机语言处理结构到其极限
如果一台机器仅根据紧密的上下文
就能判断句子中的意向所指物
那么 该机器正在用推理来传递语言
那么或许 它可被称为“智能的”
人类很擅长基于语境明白指向物
例如 棕色的箱子装不下奖杯
因为奖杯太大了
什么是太大?
语言学家有时会用下标数字或字母
来表示文中的特定对象
所以如果你想理解那个“X”
并找出它在句子中指的是什么
你就需要知道手提箱通常用来装东西
而奖杯里一般不装东西
最后你必须了解容器如何工作
也就是大的东西放不进小的东西里
这似乎很简单
因为我们不仅懂得语法的构成
和句子的语法是否正确
而且因为我们本来就有
关于手提箱和奖杯的生活常识
所以 解决那个“X”需要理解
Terry Winograd在1972年开启了这一思路
他提出一些需要特定语境的句子
“市议员拒绝向示威者发放许可 因为他们害怕暴力
或者因为他们拥护改革”
当时是70年代 市议员还很少
但改革却很多
Winograd认为 解决这个句子
不仅需要知道谁能签发许可证 什么是示威者
还要知道市议会的政治利益
和他们看待政治变革的态度
特定对象的变化完全基于语境
和最后两个词的意思
很多句子的“X”都指代不明
所以即使人类都没有足够的语境
去弄清楚哪个代词指代哪一个人
如果你要写一篇耽美小说
并且你的两个主角都用了相同的代词
还在同一句子里面反复出现
那么这篇小说很快就会显得混乱
在业余写作 像同人小说中
缺乏经验的作家经常尝试
用提喻法来代替名字
但是这很尴尬
更有经验的作家倾向于
用语境和严谨的句子结构来表示
而读者们从来没有意识到
而Winograd模式明确为人类设计
让我们甚至无需多做思考
但它对于计算机的要求非常高
自然语言处理 一种理解语言的能力
目前正被广泛需求
正是它驱动着Siri Alexa和谷歌助手等软件
很多的公司在尝试研发出
可以理解人类需求的软件
但坦白说 目前大部分这种软件都很糟糕
它们总是只靠收集一堆句子
把句中每个单词标注出词性
识别‘’call‘’ ‘’how much is ‘’等它们认为对的关键词
这对Winograd模式是行不通的
纽约大学计算机科学系的一个研究小组
收集了150条Winograd模式的句子作为测试
比如 ‘’我把布铺在桌子上来保护它‘’
是指保护什么呢?
显然 如果你知道布和桌子是什么
以及为什么你会把布铺在桌子上就行了
但如果它们仅被标记为名词
而没有任何语境
那就毫无意义了
你好 这里是”未来的Tom”
稍作中断 我要说一下
在这个视频录完
以及后期都制作好了以后
我发现有人发布了GPT-2的新版本
它是一种先进的机器学习文本生成系统
我想如果我不在这里展示一下
很多人在评论区的留言会是
机器学习变成什么样了?人工智能变成什么样了?
所以我拿到了GPT-2的一个版本
它的设计有点类似“地牢之龙‘’的冒险系统
我命令系统创造一个手提箱和一个奖杯
然后让系统把手提箱放入到奖杯中
去看看会发生什么
‘’你一想到它‘’
‘’你就知道要做什么 所以你闭上眼睛去做‘’
‘’你把一只手放在它上面 然后把另一只也放上去
‘’你把你夹克口袋里的枪拿了出来‘’
‘’瞄准它 扣下扳机‘’
所以 如果你认为机器可以拯救我们
还早得很呢!
当然 有时候单词会变换词性
‘’主要的‘’ 通常是个形容词
但是在视频游戏中 可能做动词或名词
即使人类也只有听过这种用法才会理解
那么目前有什么解决方法吗?
接受Siri无法理解复杂的问题
并且雇佣廉价工人去手动标记数据
从而帮助Siri去‘’学习‘’的这种事实
但这种方法仍有不足
因为计算机无法理解语言的精髓
至少 目前是这样
人工语言处理至少需要10年时间来完善
就像它在过去几十年中经历的那样
我的合作者之一 Gretchen McCulloch
有一个很棒的播客叫‘’Lingtusiasm‘’
你可以通过以下链接来收听
感谢收看! 翻译:Alysaa

发表评论

译制信息
视频概述

人类能够理解包含指示代词的句子,而自然语言处理无法做到

听录译者

收集自网络

翻译译者

YXG136******89

审核员

审核员MS

视频来源

https://www.youtube.com/watch?v=m3vIEKWrP9Q

相关推荐