加入收藏 | 设为首页 |

属牛-李理:为什么说人工智能能够完成?

海外新闻 时间: 浏览:265 次
属牛-李理:为什么说人工智能能够完成?

作者 | Just

出品 | AI科技大本营(ID:rgznai100)

尽管市面上关于深度学习的书本许多,环信 AI 负责人李理以为大部分只重视理论或只重视实践。所以,依据他对深度学习多年的了解,自己着收拾手写了一本深度学习理论与实战书本。

现在,作者现已将《深度学习理论与实战:前进篇》揭露,读者可以免费阅览。这本开源书本最大的特色是理论结合实战和内容的广度与深度,方针是运用通俗易懂的言语来介绍根底理论和最新的开展,一起也介绍代码完结,将理论常识用于辅导实践。

从其目录就可以一望而知。

《深度学习理论与实战:前进篇》阅览链接:

https://fancyerii.github.io/2019/03/14/dl-book/

这本书中,作者在每介绍完一个模型都会介绍它的完结,读者阅览完一个模型的介绍之后就可以运转、阅览和修正一下这些代码,然后可以愈加深化的了解理论常识。

本书第二个比较大的特色便是内容的广度与深度,掩盖听觉、视觉、言语和强化学习四大范畴,并包含深度学习的大部分常见运用方向。

以视觉和言语为例,不同于市面上大部分只限于介绍 CNN 用于简略的图画分类或许 RNN、seq2seq 模型在 NLP 中的运用介绍的书,《深度学习理论与实战:前进篇》的视觉部分除了介绍 CNN 以及最新的 ResNet 和 Inception 模型之外,还介绍了用于方针检测的 R-CNN、Fast R-CNN、Faster R-CNN 模型;用于实例切割的 Mask R-CNN 模型;用于人脸辨认的FaceNet;还包含 Neural Style Transfer 和 GAN(包含 DCGAN 和 Cycle GAN)。言语部分除了许多书都有的 RNN/LSTM/GRU 等根底模型,用于机器翻译、chatbot 的 seq2seq 模型和 Attention 机制之外,还包含最新的 ELMo、OpenAI GPT 和 BERT 等模型。

此外,本书还介绍了 NLP 的许多经典使命,包含言语模型、词性标示、成分句法剖析、依存句法剖析和机器翻译。

《深度学习理论与实战:前进篇》还用一章的篇幅介绍强化学习的根本概念,包含 MDP、动态规划、蒙特卡罗办法、TD 学习和 Po属牛-李理:为什么说人工智能能够完成?licy Gradient。接着还介绍了 DQN、依据深度学习的 Policy Gradient 算法,终究是介绍 AlphaGo、AlphaGo Zero 和 Alpha Zero 算法。

除了理论和实践的通俗易懂描绘外。作者还在本书的序文《深度 | 人工智能终究能否完结?》一文中还“斗胆”表达了关于人工智能的个人观念,这些观念某种程度上都不同于干流观念。

比方,关于人工智能终究能否完结这一让许多人皱眉头的问题,作者依据自己对人工智能的认知和界说,给出了必定的答案。依据此,AI科技大本营采访了作者李理,跟他聊了聊为什么笃定人工智能可以完结,什么时分完结,以及他对深度学习开展的观念。

以下为采访内容,一如写书的风格,他对每个问题都给出了详实的答复。

AI科技大本营:您在书中指出理论上人工智能可以完结,并从许多视点做了解说,比方心情和情感机器也是可以有的,机器还能进行艺术“发明”,这些视点的解说或许大多是违背人们现有认知的,有人或许会质疑这是为了给“完结人工智能”这个方针,特意去找了一些勉强的“哲学性”证明,并且这些论据看上去满是完结人工智能的必要条件,您对人工智能的完结是否过于达观了?

李理:这其实可以说是我个人的一种崇奉,就像在前语里说到的:"在一本技能类的书本里是否应该添加独自一章来评论哲学问题,我犹疑了好久。这些内容很或许会被读者以为毫无价值,让读者白花了冤枉钱。"因为其时写这些内容时并没有想到要把前进篇免费敞开,所以我确实是犹疑了好久的。可是终究冒着被读者诉苦和吐槽的危险,我仍是决议"强行加塞"进去这一章的内容,因为这是我十多年来考虑的一些东西,也是让我一向在这个范畴不断学习的动力。(十多年前 AI 并不抢手,更不是"显学"。)

这仅仅我的个人观念,并没有期望咱们都能认同。可是这儿我只想提一点,那便是智能并没有咱们自以为的那么异乎寻常,因而从理论上并不能证明只要人才干够具有这种才干,就像释教以为的人人都可以成佛,成佛并不需求超高的智商、显赫的家世,它只需求观念的改动。相同的,咱们只需求以为人类没有什么特别的,那么发明和人类平等智能乃至比人类更智能的智能体便是彻底有或许的。

当然这需求"放弃"许多咱们自以为值得自豪,而别的生物不或许具有的东西,比方情感、创意和自在毅力之类的东西。就像要成为醒悟者需求放弃许多日常根深柢固的观念相同,比方咱们有必要承受诸行无常和诸法无我这样的观念。

AI科技大本营:作为一个人工智能的从业者来说,您期望人工智能可以完结,乃至终究可以制造出和人相同乃至比人愈加智能的机器,假如让您做一个斗胆的猜想,那么真实的人工智能什么时分会完结?它的完结有哪些必备条件?

李理属牛-李理:为什么说人工智能能够完成?:做这样的猜想是很费力不讨好的作业,尽管我以为人工智能必定可以完结,可是我并不关怀它是明日就能完结仍是一百年后才干完结。你的问题里说到"真实的"人工智能什么时分完结,隐含的意思便是现在许多"假的"人工智能,包含现在许多人也把人工智能区分为"强人工智能"和"弱人工智能"。我个人不是很认同这样的观念,这仅仅研讨的不同方向,而不是"真的"或许"假的"智能、"强的"或许"弱的"智能。我并不以为用大脑下围棋是比用手捡废物更"强"的智能。

即便必定要冒天下之大不韪来猜想"人工智能什么时分会完结",咱们也需求先对怎样样叫"完结"了人工智能到达一个一致。在群众的观念里,完结科幻电影里的那种人形的机器人便是"完结"了人工智能,当然它还需求满足"智能"让咱们分辩不出它是真人仍是机器人,因而它有必要和人很像,有情感和愿望,比方史蒂文斯皮尔伯格导演的电影《人工智能》里的机器人。

假如是这个方针的话,我觉得短期内很难完结。不过难完结的原因是和技能无关的,而是咱们不或许让它呈现。这是什么意思呢?咱们先抛开能否完结的问题,自己问一下假如这样的机器人做出来了咱们怎样对待它们?

关于大部分人来说,机器人便是一种愈加智能的东西罢了。从石器年代、铁器年代、蒸汽年代、电气年代再到现在的信息年代,咱们运用愈加先进快捷的东西来改动出产和日子。东西的意图是延伸和拓宽人类的才干。咱们跑得不快,但可以凭借骑马和开车日行千里;咱们跳得不高,更不会飞,可是凭借飞机火箭上天入地。

东西全体来看可以分为两类:拓宽人类膂力才干的东西和拓宽人类脑力才干的东西。现在许多机械的脑力劳动都可以由核算机完结,但传统的核算机程序只能帮咱们扩大回忆和完结简略机械的核算。咱们有容量更大速度更快的存储器,可以编制财政软件来进行财政核算,但却无法完结需求“智能”才干来完结的作业。

假如是从这个视点来看,完结智能的东西现已成为实际了。比方工厂里曾经需求人类灵敏的手才干做出来的东西现在许多都可以用机器来代替,咱们家里的洗衣机、洗碗机和扫地机器人帮咱们做了许多家务。

可是咱们并不需求它们有情感,不然换位考虑一下:它们为什么乐意甘心当牛做马像"奴隶"相同服侍咱们呢?它会不会在给咱们开车的时分要挟咱们呢,乃至悄悄按下美国总统的核按钮呢?这也是许多人忧虑人工智能会带来灾祸的原因,打个不恰当的比方便是奴隶主会忧虑奴隶们造反。

这儿就不评论人工智能的这种危险了,因为我自己对这个问题并不感兴趣,或许说我根本不忧虑这个问题。

下面这段设想的对话来阐明我为什么不忧虑。青年问禅师:"假如所有人都去当和尚,人类不就灭亡了?"禅师笑这说:"这和'请不在这儿的同学举一下手'相同可笑。"

什么样的人就会做出什么样的"人工智能",它仅仅咱们智能和世界观的延伸罢了。因而我觉得短期内,那种具有人类情感的机器人是不或许呈现的。

至于说完结需求的条件,或许哪天人类可以"承受"这种"人工"的智能体,那么就有或许完结吧。我觉得那个年代人类的世界观和宇宙观应该经过了一次很大的改动和打破。

AI科技大本营:您在书中还说到了一个有意思的观念:“研讨根底的举动才干(Robotics)比研讨高层的语义更有意义,因为常识来历于此。”您的意思应该是咱们对言语的研讨的仍是表层,这有点像是研讨人工智能时运用层要有效果,最重要的是根底技能层有所打破,但看上去研讨根底的举动才干并不简略,现在乃至或许都不知道详细从何着手?

李理:我的专业和现在从事的方向都是 NLP,但做得越久我觉得越懊丧。尽管现在的深度学习使得 NLP 愈加简略,在许多使命上的目标也越来越高,可是我个人觉得现在的这些办法都不能真实的处理问题。

拿现在最先进的 BERT 模型来说,它的关键是从未标示的语料里学习一个语句的语义表明。它可以从海量的文本中经过词之间的共现联络学习到某种程度的"语义"联络,然后可以把一个语句编码成一个向量。但它的问题是没有一个坚实的"根基"。

什么叫"了解"了一句话?这是一个很难界说的问题。比方有人跟咱们说“今日晚上八点会下雨",那么咱们"了解"了什么东西呢?

首要,咱们需求有时刻的概念。因为生物钟,咱们可以感触时刻,并且关于现代社会的人,咱们关于时刻有一个更细粒度的区分,有今日、晚上和八点这样的时刻概念。古人或许不能了解"八点",但他们有相似“戌时”的概念。

其次,这儿隐含了空间的概念,默许便是咱们说话地点的这片区域。别的咱们还要可以了解下雨是什么意思,它或许会淋湿咱们的身体。但什么叫淋湿?是液态的水附着在生物体的皮肤上然后导致这个生物体感觉冰冷和不舒服。什么叫冰冷?动物在接触到比它体温低的物体时发生的一种感觉……这样的问题可以不断重复下去,假如用人类的字典或许百科全书来解说的话终究就会构成循环解说。

不论人类的常识多么杂乱,但归根究竟都是人类的根本感触。不管终究的概念多么笼统,比方微积分的概念,它都是一系列其它笼统概念组合起来的,而其它笼统概念又是由别的一些概念组合起来。终究它必定会和咱们最根本的某种感触建立起联络,或许最基层的联络和微积分这个概念需求经过不计其数个其它概念的衔接。

因而从这个视点来说,假如要让机器"真实了解"言语,咱们有必要先完结根底的"人"的才干,比方行走、跳远等对身体的根本平衡和操控才干。现在的AI仅仅在研讨"大脑",这当然是人差异动物最重要的特征之一,可是假如咱们连一个根本的动物的才干都完结不了,那么必定是不能完结咱们等待的人工智能的。一个人的"大脑"是不能脱离他的身体而存在的,大脑的自豪或许自卑、快乐与哀痛都和整个身体的状况亲近相关。

AI科技大本营:最近,业界现已有深度学习技能的潜力现已抵达天花板?结合您在业界的实践经验,你对深度学习技能的未来开展怎样看?

李理:我觉得深度学习的技能一向都在稳步的开展,只不过曾经咱们并不太重视这个范畴,所以比及某些打破性的运用如 AlphaGo 或许无人驾驶呈现在咱们面前时咱们会觉得是十分大的打破。

可是假如咱们阅览关于 AlphaGo 以及围棋的开展进程就会发现它其实也是一点点的前进然后究竟某个临界值,所谓突变引起突变的进程。现在咱们重视的多了,就会觉得没有那么大的打破。别的一些人为了某些意图过火夸张核算的开展,然后让咱们发生许多不切实际的期望,这也会让咱们觉得现在的开展或许变慢了。

深度学习技能必定会不断的开展,咱们许多现在运用的办法会被更新更好的办法代替。可是有一点我觉得是不变的,那便是深度学习或许说神经网络它的根本世界观——联合主义。

联合主义以为智能是由简略单元的联合和构成的。详细来说,人类的大脑的功用便是由许多简略的神经元的联合而完结的。(人工)神经网络开始便是学习人类大脑提出的核算模型。神经网络领军人物之一 Geoffrey Hinton 自己便是研讨认知心理学(cognitive psychologist)的,许多网络结构比方卷积神经网络(CNN),循环神经网络(RNN)都部分的学习了人脑的作业原理。不过人工神经网络更多的是从微观层面的视点来学习人脑,但详细的完结层面愈加简化和重视有用性。它的一个根本观念其实便是:人脑并不特别,咱们可以从原理上完结和它平等功用的机器,尽管人脑是依据化学的生物的而现在的核算机是依据电子的。

AI科技大本营:《深度学习理论与实战:前进篇》的谋篇布局是为什么是依照听觉、视觉、言语和强化学习四个部分区分来写的?

李理:这样区分有如下一些原因。

榜首,和本书的姊妹篇《深度学习理论与实战:根底篇》不同,根底篇更多的是介绍深度学习的根底常识,因而是从算法的视点安排内容,比方有独自介绍全衔接网络、卷积神经网络和循环神经网络的章节。这些算法尽管各有偏重,但在许多详细的范畴都有运用,比方卷积神经网络不行是核算机视觉的中心算法,在语音辨认、自然言语处理和强化学习里可以运用。而前进篇会愈加深化的研讨这些范畴怎样运用深度学习的算法来到达 state of the art 的效果,因而它的内容是依据听觉、视觉、言语和强化学习这个四大方历来安排的。

第二,我以为这是智能的层次结构。咱们的智能首要体现在感知层面,而人类最重要的感知才干便是视觉和听觉。视觉和听觉都是对底层信号的感知,可是相对来说听觉更"高层"一些(留意是高层而不是高档,我一向不以为智能有什么高低只分,要想完结真实的智能,有必要要底层到高层的一致的智能体)。我这儿说的"高层"指的是听觉和言语的联络愈加亲近一些,当然视觉其实也是有许多"语义"的,只不过现在的研讨仍是在比较浅层的内容。

比方咱们现在的算法可以辨认这是一只猫,乃至可以标示出一个像素是不是一个猫的一部分。可是咱们还不能辨认这种猫的表情——它是快乐仍是愤恨、它是在爬墙仍是在躺着。当然也可以用现在的算法来做——咱们标示数据练习模型就可以了。可是这样的表情太多了,标示本钱太高,并且人相好像也不是这样来了解其它动物(包含其他人)的表情。这儿的"表情"其实也是某种"言语",这是咱们人类给猫的表情打的标签,咱们以为猫很萌,可是在老鼠看来可不是这样。

视觉和听觉作为人类与外界交流最首要的两种感觉,阅历了长时刻的进化。大部分动物都有兴旺的视觉与听觉体系,许多都比人类愈加兴旺。拿视觉来说,老鹰的视力就比人类兴旺的多,并且许多动物夜间也有很强的视力,这是人类无法比拟的。可是人类的视觉应该有更多高层概念上的东西,因为人类大脑的概念许多,因而视觉体系也能处理更多概念。比方人类能运用钢铁,对轿车有纤细的视觉感触,可是关于一条狗来说或许这些东西都是 Other 类别,它们或许只重视食物、异性、天敌等。

听觉体系也是如此,许多动物的听觉范围和精度都比人类高得多。但它们重视的内容也很少,大部分是猎物或许天敌的声响。人类与大部分动物最大的差异便是社会性,社会性需求交流,因而言语就十分重要。一些动物群落比方狼群或许猴群也有必定的社会性,像狼群打猎是也有协作,猴群有严厉的等级制度,可是相关于人类社会来说就简略得多。一个人才干适当有限,可是一个人类社会就十分强壮,这其实就跟一个蚂蚁十分简略,可是整个蚁群十分智能相似。

作为交流,人类至少有视觉和听觉两种首要的办法,但终究首要的交流办法言语却是构建在听觉的根底上的。为什么进化没有挑选视觉呢?当然有偶尔的要素,可是咱们可以剖析(或许猜想)一下或许的原因。

你或许会说声响可以经过不同的发音来表明更多的概念,并且声响是时序信号,可以用更长的声响表明更杂乱的概念。

但这是说不通的,人类能比动物宣布更多不同品种的声响,这也是进化的成果。用脸部或许四肢也能表达许多不同的概念,就像残疾人的手语或许唇语,或许科幻小说《三体》里的面部表情交流。假如进化,面部肌肉必定会愈加兴旺然后可以表明更多表情。

至于时序就更没有什么了,手语也是时序的。

当然声响相关于视觉仍是有不少优势的:

可以做许多剖析,但不论怎样样,前史无法从头挑选,现实便是人类的进化挑选了声响,因而 Speech 就成了 Language 的一部分了。当然还有一些听觉的内容,比方 Music,咱们可以以为是别的一种言语,它终究的意图仍是用于交流人类的情感,不然即便天籁之音也是毫无意义的。

强化学习和视觉、听觉和言语其实不是一个层面上的东西,它更多的是和监督学习、非监督学习并行的一类学习机制(算法),可是我以为强化学习是十分重要的一种学习机制。

监督学习的特色是有一个“教师”来“监督”咱们,告知咱们正确的成果是什么。在咱们在小的时分,会有教师来教咱们,本质上监督学习是一种常识的传递,但不能发现新的常识。关于人类全体而言,真实(乃至仅有)的常识来历是实践——也便是强化学习。比方神农尝百草,最早人类并不知道哪些草能看病,可是经过测验,就能学到新的常识。学到的这些常识经过言语文字记录下来,一代一代的撒播下来,然后人类社会作为全体可以不断的前进。

和监督学习不同,没有一个“教师”会“监督“咱们。比方下围棋,不会有人告知咱们当时局势最好的走法是什么,只要到游戏完毕的时分咱们才知道终究的输赢,咱们需求自己复盘(学习)哪一步是好棋哪一步是臭棋。自然界也是相同,它不会告知咱们是否应该和他人协作,可是经过优胜劣汰,终究”告知”咱们相互帮忙的社会会更有竞争力。和前面的监督非监督学习比较有一个很大的不同点:在强化学习的 Agent 是可以经过 Action 影响环境的——咱们的每走一步棋都会改动局势,有或许变好也有或许变坏。

它要处理的中心问题是给定一个状况,咱们需求判别它的价值(Value)。价值和奖赏(Reward)是强化学习最根本的两个概念。关于一个 Agent(强化学习的主体)来说,Reward 是马上取得的,内涵的乃至与生俱来的。比方处于饥饿状况下,吃饭会有 Reward。而 Value 是推迟的,需求核算和慎重考虑的。比方饥饿状况下去偷东西吃可以有 Reward,可是从 Value(价值观)的视点这(或许)并不是一个好的 Action。

为什么欠好?尽管人类的监督学习,比方先贤告知咱们这是不符合品德标准的,不是好的行为。可是咱们之前说了,人类终究的常识来历是强化学习,先贤是从哪里知道的呢?有人以为来自天主或许便是来自人的天分,比方“人之初性本善”。假如从进化论的视点来解说,人类其实在玩一场”生计”游戏,有遵从品德的人群和有不遵从的人群,大自然会经过优胜劣汰”告知”咱们终究的成果,终究咱们的先贤“学到”了(其实是被挑选了)这些品德标准,并且把这些标准经过教育(监督学习)一代代撒播下来。

鉴于其重要性,我决议把强化学习作为一个独自的部分来介绍。其实我觉得强化学习更重要的用途是在更底层的运动操控上,比方怎样灵敏的操控机械手抓取物体——要完结这个三岁小孩可以完结的使命其实并不简略。原本我是想在这儿参加一些 Robotics 的内容,可是因为时刻和水平的约束,这一部分内容我还在学习进程中,本着防止不懂装懂误人子弟的准则,本书不会参加任何我自己还不了解的内容。可是我觉得这个方向也是人工智能十分十分重要的部分,并且现在这个方向运用的仍是比较传统的办法,深度学习应该会能发挥愈加重要的效果。

AI科技大本营:介绍一下行将出书《深度学习理论与实战:根底篇》是一本什么样的书(包含内容包含状况,面向的读者群)?

李理:根底篇现已在编辑出书中,估计年中可以和读者碰头。

根底篇的内容不只包含人工智能、机器学习及深度学习的根底常识,如卷积神经网络、循环神经网络、生成对立网络等,并且也包含了学会运用 TensorFlow、PyTorch 和 Keras 这三个干流的深度学习结构的最小常识量;不只有针对相关理论的深化解说,并且也有有用的技巧,包含常见的优化技巧、运用多 GPU 练习、调试程序及将模型上线到出产体系中。

本书期望一起统筹理论和实战,使读者既能深化了解理论常识,又能把理论常识用于实战,因而本书每介绍完一个模型都会介绍其完结,读者阅览完一个模型的介绍之后就可以运转、阅览和修正相关代码,然后可以愈加深化地了解理论常识。

回忆人工智能几十年阅历过的起起落落,期望对人工智能及深度生育险怎么报销学习感兴趣的读者经过本书的学习可以愈加理性地看待这个职业,了解人工智能尤其是深度学习的原理并运用,依据当时的技能现状合理地运用深度学习去改动人们的作业、日子和学习。

(*本文为 AI科技大本营原创文章,转载请微信联络 1092722531)

你点的每个“在看”,我都仔细当成了喜爱

声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间服务。