荣耀9荣耀8青春版和红米米5 Plus哪个好

对话微软沈向洋:AI当前水平怎样 有哪些技术难点
A5创业网是国内领先的创业资讯和服务平台,提供权威的创业资讯和精准的品牌营销服务。以创业融资动态、创业学院、产品经理、人物访谈为内容驱动,与互联网创业者
  日,在刚刚结束了Microsoft Build 2017大会的主题演讲后,微软人工智能及微软研究事业部负责人沈向洋博士(Harry Shum)接受了InfoQ等特邀媒体的采访。本文对此次采访的要点整理。
  为什么现在人工智能这么火?沈向洋说:&云计算与日俱增的强大威力、运行于深度神经网络的强力算法,再加上今天能够获取到的海量数据,在这三股强大动力的交织驱动下,今天,我们终于有能力实现人工智能的梦想。人工智能拥有无穷的潜力,它有能力颠覆任何现有的垂直行业。&
  那么,人工智能当前究竟发展到了什么水平?前进的路上技术难点在哪里?微软的人工智能之路是如何规划的,又是怎样面对人才竞争的呢?
  一、如何看待人工智能?
  在回答InfoQ记者提问时,沈向洋博士全面阐述了他对人工智能的理解:人工智能分为感知和认知两方面,感知方面已有重大进展,认知方面的还远远没有获得突破,但可解释的AI将在5年到10年获得重大突破。
  1.为什么会有人工智能?
  谈到人工智能,虽然大家在今天会激动的不得了&&我自己也觉得&&有些东西已经在发生了,但是,首先你要回过头来看,为什么会有人工智能?
  人工智能是对于人类智能出来的,也就是Human Intelligence。后来60年以前约翰&麦卡锡定义一个词叫Artificial Intelligence,据说是麦卡锡真正提这样一个智能。
  2.人工智能分为感知和认知两部分
  为什么大家会觉得人有智能?其实,人的智能基本上分成两部分,一部分是感知,一部分是认知,而人工智能也是对应的。
  (1)感知方面有非常大的进展
  感知里面最了不起的、最大的一部分就是视觉感知。
  以前有人做过这样的研究,一个人91%的信息是从视觉收集过来的,我忘记了他用什么样的方法算出来这个数字,但大家基本上会同意这个观点:绝大多数感知都来自于视觉,然后是听觉,最后才是其他的感知。
  我觉得这边的进展非常大,我一直讲,过去这一年我都在讲计算机语音识别也就是五年的事情,五年之内计算机语音,它可以识别,不管你怎么去讲它都能识别。接下来10年左右的时间我觉得计算机视觉也会达到这一点,今天视觉很多东西已经超过人,人脸识别。我讲的是是很泛泛的普遍认知,到一个新地方,看到一个新东西能够联想到什么,这些东西大概十年左右的时间可以实现。
  (2)认知方面远远没有获得突破
  在认知方面,今天我们远远没有获得突破,都谈不上跟人类相比的地步。
  首先是自然语言处理的问题,然后就是知识获取的问题。越来越多的人更应该去做这方面的工作。自然语言处理,我刚才也提到机器阅读,语言这个问题,相对来讲的确是比较复杂。用今天现有的方法,包括深度学习的方法,解出来的效果还不是足够好,当然用深度学习已经可以帮助到我们很多东西,比如像翻译也用了很多自然语言的东西。
  更重要的,今天大家对整个&认知&这样的一件事情的定义,还在一个比较初级的阶段。
  例如,什么叫做常识(Common Sense)?你怎么知道见到这个人以后,为什么会对他很有一种亲近的感觉?这些我们还不是很理解,而这是一个很大的问题。
  稍微岔开一点讲,很重要的一个问题是,今天我们个人工智能做的这些东西,和脑科学的结合不够,理解也不够。很主要的原因就是对&智能&的很多东西,只有人脑这样一个范本,但人脑结构很特别,今天我们还不够理解。脑科学作为一门科学,今天也还处在一个早期的阶段,我们还不能做太多的实验,也不能随时把一个人的脑袋打开塞一些东西进去。
  这个是一个长期的问题,现在越来越多的人也在想这样的问题&&连接人工智能和脑科学。
  (3)认知方面,可解释的AI将做出非常了不起的成果
  有一个方向让我们觉得是很激动人心:现在在微软研究院很多的人在做这方面的事情,我也跟很多大学有一些合作,就是所谓的&可解释的AI&(Explainable AI)。我认为,Explainable AI在接下来5到10年,肯定可以做出非常了不起的成果。今天我如果有研究生的话,我就会让他们做这个方向的工作,原因非常简单,因为今天AI最大的突破就是深度学习,但是深度学习的一个最大的问题就是,出来的结果非常好,但是你没法解释。
  我自己看到的,这方面写得最好的一篇文章,是最近在《纽约客》的一篇有关医疗AI的。为什么看同一张图,医生会跟你讲,你没问题,原因是一、二、三。但今天AI还做不到这点,深度学习做不到这点,很大的问题是大家解问题的空间不一样,医生是在一个所谓的neural,脑的这样一个连续的空间在解,而AI很多的理解是在符号的离散的空间上去做。
  所以,如何把这些东西连起来,从技术上有讲有很多有待突破的地方,也是我们现在研究院很认真在做科研的一个方面。
  二、微软在人工智能方面的进展
  1.语音方面
  首先,我们讲人工智能在语音方面的突破,人工智能在语音识别,语音合成上面最近都取得了非常瞩目的结果。2016年9月,微软的对话语音识别技术在产业标准Switchboard语音识别基准测试中实现了词错率低至6.3%的突破,创造当时该领域内错误率最低纪录。一个月后,微软进一步将词错率降低至5.9%,首次达成与专业速记员持平而优于绝大多数人的表现。
  2.图像方面
  其次,在图像方面,人工智能也有很多长足的进步:
  2015年12月,ImageNet计算机视觉识别挑战赛结果揭晓&&微软亚洲研究院视觉计算组的研究员们凭借深层神经网络技术的最新突破,以绝对优势获得图像分类、图像定位以及图像检测全部三个主要项目的冠军。同一时刻,他们在另一项图像识别挑战赛MS COCO(Microsoft Common Objects in Context,常见物体图像识别)中同样成功登顶。在ImageNet挑战赛中,微软亚洲研究院的研究团队使用了一种前所未有的深度高达152层的神经网络,这比以往任何成功使用的神经网络层数多5倍以上,从而在照片和视频物体识别等技术方面实现了重大突破,将错误率降低至3.57%。
  2016年10月,微软亚洲研究院视觉计算组的研究员在图像识别MS COCO图像分割挑战赛中获得第一名,成绩比第二名高出11%,且相较于前一年COCO图像分割挑战赛第一名的成绩也有飞跃性的进步。
  3.自然语言方面
  除了语音和图像以外,其实人工智能在自然语言上面也取得了很大的进展。
(责任编辑:Morse)
------分隔线----------------------------
A5创业网是国内领先的创业资讯和服务平台,提供权威的创业资讯和精准的品牌营销服务。...
文/戈壁传媒 好几年前,就看到一些新闻报道用大号字体的标题写着纸媒已死几个字,看起...
A5创业网是国内领先的创业资讯和服务平台,提供权威的创业资讯和精准的品牌营销服务。...
A5创业网是国内领先的创业资讯和服务平台,提供权威的创业资讯和精准的品牌营销服务。...
A5创业网是国内领先的创业资讯和服务平台,提供权威的创业资讯和精准的品牌营销服务。...
文/戈壁传媒 如今,手机上安装了好几个新闻客户端的用户不在少数。上班途中,工作间隙...重磅清单:当前AI领域尚未攻克29个难题及进展评估
大数据文摘作品,转载请注明来源
编译 | Jennifer Zhu,张礼俊,bill,杨捷,Aileen
全文摘要:
□ 追踪人工智能中的核心未解决问题可以使我们坦诚地了解尚待实现的任务,并走向“强人工智能”(general artificial intelligence)。
□ 本文讲述了目前识别到的29个开放问题。
□ 我们对每个主要问题都提出了示例测试的建议,用以评估研究进展。
《重磅清单 | 当前AI领域尚未攻克的29个难题及进展评估百篇文献》??下面链接,保存之后查看:
本文列出了人工智能中的开放性问题,根据人工智能路线图研究所重点关注的“ 开放性研究问题 ”主题,简要介绍该领域的最大挑战和现有技术水平。(译者注:人工智能路线图研究所是一个旨在研究和比较由人工智能领域工作者提出的各种人工智能路线图的新机构。)
这些挑战可分为:人工智能完备(AI-complete)问题,封闭域问题,以及常识推理、学习和感觉运动能力的基本问题。(译者注:对于计算机来说最困难的问题,被非正式地称为“人工智能完备”(AI-complete)的,以此说明解决了这些计算性问题就相当于解决了人工智能的核心问题——让计算机和人类或者强人工智能一样聪明。)
可以预见的是,作为第一次对人工智能开放性问题的调研,下面的清单难免有疏漏之处。欢迎读者提供反馈。
为了促进强人工智能的发展,GoodAI(/)正在组织强人工智能挑战赛。这个比赛旨在通过从2017年初开始的一系列里程碑挑战赛解决下面列出的一些问题。(译者注:早在1956年,人工智能的先驱们就梦想着用当时刚刚出现的计算机来构造复杂的、拥有与人类智慧同样本质特性的机器。这就是我们现在所说的“强人工智能”。这个无所不能的机器,有着我们所有的感知(甚至比人更多),我们所有的理性,可以像我们一样思考。而GoodAI是一家捷克公司,他们的长期目标是开发出能够实现科学、技术、商业等领域自动认知过程的通用人工智能。)
来源,方法和相关工作
本文罗列的人工智能问题来源于以下领域的文献:
● 机器学习
● 机器感知和机器人
● 开源人工智能问题
● 人工智能系统的评估
● 测试人类水准的人工智能的实现
● 基准和竞赛
筛选本文研究问题的三个标准如下:
1. 必须与强人工智能的实现高度相关
2. 问题有封闭的范围,不接受开放式扩展
3. 可被测试
这些问题所在的范围不同但常有交集。其中一些问题可以被完全包含在其他问题中。第二个标准(封闭范围)排除了一些有趣的问题,比如学习人类的所有职业;几个这种类型的问题将列在主要问题之后。为了确保问题具有可测试性,每个问题之后都附有示例测试。
下面列出的几个网站提供了一些具有挑战性的人工智能问题:
● 常识推理问题页面 (http://commonsensereasoning.org/problem_page.html)提出了几个常识推理领域中的问题,例如“通俗心理学”(与心智理论和社会认知相关)和“物理推理”(与直观/朴素物理学相关)。
● 常识推理的Winograd架构页面(http://commonsensereasoning.org/winograd.html)介绍了Winograd架构和其他需要理解这个世界才可以解决的代词歧义问题。(译者注:Winograd架构是一个比图灵测试更有效的方法来确定一个计算机程序是否具有展示智能的能力。它观察计算机程序是否能够利用大量的知识来正确推理出故意含混的语句。而代词消歧问题是参与挑战的计算机程序需要回答一种特殊但简易的常识问题。人类可以根据常识和上下文信息了解代词的意义,但对这人工智能系统来说这是个很大的挑战。)
● OpenAI的研究请求(/requests-for-research/)展示了不同难度的机器学习问题,强调深层和强化学习。(译者注:OpenAI是微软与马斯克所创建的位于美国旧金山的人工智能研究团队。)
● AIoON列出的开放式研究问题(http://ai-on.org/projects/)包含人工智能的应用问题和基本问题,同时强调深度学习。(译者注:AIoON是一个致力于推进人工智能的开放社区。)
人工智能的挑战
本文剩下的部分将按下面的顺序列出人工智能领域的一些挑战:
1. 人工智能完备问题
2. 闭域问题
3. 共同推理
5. 感觉运动问题
人工智能完备问题
人工智能完备问题包含了所有或绝大多数符合人类智力水平的强人工智能问题。这个类别中的一些问题如下所列:
1. 开放领域对话(Open-domain dialog)
2. 文本理解
3. 机器翻译
4. 人类智力和能力测试
5. 核心解析(Winograd构架)
6. 复合词理解
(1)开放领域对话
开放领域对话是指与人进行事先未知话题的讨论。这里的挑战包括语言理解、对话语法和探索世界。任务的版本包括口头和书面对话,并可扩展至多模式交互(例如姿势输入和多媒体输出)。可能成功的标准包含有用性以及执行对话贴近人类对话的能力(“ 图灵测试 ”)。(译者注:图灵测试是图灵于1950年提出的一个关于判断机器是否能够思考的著名试验,测试某机器是否能表现出与人等价或无法区分的智能。)
对话系统通常由人工进行评估。此过程已实现的事件包括:
1. Loebner奖 (译者注:纽约的慈善家Hugh Loebner组织了首次正式的图灵测试。从1991年起,每年举行一次这样的竞赛,其中机器反应与人类反应最难区别的计算机将获得100000美元的奖金和一块金牌。)
2. 机器人聊天挑战(/)(译者注:2012年起开始举办的人工智能聊天竞赛。)
(2)文本理解
文本理解是一个尚待解决的问题。尽管问题解答领域已取得了显著的进展,但当需要使用超越文本的常识或世界知识去理解时,现有的人工智能文本理解系统就会面临问题。
1. McCarthy(1976)提供了一个早期文本理解的挑战问题。(shttp://www-formal.stanford.edu/jmc/mrhug/mrhug.html)
2. Brachman(2006)提出了阅读教科书和解决教科书练习的问题。
(3)机器翻译
机器翻译是人工智能完备的,因为它包括那些有关认知世界的问题(例如下面将讨论的核心解析问题)。
虽然翻译质量可以使用平行的语料库进行自动评估,但最终仍需要人工来判定测试的结果。例如当代美国英语语料库 (Davies,2008)包含了来自不同类型的文本样本。翻译质量可以使用以下样本进行评估:
1. 报纸文本
3. 口语翻译
(4)智能测试
人类智力和能力测试(http://allminds.org/)对其设计的人类利用记忆很难或不可能实现的问题很感兴趣。人类水平的人工智能性能已经被报道用于Raven的渐进矩阵(Lovett和Forbus,2017),但人工智能系统仍然缺乏一般的推理以及同时处理各种问题的能力( Hernández-Orallo ,2016b)(http://allminds.org/)。
Brachman(2006)建议使用SAT(https://en.wikipedia.org/wiki/SAT)作为人工智能的挑战问题。(译者注:SAT是美国大学入学考试。)
Coreference resolution
The overlapping problems of coreference resolution, pronoun disambiguation, and Winograd schemas require picking out the referents of pronouns or noun phrases.
1. Davis (2011) lists 144 Winograd schemas.
2. Commonsense Reasoning (2016b) lists pronoun disambiguation problems: 62 sample problems and 60 problems used in the first Winograd Schema Challenge, held at IJCAI-16.
(5)核心解析
核心解析、代词消歧和Winograd构架的重叠问题需要人工智能系统能指出代词或名词短语所指代的内容。
1. Davis(2011)(http://www.cs.nyu.edu/faculty/davise/papers/WinogradSchemas/WSCollection.html)列出了144个Winograd构架。
2. Commonsense Reasoning(2016b)列出了代词消歧问题:在IJCAI -16举行的第一次Winograd构架挑战赛中使用62个样本问题和60个问题(http://www.cs.nyu.edu/faculty/davise/papers/WinogradSchemas/WS.html)。
1. “The meaning of noun phrases” at (Commonsense Reasoning, 2015)
(6)复合词理解
多种语言存在具有特定含义的复合词,而我们也擅于猜测新出现的复合词的意思。比如我们知道水鸟是一种生活在水面附近的鸟类,而不是由水构成的。
“ 名词短语的含义 ” (http://commonsensereasoning.org/problem_page.html#nounphrases)
闭域问题是将重要的智力因素结合起来、并通过将自己限制在一个特定的知识领域来降低难度的问题。游戏玩家代理是其中的一个例子。人工智能代理已经在围棋和最近的扑克上实现了超越人类的表现。尚待解决的问题有:
1. 从描述中学习玩棋盘、卡片和砖瓦游戏
2. 根据描述生成程序
3. 源代码理解
(7)从描述中学习玩棋盘、卡片和砖瓦游戏
与专业游戏玩家不同,人工智能系统需要从对规则的描述中学习新游戏,并且不能依赖于针对特定游戏预先设计的算法。
1. 在AAAI会议上,从正式语言的描述中学习新游戏的问题已经成为人工智能的一个挑战(http://www.aaai.org/Conferences/AAAI/2013/aaai13games.php)。
2. 更具挑战性的是从自然语言描述中学习游戏; 这样的卡片和瓦片游戏的描述可从许多网站获得。
(8)根据描述生成程序
用编程语言来生成程序,例如C语言显然是实际应用中的一个兴趣点。
OpenAI提出的“ Deion2Code ”(/requests-for-research/#deion2code)挑战中列出了Ethan Caballero收集5000个程序描述。
(9)理解源代码
与源代码生成相关的是源代码理解,其中人工智能系统可以解释代码的语义并检测代码中可能出现的反常或与作者意图不一致的情况。 Allamanis等人(2016)(https://arxiv.org/abs/)报告了过程名称预测的进展。
国际模糊C代码竞赛 (OCCC,2016)发布了“难以理解”的代码。源代码理解可被认为是一种由人工评判的提高代码可读性的能力。
常识推理可以说是通用人工智能的核心要素。该领域主要问题如下:
1.因果推断
2.反事实推断
3.直觉物理
4.直觉心理学
(10)因果推断
因果推断需要识别并应用原因-结果之间的联系。
1.“证据的可信度”(可查看Commonsense Reasoning, 2015)
2.“狼和兔子”(可查看Commonsense Reasoning, 2015)
(11)反事实推断
反事实推断被用以回答假设问题。它使用因果推断和系统中的其他模拟及推理能力,来考虑事实与现实相反的情境。(译者注:反事实推断的例子:小明有高血压,现在想要知道一种降压药对降血压有没有因果效应。如果小明吃了药,那么此时,事实是小明吃了药,结果是小明吃了药之后血压有没有下降。反事实就是,小明没有吃药,因为不是事实所以我们无法观察到没有吃药对小明有什么影响。无法观察到反事实时的结果也被称为因果推断关键问题(fundamental problem of causal inference)。)
1.“残酷且不寻常的耶鲁射击问题” (可查看Commonsense Reasoning, 2015)
(12)直觉物理
对物质世界的基本理解,包括物体存继性和预测可能轨迹的能力,能帮助智能体更快的学习并做出预测。
1.“物理推断”(可查看Commonsense Reasoning, 2015)
2.“把手问题”(可查看Commonsense Reasoning, 2015)
(13)直觉心理学
直觉心理学,亦称心灵理论,能够让智能体理解目标和信念,并且从其他智能体的行为中做出推断。
1.“朴素心理学”(可查看Commonsense Reasoning, 2015)
除了在机器学习领域巨大的发展,很多和学习相关的重要问题依然尚未解决。它们包括:
1.渐进学习
2.无监督学习
4.从少数样本中类别学习
5.学会学习
6.组成学习
7.不遗忘学习
8.转移学习
9.知道何时你不知道
10.经由行动学习
(14)渐进学习
人类具有终身学习越来越复杂任务的能力。人工智能体亦该如此。这个想法的不同版本在终身(https://pdfs.semanticscholar.org/ce73/094b2c1c31c73b71eaed30728d1.pdf)文献里有讨论。在GoodAI,我们采用的是长期渐进的学习对知识和技能的长期积累。它要求在下面讨论的几个技能的组合:
· 成分学习
· 学会学习
· 学习并不忘记
· 转移学习
应用于家用机器人学习家务和翻屋保养的一个可能测试,包括取得工作所需的工具和材料。该测试通过两个准则来评价智能体:持续的行动,其中智能体需要自主运行,寿命之内不再重新编程;改善能力,其中智能体必须在其演化不同的时间点展示出在之前所不具有的能力。
(15)无监督学习
无监督学习被称做机器学习的下一个挑战。它是人类终身学习最关键的能力(监督学习和强化学习的信号无法提供足够数据)并和预测常识推理紧密相关(“补上缺少的部分”)。分层系统中各个组件联合学习的无监督学习是一个较为困难的问题(大神Bengio,NIPS2016 “大脑和比特”座谈会http://www.stat.ucla.edu/~akfletcher/brainsbits.html)。
除了在视觉领域可能的测试,语音识别也为无监督学习提供了一展拳脚的机会。虽然现在最先进的语音识别器基本都是依靠对大语音资料库的监督学习,无监督学习需要在没有监督的情况下,探索音素,单词分割,和词汇汇编。该方向限于少量词汇下的识别进来已有所进展,见如下论文(Riccardi and Hakkani-Tur, 2003, Park and Glass, 2008, Kamper et al., 2016)。
.一个全面无监督语音识别测试可以在部分转录语音资料库进行训练(例如,TIMIT,https://catalog.ldc.upenn.edu/LDC93S1),然后学会在非常稀疏的监督下进行预测。
(16)强泛化
人类可以在看似不同却有着内在相似性的情形下转移知识和技能,在调整到一个新环境时保留技能的核心部分,该能力被如下论文(Tarlow, 2016; Gaunt et al., 2016)称作强泛化。如果我们学习怎么打扫房间,我们就知道怎么打扫其他大部分房间。
1.一个通用集成机器人能够学会用一种材料构建一个玩具城堡(比如用乐高玩具),然后测试能不能也用其他材料(比如沙子,石头,木棍)建筑城堡。
2.家务机器人在一个环境中进行打扫和烹饪训练,并在高度陌生的环境下测试。
(17)从少数样本中进行类别学习
莱克和合作者们(https://staff.fnwi.uva.nl/t.e.j.mensink/zsl2016/zslpubs/lake15science.pdf)通过少数样本达到了人类级别的识别和生成文字。然而,从少数样本中学习更复杂的类别依然是个开放性问题。
http://image-net.org/该数据集包含了按WordNet中不同层次语义(http://nlp.cs.swarthmore.edu/~richardw/papers/miller1995-wordnet.pdf)整理好的图像。从非常少的训练数据图像中正确地确定数据集里的各个类别,是一个从少数样本中学习的很有挑战性的测试。
(18)学会学习
学会学习,亦称元学习是技能的习得,并趋于促进未来的学习。具体考虑的情形是一个更一般更缓慢的学习过程产生了一个快速的更专门的学习过程。例如,生物进化产生了像人类这样高效的学习者。
学习玩雅达利电子游戏是进来取得非常可观的成功的领域,包括了转移学习(见论文Parisotto et al., 2016)。然而,不存在任何系统能够在学习玩电子游戏中像人类一样经过一段时间的操作便可获取新游戏的玩法(见论文Lake et al., 2016)。
(19)组成学习
组成学习(见论文de Freitas, 2016; Lake et al., 2016)是一种能够重新结合原始表达来加快新知识获取的能力。它和获悉如何学习紧密相关。
组成学习的测试需要验证学习者是否着实有效并且使用了组合表达。
1.一些ImageNet的类别与主要由组成成分布局所决定对象类别相对应,例如椅子和凳子,或者单轮车,自行车和三轮车。测试可以评价智能体用少量样本学习类别以及报告图中对象组成部分的能力。
2.组成学习在学习电子游戏时应该是非常有用的。学习者可以在已经掌握的游戏中进行测试,但是游戏的组成元素看起来却改变了(比如在游戏霜寒https://archive.org/details/atari_2600_frostbite_1983_activision_steve_cartwright_ax-031中长相不同的鱼)。即便没有或者很少附加的学习,学习者也应该能够玩这样的游戏。
(20)不遗忘学习
为了终身持续地学习,智能体必须能够对新的观测泛化,同时保留之前习得的知识。近来该方向的进展见论文(Kirkpatrick et al., 2016)和(Kirkpatrick et al., 2016)。内存增强神经网络的工作(见论文Graves et al., 2016)也很相关。
不遗忘学习的一个测试需要序贯地呈现学习任务(较早的任务不重复),然后测试较早获取知识的保留量。也可以测试新任务下降的学习时间,来验证智能体利用了之前习得的知识。
不遗忘学习的一个很有挑战性的测试是序贯地学习识别ImageNet数据集中所有类别。
(21)转移学习
转移学习(论文Pan and Yang, 2010)是一个智能体在一个领域进行训练然后可以掌握另一个领域的能力。在文本理解领域的成果并不好,除非智能体在新的领域也进行了一些训练(Kadlec, et al., 2016)。
情感分类(Blitzer, et al.,2007)提供了转移学习的可能测试平台。学习者可以在一个语料库上训练,在另一个语料库上测试,并与直接在目标域上训练的基准学习者进行比较。
电影和商业的评论是两个不相似的领域,这使得知识转移具有了挑战性。在这两个领域里的语料库分别是Rotten Tomatoes的电影评论(Pang and Lee,2005)和Yelp Challenge的数据集(Yelp,2017)。
(22)知道什么时候你不知道
虽然不确定性在不同的学习算法中有不同的建模方式,但当前的人工系统在“知道什么时候不知道”这一点上通常比不上人类。举个例子,目前最先进的用于图像识别的深度神经网络,可以对一个人类完全不认识的图像做出99.99%的信心判断(Nguyen et al., 2015)。
人类对信心估计的表现包括:
1.在归纳任务中,如程序归纳或测序完备,知道何时提供的示例不足以作出归纳(多个合理的假设可以解释它们)。
2.在语音识别中,知道某段发音可能没有被听懂。
3.在诸如检测行人的视觉任务中,知道图像的一部分可能未被可靠地识别。
1.可以将语音识别器与人类基准进行比较,测量识别器给出的平均置信度与识别失败的例子的置信度的比值。
2.可以在生成的对抗样本上测试图像识别系统给出的置信度。
(23)经由行动学习
人类婴儿通过实验和观察他们自己的行为带来的影响来了解世界(Smith and Gasser,2005; Malik,2015)。这似乎适用于高水平的认知和感知。动物实验已经证实,自发运动的能力对于感知发展至关重要(Held and Hein,1963),并且近来在学习视觉感知中使用运动已经取得了一些进展(Agrawal et al.,2015)。在(Agrawal et al.,2016)中,机器人试图学习预测戳刺动作的效果。
“经由行动学习”因此包括以下几个领域:
o主动学习,其中智能体会选择出最可能有指导意义的培训示例
o开展认识论行动,即进行主要旨在收集信息的活动
o学会通过行动来感知
o经由行动学习因果关系
也许最重要的是,对于人工系统,通过实验学习世界的因果结构仍然是一个开放的问题。
对于通过行动学习,自然应该考虑操纵运动的问题,其中除了智能体的行动的直接影响,次要效应也必须考虑。
学会打台球:一个没有先验知识和没有固定训练数据的智能体被允许探索一个真实或虚拟的台球桌,并应该学会打台球。
感觉运动问题
目前机器人和机器感知的突出问题包括:
1.动态环境中的自主导航
2.场景分析
3.可靠的一般物体识别和发现
4.可靠的终身即时定位和建图(SLAM)
5.多感官整合
6.适应性灵巧操纵
(24)自主导航
尽管最近特斯拉(Tesla),Waymo(前Google自驾车项目)等公司在自动驾驶汽车方面取得了进展,但在高动态环境中的自主导航仍然是一个未解决的问题,因其需要充分掌握所面对对象以可靠地预测未来场景(Ess et al.,2010)。
对自主导航来说,在拥挤的城市街道和住宅区的全自动驾驶仍然是一个具有挑战性的测试。
(25)场景分析
场景分析的挑战远远超出了物体识别,它包括对由多个物体形成的表面、场景3D结构、因果关系(Lake et al.,2016)和可承受性的理解。它不限于视觉,而是可以依赖于试听,触摸和其他知觉,例如电反射和回声定位(Lewicki et al.,2014; Kondo et al.,2017)。虽然已经在例如识别异常和不可能的场景(Choi et al.,2012)、预测物体动力学(Fouhey and Zitnick,2014)和发现物体功能(Yao et al.,2013)方面取得了进展,但人工智能仍远远低于同领域人类的表现。
理解视觉场景中的因果结构的一些可能的挑战包括:
1.识别危险情况:可以创建合成图像的资料库,其中同样的物体被重新组合以形成“危险”和“安全”的场景,当然这些场景是由人类分类的。
2.识别物理上不可能的场景:可以创建合成资料库,以显示包含同样物体的物理上可信和不可信的场景。
3. 识别无用的对象:无用对象的图像由(Kamprani,2017)创建。
(26)物体识别
虽然物体识别近年来取得了巨大的进步(例如,Han et al.,2016),在许多问题上已经赶上或超越人类(Karpathy,2014),并可以在封闭环境中接近完美(Song et al.,2015),但是最先进的系统仍然受限于更困难的情况,如开放物体(与背景交错)、破碎的物体在动态环境中被截断和遮挡(例如,Rajaram et al,2015年)。
包含在杂乱环境中,从大型,开放式和变化的类型集合里挑出的物体对于物体识别系统很有挑战性。比如:
查看厨房和冰箱内部的照片,并列出所有者可用的食材。
(27)同时定位和制图
虽然同时定位和制图(SLAM)在某些应用中被认为已经被解决,但对于随时间变化的环境中耐久的大型自动机器人,挑战仍然存在(Cadena等,2016)。
一个大城市里的自动驾驶汽车,在没有预先提供详细地图的情况下,持续定位和地图在变化的环境里仍然可靠。
(28)多感官整合
多个感官的整合(Lahat,2015)非常重要,例如人类沟通(Morency,2015)和场景理解(Lewicki et al.,2014; Kondo et al.,2017)。具有多重互相重叠的感官系统似乎对于人类儿童通过在这个世界里感知和行动来教育自己是至关重要的(Smith and Gasser,2005)。
在嘈杂的环境中,唇读和手势线索是必不可少的,它可以提供多感官整合的挑战。比如:
机器人调酒师:智能体需要在嘈杂的酒吧里搞明白顾客的要求。
(29)自适应灵巧操纵
当前的机器人操纵手远逊于人手的多功能性(Ciocarlie,2015)。其中的难题包括操纵可变形物体和从移动平台操作。
从洗衣机中取出衣服,将它们挂在不同的地方晾衣绳和衣架上,同时不要挡住其他人的路。
开放性问题
列表中省略了一些值得注意的问题,因为它们具有过于开放的范围:它们包含了随时间演变或可以无限扩展的任务集。因此很难确定这些问题是否已经被解决。这种类型的问题包括:
在人类大学入学并跟人类一样上课(Goertzel,2012)
自动化所有类型的人类工作(Nilsson,2005)
Puzzlehunt挑战,例如,捷克共和国的年度TMOU游戏(TMOU,2016)
我回顾了一些待研究的问题,试图勾画出当前AI研究的前沿。第一个版本中的问题列表、问题描述、测试举例,以及对研究领域正在进行的工作的提及,都不尽完整。我正计划逐步扩展和改进这篇文章,并诚挚欢迎读者在文章下面的评论部分或在研究所的论坛上提出建议。
《重磅清单 | 当前AI领域尚未攻克的29个难题及进展评估百篇文献》??下面链接,保存之后查看:
原文链接:/ai-roadmap-institute/unsolved-problems-in-ai-38f4ce18921d
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。}

我要回帖

更多关于 荣耀8青春版和红米 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信