您的位置首页  商业  评论

创新工场、搜狗和今日头条这回携手在AI领域“搞事情

  • 来源:互联网
  • |
  • 2017-08-21
  • |
  • 0 条评论
  • |
  • |
  • T小字 T大字

  昨日,创新工场、搜狗和今日头条联合宣布三方携手发起“AI Chanllenger全球AI挑战赛”,旨在打造中国最大的科研数据集与世界级AI(人工智能)竞赛平台,推动中国人工智能领域科研创新。

  据悉,大赛第一年启动将超过1000万条中英文翻译数据、70万个人体动作分析标注数据、30万张图片场景标注和语义描述数据,是国内迄今公开的规模最大的科研数据集。基于此次的数据集,AI Challenger全球挑战赛面向全球AI科研人才广发英雄帖,致力于促进人工智能行业向更为、融合以及国际化的方向发展。

  在三方宣布发起活动的现场,创新工场董事长暨CEO、创新工场人工智能工程院院长李开复、搜狗CEO王小川以及今日头条顾问、技术战略研究院院长张宏江三位大咖就三方为何联合发起比赛以及国内AI发展现状等问题发表了自己的看法。

  他说,当时见了很多美国顶尖的教授,却发现他们都在感叹自己赶不上美国互联网巨头的步伐。“虽然这些教授能力绝对不比谷歌的工程师差,但是他们没有数据,没有大的计算力。”李开复说。

  回忆30年多年前自己作为AI科研人员的时代,李开复说,能接触到真实世界的海量数据是个遥不可及的梦想。如今,伴随互联网和移动互联网而来的大数据、高效的计算机运算能力等条件都齐备的下,有了AI Challenger这样的数据集和竞赛平台对于AI科研与开发人员是个难得的契机。AI Challenger致力于解决数据集缺失的问题,为人工智能科研免费提供海量数据,辅以强大的学术界和产业界专家指导,全力支持国内外的高校、研究机构、产业界科研人才一起来挑战人工智能的未来可能性。

  张宏江指出,身处人工智能行业,深知人才和数据是整个行业的未来。“大数据就是一个水涨船高的事情,当你有更多数据,让更多人用数据,就能提高他们的水平,就能培养更多的学生。”

  他以自己一个月前在斯坦福和伯克利的为例,发现当地博士平均的水平和对问题的把握,做出研究的领先性或者创造性,跟国内整体比起来,平均值要高很多。“比如说都谈大数据的问题,我们能不能从小样本里面学习,除了深度学习之外,能不能有新的架构出来。我认为,新的问题把握和解决上,我们还有很大空间去改善。回过头想象,其实我有点心虚,中国有人、有市场,但人才方面还是有事情要做,我希望我们今天做这件事促进中国在这方面的发展。”

  “两年前我们在讨论一个事,讲中国AI时代会不会落后?我当时有一个担忧,两年前数据互讯公司前10大里面,中国已经有4家,5年之后可能甚至超过一半是中国公司。在互联网公司领域,中国公司在AI走出去是处于领先的。”王小川说,在公司领域,中国的AI发展在全球来看并不落后,但一旦到了高校领域,计算机系排名全球前100名的高校中国只有2家,而且不在Top50里面,相对落后。

  “这样背后人才的储备就会落后,不像谷歌这类公司,AI的人满地爬,我们能够在国内捞几个,在国外引进几个就是很幸福的事情。有赖于中国高校基础人才供给上是有差距的,除了头两家北大好一点,总体上有巨大缺陷。”王小川说,自己挺担心从互联网时代AI时代,中掉队。但他指出,从今天看起来,他觉得还是有希望的。“中国公司跑的真的很快,现在公司都在反哺,输出去,输出资金让高校的群体小创业公司能够有起步。这件事情有非常大的意义,中国在AI里面就可能继续推动。”

  “我们整体看好的方向还是基于大数据的AI,不用搜集更多信息,已有数据就可以产生价值,这些领域在互联网的电商、广告、金融、保险、贷款或者信用卡、券商、量化交易这些领域是最快能够看到效益的,因为数据已经存在。”李开复说,长期的话,他还是认可无人驾驶作为重要行业发动引擎,让其里面的技术辐射到机器人领域。“最近我们看了一些美国的公司,中国现在还欠缺的公司,针对企业需求开发数据,比如说在医疗、零售、教育等都会产生价值。”

  王小川从搜狗自身出发,他指出,人工智能本质是建立在大数据和机器学习的基础之上。目前,搜狗以语言为核心的人工智能技术,已经通过问答、语音和翻译等形态应用于搜狗搜索和输入法等诸多产品中,并积累的大量的用户与数据规模。其中搜狗的语音输入日频次已达2.6亿次;搜狗的实时机器翻译技术也在包括乌镇世界互联网大会等数百场会议上进行了落地应用。

  “从搜狗的战略来讲,我内心有一个东西,今天随着深度学习的发展,语音和图像得到了跨越性的发展,语音图像在深度学习时很快就达到了一个新的高度。”但他指出,语音还是很难的事情,语音背后承载抽象的东西,是把知识和推理放在后面的。语言的内涵更丰富,就像今天做交流,比手势是有限的,还是靠语音交流。“在语音识别,我们做了很多,用户量最大,我始终认为我们专注点在语言上。就像我们之前做搜索、输入法都是以语言为核心。核心发力点是语言为核心,翻译在语言里面最简单,之后还有对话问题、问答问题。所以我们说翻译切入,背后做的是对话的机器和问答的机器。”

  张宏江指出,今天看AI的话,在识别人脸、识别人的行为、识别图像已经接近人的精度,但在语言这块还差很远,翻译这件事已经让人觉得很头疼。“要真正理解文本、理解对话,从简单的几句对话中间推演整体上下文或者推演对话的实际意义是什么,这需要有更多的研究和公司来做,这也是今日头条的一个重点。”

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
友荐云推荐