编者按:网易智能重磅推出大型系列人物专访《ai英雄》,和您一起走近数十位人工智能行业领袖,深入洞察技术发展趋势,捕捉“智能 ”行业机会,关注人的价值与人的故事。本期对话嘉宾为第四范式ceo戴文渊,身为技术大牛的他如何看待当下的人工智能技术发展?又为何要做ai领域的windows系统?一起听听他的观点吧。
出品 | 网易智能
策划 | 小羿
作者 | 小羿
30多年前,windows诞生,开启了个人电脑的时代。
如今,人工智能成为时代宠儿,很多人相信它会带来新的革命。
虽然人工智能已经引燃了全球科技圈,但它仍是一个门槛颇高的技术,很多开发者仍被拒之门外,大众对其应用仍一无所知。在人工智能专家戴文渊看来,如果整个业界就只有几个人会玩,那ai是没有办法推广的,也无法创造出价值。
获得过acm世界冠军,学术论文多次被nips、icml、aaai、kdd等国际顶级学术会议收录,创建了机器学习驱动的百度凤巢,还曾担任华为诺亚方舟实验室主任科学家,年轻的戴文渊已成绩斐然。然而,不安逸的性格让戴文渊选择了创业,开始挑战新的征途。
“如果说只有赛车手才能开车的话,街上也不会有车,全世界就只有几个人开车,开车就像坐火箭一样,现在其实ai就是这样的一个状态。”戴文渊说道,“我觉得ai不应该是这样,真正能让它遍地开花,必须要做一件事,让更多的人参与进来。”
为了实现这个梦想,戴文渊创立了第四范式,并着力开发人工智能平台“先知”。
“过去专业选手只能拿单反去拍照,不会玩单反的都拍虚了。我们现在做了个像iphone一样的傻瓜机,把它交给所有人拍。”戴文渊以此来比喻他的“先知”。
“现在最大的挑战是怎么能够告诉大家一个真实的ai?”戴文渊呼吁大众能理性看待人工智能,“现在市场的声音很杂,外界有很大的声音是在误导这个行业。”
在戴文渊看来,人工智能并不是无所不能,2016年被热炒的深度学习,也有诸如追求短期最大化、依赖于大量数据、没有举一反三的能力等局限性。而下一步的技术发展,可能首先是用迁移学习来降低数据使用的门槛。
对于人工智能未来,戴文渊认为,最先能够爆炸式增长的,是那些看不见摸不着的机器人,它们实际上已经大量存在广告、电商、内容分发等领域。
戴文渊同时提到,ai今年会逐步颠覆一些公司的管理模式,因为ai可以帮助企业复制出成千上万的重复性劳动“员工”。“如果你的公司缺乏‘人才’,你就别找ai;如果你的公司缺乏‘人头’,ai可以帮助你解决很大的问题。”戴文渊如是说。
以下根据戴文渊问答实录整理,网易智能(公众号smartman163)做了不改动原意的删减:
深度学习局限性很大,迁移学习是未来的方向
网易智能:您是如何进入迁移学习领域的?
戴文渊:这其实是十年前的事情。2006年的时候我还是研究生一年级,当时我们学校和顶尖的机构有比较密切的合作,学校会定期的选一些学生送到香港。我大概十多年前到香港科技大学杨强老师那边深造,那个时候我们开始关注到一些有些新的方向(如迁移学习)。我应该是第一个在那个时候和杨老师求学的学生,那时候对于一个大陆的学生来说,代表你有机会首先接触到国际前沿的东西。
那个时候,中国内地与国际上其它大国在ai领域是有巨大的差距的。现在中国追上了很多,至少在论文的发表数量上,中国目前是排在全球前几位的。但在十年前,国内的高校能发表一篇国际一流期刊的文章都是很难的。
网易智能:杨强教授和您都是迁移学习的专家,他曾说,深度学习是过去,强化学习是现在,而迁移学习是未来。深度学习技术帮助语音识别、图像识别有了一些突破,那么迁移学习可以解决哪些具体的问题呢?它会在哪些领域起到标杆的示范性应用?
戴文渊:首先,深度学习并没有完全解决语音识别这样的问题。例如,语音识别在很多的场景下超过了人,但是其实在一个自然的环境当中,语音识别准确率是低于人的。在安静的环境下使用语音识别技术准确率非常高,但是在实际应用中,比如在呼叫中心使用,客户给呼叫中心打电话不一定都是在家里的,也许在马路上,准确率会比人低很多,其实还是有很大的问题的。
从学术角度来看,学术研究比工业应用要早十年左右,十多年前我们看到深度学习往后面的突破点就是迁移学习。这个事情过了大概七八年,深度学习开始在工业界爆发,今天工业界开始讨论迁移学习,其实也是整个技术发展不会满足于现状所导致的。现在的人工智能在一些场景是可以应用的,但在绝大多数的场景是失败的。深度学习只看现在,追求短期最大化,而迁移学习追求的是怎么能把过去学到的东西运用到未来。比方说你玩游戏,过去玩了100种东西,玩第101种游戏的时候就会更容易上手一点。这就构成了人工智能下一步发展方向。
无论做什么,我觉得有一个不变的主题是“怎么样把人工智能的门槛降低?”实际上,迁移学习降低的是数据使用的门槛。深度学习有一个很大的局限性,比方说像利用这个技术来学习围棋,它需要几千万盘棋才能下好,但是其实人类下好围棋是不用学习这么多数据的。深度学习的数据门槛是很高的。
网易智能:有报道说,迁移学习让机器拥有了“举一反三”的能力,这是否意味着人工智能可以依托此技术跨入认知智能的阶段?
戴文渊:迁移学习是未来的方向,但目前从技术角度来看还有很大的瓶颈。刚刚说到对于深度学习来说,瓶颈一度在于大数据,迁移学习同样如此,不是说随便拿一些数据过来就能迁移。比方说你会数学、你能迁移去更好地学习物理,但这绝对不能帮你更好地学舞蹈。迁移学习的瓶颈在于有价值的数据源。所以我们不会把迁移学习变成这个阶段的核心任务,我们是在为下一阶段提前储备。
当然,迁移学习在目前阶段并不是没有应用,比方说第四范式在金融领域,成功用小额信贷的数据帮助大量的信贷,这就是用了迁移学习,但是这种方法没有大规模的应用。
迁移学习在什么时候会发挥出价值,假设我们上面有100个应用,第101个应用总能找到跟它相关的。但是如果说你今天只有一个应用,当第二个应用出现的时候,第一个可能就是帮不上忙。不是说没有迁移学习的能力,而是说没有可以帮助你的数据。在我看来,现在还不是迁移学习全面发力的阶段。迁移学习是你需要积累很长时间,积累很多过去已经学过的东西,然后当你学习一个新的东西的时候,总能找到过去的数据帮助到你,这个时候才是迁移学习发挥最大价值的时候。
“先知”要做ai领域的windows,降低ai的使用门槛
网易智能:在去年底网易和人工智能学会举办的大会上,第四范式“基于迁移学习的下一代机器学习平台”(“先知”平台)荣膺“吴文俊人工智能科学技术奖”创新奖一等奖。当时为什么要做“先知”平台?
戴文渊:其实我们从公司成立的第三个月就开始做“先知”平台了,但是没有对外公开。到了2016年7月份的时候,我们召开了发布会发布了“先知”平台,其实已经是2.0版本。在这个版本上,我们主要解决的问题是怎么让更多的人参与人工智能开发。因为我在人工智能领域看到一个问题,就是其实无论深度学习、强化学习、迁移学习对ai专家来说都不是问题,但是也仅仅是ai专家才能解决。现在整个业界的问题太多了,都来靠我们这样的一些人来解决不太现实。在过去我曾经尝试把我做的东西教给别人用,但是最后发现用不起来,并且我发现,为什么你用的这么奇怪?就是好像是我做出了一个单反,拿给你用,你把照片拍虚了,对焦没对准,但是又听不懂我在说什么。
所以我觉得我能看到的一个最大的问题是,不是说这个技术不能创造出价值,而是这个技术可能没用好。如果说整个业界就那么几个人会玩,ai是没有办法推广的。如果只有赛车手才能开车的话,街上也不会有车,全世界就只有几个人会开车,那开车就像坐火箭一样,其实现在的ai就是这样的一个状态。但我觉得ai不应该是这样,真正能让它遍地开花,必须要让更多的人参与进来。
第四范式正在设计一些低使用门槛的算法。我们在年前搞了一个内部的竞赛,让不是ai科班出身的人(非工程师甚至文科生)参加这个比赛,最后我们发现在一个新算法上,有70%的参赛者水平已经超过了原来的专业选手。我觉得这是ai往后面发展的最重要的领域之一。打个比方,过去专业选手只能拿单反去拍照,然后不会玩单反的都拍虚了,我们现在做了个像iphone一样的傻瓜机,把它交给所有人拍,最后有70%的人拍出来照片比专业人士拿单反拍出来的好看,大概就是这个意思。
网易智能:那“先知”平台的定位是什么?这个平台的目标是要成为人工智能领域的ios系统吗?
戴文渊:“先知”的定位是ai平台,有很低的门槛,目的是要让更多的人参与进来,让更多的人在上面完成ai应用。
我觉得我们的目标并不是ai领域的ios,我们要成为ai领域的windows。为什么这样说,因为在有iphone之前,我们都已经有手机了,但是有windows之前,绝大多数人不会有pc。win95之前,我学了dos,是会用电脑的,那时候班里会用电脑是很少的。但是win95出来,大部分人都能很容易的使用电脑了。
人工智能本质上干的事情,就好像我们做了个大脑,这个大脑你送进去一本数学书,他学会了数学,人工智能的“书”就是数据。ai的本质就是你把数据交给一个大脑去看一看,最后它经过学习就能干这件事。那为什么只有少数ai专家能做?是因为太复杂了,要调各种参数,要做各种设置,就好像我玩相机要知道什么叫光圈,什么叫快门,什么叫iso。但是如果能有一个像iphone一样的摄像机,你构完图点一下拍摄就可以了,这时候进入的门槛就降低了很多。“先知”平台就是要做这样的事情,这其中很重要的是我们需要设计新的算法,这里的难度可想而知。
目前,与我们合作最久的一家机构,他们已经有6个业务线用上了“先知”平台。平台上合作企业总量已经有两位数了。
网易智能:“先知”平台下一步有什么样的规划?
戴文渊:首先是我们要在人工智能领域降低门槛,这个领域有10个人做还是1000个人、10万个人、100万个人做,是完全不一样的。现在很多公司会把ai科学家炒的特别高,但我不认为未来人工智能的贡献者只是这些科学家,而应该是大众,这是一个很大的群体。
往后面,其实还有很多问题,首先我们要解决做模型的门槛,然后是数据获取的门槛,还有机房、硬件等软硬件一体化设计门槛。现在这个阶段,我觉得做模型的门槛是最高的一个,等我们把模型的门槛降下去了以后,新的门槛就是数据的门槛,然后再在下面,就是说机器资源太贵,做不起,这些问题都需要我们一步步去解决。
“我们是卖锅的,煎个牛排是为了让用户尝下好不好吃”
网易智能:基于“先知”平台,第四范式还在做金融领域的一些业务,能介绍下吗?
戴文渊:我们做金融领域的原因是这个领域在数据和技术上是准备充分的。其他的一些领域,比如说医疗发展虽然非常快,但是在过去的数据积累是不够的。我觉得不是说ai适合哪个领域不适合哪个领域,只要通过理工科能学会的技能,其实最后都是ai适合应用的领域。至于为什么现在有的做起来,有的没做起来,这是和数据的环境有关的。
至于未来我们是做金融领域,还是医疗领域,其实对我们来说没有太大的区别,并不是因为我们懂这些行业,而是ai在这些领域的应用是基于同一个设计的理念。
网易智能:那有没有想到用它做一些具体的业务,比如说你要做金融的话,可能有股票分析,智能客服等具体业务。
戴文渊:我们定位是要用“先知”平台降低人工智能使用门槛。所以我们更关注的是降门槛这件事情,它是有更大价值的。但是在早期我们还会提供定制化的服务,把产品打磨得更好。就比如你在商场里面卖锅,比如煎个牛排让用户尝一下好不好吃,但是我的目的并不是要卖牛排。
目前在金融领域,我们不会去定位做全部的客户,如果这样的话会让公司变成销售渠道为主的公司。目前五大行和12家全国股份制商业银行中有半数是我们的客户,我们鼓励他们自行开发,而其他的则通过渠道的方式去做。
网易智能:您在很多场合说过,人工智能一定要有数据才能做好算法。在您看来,现在这些数据是一个什么情况?是否够用?
戴文渊:对,就好像一个人要去学数学,必须有本数学书,不能说我聪明我就会。
数据上,我觉得要从两个方面来看。现在的数据已经很多了,但是和这个世界上应该能提供出来的数据相比,可以忽略不计。我们现在可能在一些特定的场景获得丰富的数据,比如广告、电商,还有在金融消费、风险反欺诈这样的场景,都有非常充足的数据,但是其实ai能干的事情远远不止这几件事。
ai将颠覆企业管理方式,虚拟机器人将首先爆发
网易智能:您如何看待亚马逊alex、谷歌home在智能家居上的火热,以及目前很多企业做集成式的ai芯片。您如何看待这件事?
戴文渊:这个要看他要做一件什么样的事情。做智能家居的一些语音对话,我觉得目前局限在一些场景上,形成闭环是可以的。
但我不觉得这是ai最厉害、创造最大价值的地方。即使这个电视没有语音交互,还是可以用,它不是刚需。ai创造更大价值都在于没有它别人做不了。举例来说,有一些人现在还是没能感受到银行提供的专属服务。这不是因为银行不想为大家服务,而是不可能有那么多服务经理。人工智能可以做的就是,如果你现在有1万个服务经理,每个经理只能服务1个客户,那ai现在可以再给你搞出1亿个机器经理,这样的话就能保证人人都有专属经理,这个就是没有ai是做不了的事情。
网易智能:您对今年的人工智能的市场有什么样的期待?
戴文渊:ai会给我们的工作生活带来很大的改变,但这不是一年两年的事情。我觉得今年的人工智能经过大家去年的热炒,很多公司都开始往这个方向去思考,每个企业家都在思考企业如何向ai转型。
对于企业管理者来说,现在需要领导的是不同性格的人,但是如果用ai来做,这个管理的模式会有很大的差别。通过想一些办法,教会机器干一件事情,再把这个无限扩大,这样看来未来企业的管理结构会发生很大的变化。其实我们想想会觉得挺让人兴奋的,如果你把机器人当做一个员工的话,ai企业甚至可以有几亿的员工。当然,这种员工只能是重复性的劳动。如果你的公司缺的是“人才”,你就别找ai,如果你缺的是“人头”,ai可以给你很大的帮助。
网易智能:pc承载了传统互联网,手机承载了移动互联网,在人工智能时代,要靠什么形态的产品承载?会是机器人吗?
戴文渊:我觉得从pc到移动互联网,都是没有差异化的时代。在没有互联网的时候,差异化就是有的人有服务,有的人没有服务。到互联网、移动互联网时代解决的是统一的服务。到了ai时代,我觉得是每个人都能得到最好的服务,就是个性化的服务,但地位是平等的。
在产品发展上,我觉得可以把机器人理解成广义的概念,不一定得看得见摸得着的才叫机器人。我觉得最先能够爆炸式增长的,是那些看不见摸不着的机器人。它实际上已经大量存在,如广告、电商、内容分发等等。而看得见摸得着的机器人,因为那个铁皮仍然是有边际成本的,所以我们需要去计算它的成本。
网易智能:从市场的角度讲,您觉得人工智能目前的发展最大的困难是什么?
戴文渊:我认为ai还是一个早期的市场,很多人对于ai的认知还没有达到正确的状态。现在大家对人工智能的认知偏高,觉得它什么都能做,这是不对的。对我们来说,现在最大的挑战是怎么能够去告诉大家一个真实的ai,特别是现在市场的声音很杂,外界有很大的声音是在误导这个行业。
我是一个ai从业者,创业路上时刻会遇到新困难
网易智能:在这个创业的两年多的时间里,您有没有遇到一些比较大的困难?
戴文渊:我觉得最大的困难就是永远都会遇到新的困难。比方说一个创业公司从天使轮到a轮、b轮,公司一直在往前走,我们永远都会发现到了这个目标之后还有下一个问题,永远有解决不了的问题。
其实对于个人来说,我从来都不是说自己是创业者,我把自己定位为ai的从业者,一直希望ai技术为社会创造价值,这是我做这件事情的初衷。我十几年前就是在做ai,现在还是在做ai,只不过现在我的挑战是怎么去创业。
我之所以走创业的路,是因为我不能局限在一家公司里面。大概六七年以前,我希望能够证明ai能帮助一家企业有获得巨大的成功。我证明了以后,又希望ai不仅仅局限在一家企业,认为这个事情可以造福全社会,因此我需要做一家能够服务全社会的公司。所以,我需要做第四范式这家公司。
网易智能:一般认为,作为学术和技术大咖,在创业中通常都会选择做cto或者首席科学家,身为ceo,您是否认为这是一个角色转变?
戴文渊:这肯定是发生转变的。我们有时候开玩笑说,我是我们公司最合适做cto的人,如果我做了ceo的话,我们就很愁找不到一个好的cto。
但是我觉得现在这个状况也是一种必然吧。创业这个事情,首先是你得有动力去做,其次是很多时候并不是最合适的人在做最合适的事。我觉得好在我是一个偏目标导向的人,创业的过程有很多的事情是我不擅长的,甚至是我从来没有做过的,但是如果从目标分解下来要做这个事情,然后说我不会做这种事情,再推导我要去学习去改正。所以,我会学习从技术人员变成一个管理者或者经营者。
网易智能:第四范式未来想成为什么样的公司?
戴文渊:其实每个阶段的理想都会不一样的。目前阶段是让每个人都掌握ai的应用能力。现在的人工智能和生物智能还有比较大差距,并不是你买一台机器回去,就可以教会他帮你做什么事情。
第四范式的目标,是把核心的技术注入到“先知”平台,然后把这些技术作为一个产品,让你很容易的使用。就像iphone在做的事情之一,就是让更多的人拍好照片,成像原理不用你管,它的整个参数设置光圈快门iso怎么设置也不用你知道。
在ai平台上横向看,谷歌tensorflow和先知平台并不是针对同一个人群。tensorflow针对的是企业和开发者,而先知平台要切的人群比他们门槛低很多。
网易智能:往前一步说,如果你们做成功了这种开放平台,有大公司想投你,或者收购你,你会怎么做?
戴文渊:我觉得一定会有这一天的,如果我们做成功了,未来肯定会有公司跟我们做一样的事情。
以我们现在的发展,完全没有考虑并购这件事情,因为我看不到任何一家公司收购我们以后能帮助我们更好地实现最初的愿景。(完)
注:本文为网易智能频道稿件,转载请联系全讯国际获得授权(微信公众号smartman163),违者必究。
1、 专访微软洪小文:下一个十年,ai应用将成兵家必争之地
2、 专访地平线机器人技术余凯:我特立独行 不畏惧行业泡沫!
3、专访科沃斯钱东奇:人工智能落地还要十年,你很酷不代表你能存活
4、专访云从科技周曦:刷脸时代 一支”国家队”的独特”战法”
5、专访驭势科技吴甘沙:2021年实现l5自动驾驶很难 共享无人车可期
6、专访 优必选周剑:人形机器人普及还要十年,90%创业太虚都会死
7、专访联想芮勇:以前大家把搞ai的当骗子 现在我希望ai是只"慢牛"