网易科技讯 8月26日消息,2014中国互联网大会今天在北京国际会议中心举行.缔元信总裁梅涛在与网易科技对话时表示,无线领域目前的状态是各家都在以孤岛状态来垄断数据的阶段。但梅涛也表示,当数据公司能够更多为移动互联网企业提供足够优质的数据分析和服务价值,移动互联网的大数据也会开始受到重视。
以下为对话实录:
网易科技:大数据是现在最热门的话题,从概念到应用却不是非常好,缔元信有什么值得分享的经验?
梅涛:大数据从过去一年多,近两年时间概念非常热,到今天略微有点点降温,实际上是经历了一个小小的过山车的过程,实际上这个过山车过程的背后是有一系列的行业发展的问题和一些技术障碍问题的。从我们缔元信的角度来讲,我们几乎每一天都在跟这些问题打交道,其中大致分成两个方面的问题,一个方面是纯技术层面的问题,因为就互联网大数据应用角度来讲,有很多的技术门槛,比方说中文语义分析的问题,比方说数据模型的缺失,需要不断的摸索、尝试、建立,诸如此类这样的问题,除此之外,还会有一些行业发展过程之中大家的心态问题。
这个心态问题其实很有趣,在一年前,大家一说到大数据时都很兴奋,一说谁是做大数据服务的,你自报家门时,可能对方至少会挺主动、挺热情跟你交流。往后面一点,我们就会发现发生了一些微妙的变化,比方说有很多机构开始对自己所拥有的数据特别在意,就像老母鸡护小鸡一样的,把一些本来应该用开放的态度交流的数据完全捂在自己的体系之下。我们觉得这种现象和做法会造成一系列的问题,所以我们过去一年多两年下来,伴随着这个行业的起伏,我们也坐了一把过山车的感觉。
网易科技:您觉得大数据应用主要的瓶颈在哪?是公司壁垒,还是行业人才还是商业模式?
梅涛:您刚才提到的这几点都存在,如果从最底层往上说的话,首先是技术上的一些不成熟。技术不成熟,从我们自己发展业务过程中感受最深的在两点,一点是在我刚才提到的,中文语义分析这块,可能从全行业来讲,这个技术并不是很成熟。第二,即便我们自己或者找一些全讯国际的合作伙伴,把这些文本信息的数据做了一些结构化的处理,但实际上在基础信息之上,还有一个很重要的应用层,我们可以把它理解成不同的应用模型。具体一点讲,比方说具有什么样的访问行为和兴趣偏好的用户,他可能会具有什么样的广告价值,或者说具有什么样的营销价值。从理论上讲是可以讲通的,但实际上每一个细微的模型,可能都需要验证、需要校验,需要不断的完善和优化,所以这个过程中也会有很多的门槛。
再往上一个,其实也存在一些人才缺失,这个可能我相信无论是我们还是我们的其他同行,甚至于整个互联网行业的从业公司,可能都会感觉到目前大数据的人才太少了。甚至于可能很多公司和机构都搞不清楚到底需要什么样的人,足见围绕人才这块目前是个什么样的状况。
最后一个层面,可能是大家对于数据的一个态度问题。刚才我提到了从最早可能对数据不那么重视,到大数据浪潮兴起之后,大家突然特别重视了,导致对数据的态度在开放性上和共享这方面,可能会做得不是那么到位。
网易科技:在缔元信看来,缔元信需要什么样的人才呢?
梅涛:我们需要几类,比如说算法工程师,做数据挖掘的,当然做产品时肯定最后有呈现问题等等,每一个环节上都存在一定的人才短缺。最近有一个流行词叫数据可视化,原来我们习惯于用简单的图形来展现数据,随着大数据的应用越来越普及之后,有大量非这个行业内的客户。包括整个互联网行业和it行业发展,本身可视化就是一个很重要的发展趋势,也许是大家越来越懒了,大家可能对于看那些枯燥的数字越来越没兴趣了,但如果说你用一些可视化的手段和形式去呈现数据的话,那么它的传播效果和应用效果可能会更好。所以,这个角度来讲,我们在数据可视化这块也会有很大的人才缺口,而且这个应该说是一个很新的领域,无论是人才还是相应的工具,都不是很到位。
往后端,我刚才说的,算法工程师,包括做模型的,设计各种各样的数据模型,当然还有一些是属于特别底层的,比如说最近一两年兴起的hadoop新的语言之下的开发,可能都存在人才缺乏的问题。
网易科技:百度制作的迁徙图是不是就是可视化的范围呢?
梅涛:百度,其实是一个非常好的应用案例,就是通过一个非常形象、非常生动的可视化呈现方式,把一个原来很枯燥的问题能够让大家都感兴趣。而且现在不光是百度,我相信各家都有一些,包括我们在过去一两年中,也帮助一些客户开发了一些这方面的应用。
网易科技:现在缔元信主要的产品会集中在哪块?
梅涛:首先我们开发了一个属于我们的dmp平台,这个dmp平台的数据来源其实是包括网易在内的众多门户网站、垂直网站,甚至包括一些企业网站。现在在我们的平台上应该有大大小小近一百家网站,把这些不同来源的数据在我们后台从用户围度把它打通。所谓从用户围度打通的意思,我们就说一个应用场景,从网易角度来讲,从你们自己的后台只能看到用户在你们自己网站上的行为,但是他来之前、去之后的行为你不可能看到。在我们这个平台上,因为你们是我们的客户,包括我们现在跟你们也在做一些合作的尝试,我们会给你们输出一些用户的标签,就是你们的用户非你们网站的体系之内,在其他网站的一些行为,我们不会提供说是在哪家网站,但是我会把他所访问过的内容提取出来进行标签化。因为各家网站都有自己的所长所短,比如说网易有很多优势频道,不管是女性还是科技频道,都是做得非常不错的。但是作为一个用户来说,他可能会有一个相对固定的使用习惯,他可能到网易只在一两个频道浏览,但是他其他的偏好也许会到别的网站去。这个别的网站如果也属于我们客户范围之内的话,我们就有可能从赋予用户标签的方式,把你们的一部分用户,他的所有站外行为也输出给他们。
这样做的用途或者好处在哪呢?很简单,因为你们现在也在做内容推荐的尝试,以及将来可能会做竞争广告投放的尝试,无论是做内容推荐还是竞争广告,都需要尽可能长的数据链条,其实就是一连串标签。我们公司过去半年多时间,跟包括网易在内的一些行业内的优秀网络媒体在这方面都做了不同程度的尝试,而且也都收到不同的效果。
网易科技:缔元信的下一步计划是什么?
梅涛:在这个问题上,我觉得首先有一个就是我们会一如既往的坚守在互联网数据这个行业里,因为这一点我觉得可能对于任何一家公司都挺重要的,就是尽可能首先要专注。尤其是在数据这个行业里,在刚刚诞生的新的应用领域里,可能你做得比较发散一点,多做尝试是有益的,但是在互联网数据领域里,我们觉得首先就是专注和持续性会是很重要的,因为数据只有它像酿中国传统白酒一样,必须够年头以后才够香。第一,我们会专注于互联网数据服务,当然这个外延有点变化,现在除了pc互联网之外,还有大量移动端的问题。我们所说的专注互联网数据实际上是个广义概念的,既包括传统的pc互联网,也包括现在方兴未艾的移动客户端的,甚至于将来物联网层面的,当然我们可以把它广义的理解为互联网数据。
网易科技:移动互联网的数据分析现在进展如何?
梅涛:首先从全行业包括我们在内的所有同行来说,其实都在做各种各样的尝试和探索。所以,我觉得在今天,很难有一个百分之百的定论说这个领域的数据该怎么做。但是有几点比较重要的方向可以跟大家分享,传统的以pv、uv这些来定义互联网用户行为的这样一个体系,可能在移动端慢慢的会不那么重要了,什么会变得重要呢?我觉得首先有一个很重要的尺度,就是我们认为某一个用户在某一个平台之上,或者某一个应用之上,或者某一个网站之上所花费的时间可能是一个很重要的围度。
举个例子,我相信现在几乎所有智能手机用户在微信上花的时间相对而言都是最多的,除了有些超级的游戏发烧友可能会玩手游,可能会在阶段性有一些例外,但是总体来说,包括我们做的一些调查数据也能看得出来,目前微信在占用海量用户使用时间长度方面应该说是很领先的。而这个时间会变成一个很重要的衡量某一个应用,或者某一个新的媒体形态、媒体平台价值的尺度。
开个玩笑,就像当年马克思拿劳动时间去衡量商品的价值一样,接下来行业内慢慢也会达成一个共识,就是在广义的互联网平台之上,某一家平台吸引用户在上面停留多长时间,可能会变成一个很重要的衡量这个平台价值的一个重要围度,我觉得这可能会是一个很重要的趋势。
第二,可能就是一些判断标准,除了这个之外的判断标准,比如说现在类似嘀嘀打车纯粹应用类的app,到底应该怎么去用什么样的指标体系,或者用什么样的数据指标体系去衡量他的价值,或者说横向比较,比如说嘀嘀打车和快的打车怎么比较,除了总的用户数、活跃度之外,是不是还有其他的?比如说这个其他的是什么意思呢?举个例子往下深入一步,比方说嘀嘀打车的用户和快的的用户在打车之后所用的路径,以及这个路径周边的商业环境是不是也是将来可以去挖掘的某种数据?当然,我并不假定说嘀嘀打车和快的在这方面就一定具有很大差异,但是我想这个方向上的数据也许在今后会越来越发挥它的价值。
网易科技:app们愿意把这些数据与数据处理公司进行分享吗?
梅涛:现在在无线领域,目前的状态是各家都在以孤岛状态来垄断数据的阶段,我觉得这个阶段一定会经历,但是等这个阶段到一定时候,大家发现孤岛解决不了自己的问题时,可能就会慢慢的去做一些相对开放的尝试。但是在短期之内,我觉得可能会有些问题,尤其是给我们这样的第三方数据机构,能够长我们像针对pc互联网这样相对比较开放的去提供数据服务,可能目前的环境还不是那么成熟。
但是反过来讲,我们比较坚信一点的是说关键取决于我们自己能够给我们的客户提供什么,包括你说现在我们所在的pc互联网领域里面,我们是一种收费服务,实际上在市场上有很多免费的,跟我们功能貌似比较接近的产品,为什么客户还会买我们的产品?核心原因在于说在我们跟客户的合作过程中,客户体会到了全讯国际的服务价值,所以我相信在移动互联网领域里面,也会经历这个过程。你能够让客户把数据分享给你的一个前提就是你给他提供的服务是他觉得有价值的,有需要的。
网易科技:这个改变或者说开放的契机会在什么时间?
梅涛:时间我不敢百分之百确定,但是我觉得互联网行业有一点比较好的就是他的时间刻度非常小,几乎每半年或者几个月都会发生很多的事情、很多的变化,所以我首先乐观的认为这个领域里面目前的数据孤岛或者垄断状况不会持续太久。但是,到底多长,我现在也不太敢百分之百瞎定论。比如未来一年就会发生一些我们今年看不到的变化,我觉得这是一个我个人比较乐观的。
您刚才的第二个问题是契机,我觉得契机一定会出现在某一种具有开创性的应用上,这个应用不是app的应用,是某种数据服务的形态。对于我们来说,这是主要面临的一个任务或者使命,就是我们要针对移动互联网的发展特点,无论是在产品创新上还是服务创新上,去找到一些我们的目标客户,他们关心、他们需要的那些数据服务的应用点。(孙宏超)