经过十几年的发展,数据标准成为一个重要且急迫的问题摆在中国互联网面前。
本刊记者 方洋
2008年2月的某天,一家视频网站的老总习惯性的打开Alexa,震惊的发现自己网站的排名被清零了。 其实,中国互联网已经习惯了Alexa时不时的“清零”袭击。只是这一次“清零”的规模堪称空前,包括优酷(www.youku.com.cn)、酷溜(www.ku6.com.cn)、MOP、阿里巴巴(www.alibaba.com.cn)、56、大旗在内的知名网站无一幸免。 而在这一些列清零事件的背后,反映的是Alexa在中国互联网畸形的神话般地位。Alexa,这个靠分类导航网站起家、通过用户安装的AlexaToolbar软件来监测用户的上网行为的网站,是全球最知名的流量排名服务网站,并进而成为众多广告主和投资人评估网站媒介价值或投资价值的参考指标。 尽管Alexa仅靠到达率(ReachPoint)和页面浏览量(PV)的排名方法受到诸多人质疑,尽管诸如张朝阳等业内大腕宣称早就不看Alexa排名了,但在更好更普及的标准缺位的情况下,大多数中国互联网公司仍然生活在Alexa的达摩之剑之下,更有不少公司使用各种优化手段,最终遭遇清零的厄运。 如果没有Alexa,中国互联网怎么办?经过十几年的发展,数据标准成为一个重要且急迫的问题摆在中国互联网面前。 千呼万唤始出来 3月1日,北京新闻大厦。曹国伟、丁磊、张朝阳这三大门户的掌门人难得一见的同时亮相。除此之外,雅虎中国(www.yahoo.cn)、百度(www.baidu.com.cn)、谷歌(www.g.cn)的高层也悉数到场。因为谁都不愿意错过一个由政府牵头的制定互联网数据标准的大会。 “互联网进入中国已经第十四个年头的时候,我们坐在这里开始讨论制定网络数据的标准,”北京市互联网宣传管理办公室常务副主任席伟航感叹道,“这么多年来,我们的网站一直没有一个统一的权威的公正的标准。”张朝阳也用“千呼万唤始出来”形容这次会议。 数据标准的重要性不言而喻。中国人民大学新闻学院常务副院长高钢认为,“无论是信息提供者还是信息运用者,都有一种高度的渴望,我们必须了解整个信息世界的情状。”对于积极牵头的政府部门来说,需要数据对行业进行宏观调控;而对于参会的广告公司和投资商来说,需要数据进行广告投放和投资,学界则需要数据进行研究。 “如果每个网站都只认定自己的数据标准和数据体系,而不能形成一个公正权威的被互联网界认可的数据标准的话,那我们就会陷入到内耗内斗之中,让行业的发展进入恶性循环。”席伟航说。 而与数据标准关系最为密切的莫过于互联网广告投放。中国广告协会秘书长时学志告诉记者,他去英国考察时发现,英国互联网的广告额已经超过了电视的广告额,而中国互联网广告额尚不足20亿,这与互联网数据调查的滞后不无关系。 新浪(www.sina.com.cn)CEO曹国伟说,各家都有自己的数据系统,所以互联网广告至今没有建立起一套标准化的广告体系,广告的规模化效应也受到束缚,这是互联网广告发展的一个重要瓶颈所在。 迟到的标准 数据标准如此重要,但为何中国互联网的数据标准迟迟没有建立起来? 张朝阳告诉《互联网周刊》,为了标准,有很多竞争和争吵,这么长时间没有建立一个标准,也说明了这件事情的挑战性。在曹国伟看来,标准迟迟不能建立的一个重要原因就是缺乏一个权威公平公正能为各方都能接受的第三方调查机构。 但是,谁能做到“权威公平公正能为各方接受”呢?张朝阳说,“因为数据太重要了,中国互联网这么大的规模,广告商把广告投在哪里,投资商把资金投给谁,数据背后是巨大的资金流动,所以有很多力量在左右,面对如此多势力的影响,很难做到权威公正公平。” 这时,政府走到了前台。 席伟航明确表达了官方的观点——“不欢迎国外的数字机构进入这个行业,因为会威胁到我国互联网的数据安全和竞争优势”,而“欢迎和支持有中国特色的数字机构进入这个市场”,这一下子就把Alexa、AC尼尔森(www.acnielsen.com.cn)等境外数据调查机构排除在外。 “由网宣办主持,由一个专业的数据调查公司来做这件事情,可能是一条新的路子。”张朝阳说。他认为,在所有的国家机构里,网宣办对互联网的理解是最深刻的。 解决之道 对建立标准的渴望,不仅出于维护国家安全这样的简单逻辑,也来自对目前互联网数据统计方法的失望。政府力推的数据调查公司之一—缔元信调查公司CEO秦雯直截了当的说:“过去的很多统计方法都过时了”。 由于早期互联网网页多为静态的数据页面,用户每次需要向服务器发出请求获得页面的信息,因此传统的互联网流量统计的一个最基本也是最重要的衡量标准就是统计单个页面的浏览量。 而随着互联网技术的发展,特别是新的网页开发技术Ajax、RSS以及各种插件的流行,人们可以在一张网页上就可以浏览地图、订购商品、与人对话,还可以订阅自己喜欢的网站内容和文章,根本不需要打开数个页面进行,甚至不必直接访问网站就能获得相关信息,比如通过内嵌到网页的对话框、小程序来读取信息。 秦雯告诉记者,大部分网站还在运用PV对编辑的工作进行考核,有的编辑为了增加PV量,采用一个很简单的方法,把一篇哪怕只有500字的短文也分成三页发,虽然PV上去了,但对企业的运营效果并没有正面作用。 她认为,对网站运营效果不宜采用单一指标进行评估,要综合多项核心指标考量,才能真正帮助网站提高自己的运营效果。 同时,不同业务类型的网站需要不同的评价标准,因为不同类型的网站在数据表现上是完全不同的。她发现,一家社区型网站和一家资讯型网站在Alexa的排名和自己进行的全样本采集得出的排名是完全相反的。因此,缔元信的万瑞数据平台有媒体版、视频版、社区版等针对不同网站的版本,目前正在研发博客版和网络广告版,未来还会做IM版。 数据标准被正式提上议程,燃起了互联网业界的极大期望。但张朝阳也表达了自己的担忧:大多数数据监测的方法是在网页的页面上嵌入代码,现在门户网站的页面非常复杂的,流量也特别大,每次访问都是跟代码的一次沟通,这导致网络公司的压力特别大,需要增加很多服务器和人力来应付这样的监测。 而新的标准还会面临一个永恒的难题。在各大互联网公司网罗了中国最顶尖的软件技术人才的情况下,最终谁能够魔高一场道高一丈?