略懂 搜狗 让搜狗更懂网络



  —H3C助力搜狗新一代数据中心网络建设

  本刊记者  雷婴

  互联网行业一直走在科技最前沿,总能引领科技浪潮并因此深刻改变人们的生活。如今,在普通民众日益依赖搜索功能后,一场更为激烈的竞争正在互联网企业中展开。

 略懂 搜狗 让搜狗更懂网络
  对于搜狐来说,如何在强手如林的搜索引擎市场占据有利地形,是一个必须解决的重要命题。而这个命题的重担就落在了名字颇有寓意的搜狗(www.sogou.com)身上。

  中文搜索前三甲

  搜狗是搜狐于2005年推出的全球首个第三代互动式中文搜索引擎,包括网页应用和桌面应用两大部分。据CNNIC(中国互联网络信息中心)刚刚发布的《2009年中国搜索引擎用户行为研究报告》显示,2009年搜狗的首选用户新增率为41.2%,在所有搜索品牌中用户新增率最高,搜狗的品牌渗透率为26.9%,紧随百度、谷歌之后居第三位。从“用户首选搜索引擎”、“用户二选搜索引擎”两个指标的数据综合来看,在全国市场的网民选择中,搜索引擎的排位应该是百度第一、谷歌第二、搜狗第三,这也被广泛认为是目前为止针对中文搜索引擎相对科学的排名。

  另外,基于搜索引擎技术的搜狗输入法目前也已经占据了超过70%的市场,成为输入法领域的佼佼者,结合第三方相关数据以及搜狗5年来的积累与沉淀,这表明快速成长的搜狗已经跻身于中国三大首选搜索引擎之中。

  互联网行业竞争激烈,能否得到更多用户的认可是企业生存的根本,而被用户认可的关键就在于服务是否及时、优质、准确,这些特质在“搜狗”的搜索服务上表现尤为明显。搜狗深知搜索引擎的最大难题是正确理解与满足用户的需求,正是这种以“用户需求为导向”的发展理念使得搜狗不断优化产品体验、提高技术能力,力争做中国最有特色的搜索引擎。

  不断求“新”

  出色的网页引擎,必须基于一个强大的数据中心来完成,而增强数据中心的效能,就成为提高用户满意度的关键要素。因此,搜狐启动了搜狗新一代数据中心项目的建设,希望通过利用技术创新,提升搜狗的产品品质,从而赢得用户的青睐。在这一过程中,H3C提供的高性能、高可靠的新一代数据中心网络解决方案,成为搜狗迈向未来的坚实基础。

  自2007年搜狐正式推出搜狗网页搜索3.0版本之后,搜狗搜索引擎的中文网页收录量至今已达一百亿之上,每天的网页更新量则有5亿之多。激增的海量数据对搜狗数据中心带来了前所未有的压力。新的搜狗业务应用要求数据中心网络平台能支撑百亿海量网页收录、及时网页更新和网页评级体系,满足高密度服务器集群的高性能并行抓取,同时网络系统要能满足后期灵活的扩展能力。面对超高的网络流量与数量庞大的服务器集群,原有的搜狗数据中心网络架构与设备性能已无法满足这一要求,采用新一代数据中心架构来建设搜狗IDC新机房成为必然的选择。

  最终,搜狐选择了H3C集S12508数据中心级核心交换机、S75E高端多业务路由交换机、S5800万兆交换机、iMC智能管理中心等软硬件设备为一体的统一交换架构数据中心解决方案,搜狗新一代数据中心网络建设的大幕也由此拉开。

  让“浪涌”不再是问题

  在搜狗数据中心网络体系中,两台H3C S12500交换机是整个网络的核心,同时,两台S75E高端多业务路由交换机承担着数据传输网的重任,而数十台S5800交换机则作为接入交换机,负责将两千多台服务器连成一个大的网络。

  作为国内首款100G平台交换设备,H3C数据中心级核心交换机S12500具备超大交换容量、高密度的万兆端口以及高级别的包缓存能力等特性,很好的体现出了数据中心高密度、大流量和大缓存的特点,能够充分满足搜狗数据中心高密度万兆应用的需求。

  网页搜索的搜索速度与结果准确性依托的是系统在瞬间对海量网页数据进行挖掘、分析、显示的结果,在这一过程中,数据中心网络承担的带宽压力非常大。当搜狗引擎接收到一个网页搜索请求时,往往会向高密度服务器群同时发起检索需求,并在非常短的时间内接收几百台服务器几乎同时发回的搜索结果,巨大的数据浪涌如果不被及时吸收,将很容易出现网络拥塞的现象。

  S12500的大缓存能力很好地解决了这个问题。不仅每个端口拥有256M的大缓存能力,更重要的是它支持分布式缓存机制,有效地利用了各级设备的端口缓存能力,最大限度地吸收突发流量,减少了丢包的可能性,尽可能地减少了对业务的影响,将每次浪涌的收敛时间都控制在几十毫秒之内。对普通用户来说,这意味着搜索结果中的死链接也会更少。

  创新架构的价值

  搜狗数据中心网络架构还采用了H3C推出的IRF2(第二代智能弹性架构,Intelligent Resilient Framework 2)技术,也就是把多台物理设备互相连接起来,使其成为一台统一的逻辑设备。在具体应用中,S12500只需要10个端口就可实现40个万兆互联。这使得搜狗数据中心网络具有了良好的可扩展性,日后进行网络扩容时,可直接利用其他多余端口,而无须额外投资。

  一直以来,搜狗数据中心网络往往采用传统的环路设计,这种设计会造成一半左右的网络带宽必须给环路让道,带宽利用率低,环路堵塞链路的问题,而且在维护上也容易形成广播,致使整个网络堵塞甚至中断,而搜狗引擎业务也会随之中断。

  如今,采用了IRF2架构双机互联的两台核心交换机S12500则避免了这些问题的发生:通过MSTP+VRRP+BFD的组网方式,去掉了令人烦恼的“环路”。这意味着不仅网络运维更为简单,不会出现环路故障,而且整个网络在不增加投资的情况下,可利用的带宽较之以前增加了一倍。

  在搜狐对IRF2性能的实际测试中,无论是S12500内部双引擎的主备倒换,还是链路级的倒换,系统的恢复时间都小于30毫秒。也就是说,即使针对网络连续性要求高达50毫秒的延迟敏感型应用,网络的稳定性也不会对业务产生不良影响,显然,这有利于搜狗业务的进一步发展。

  “正是因为IRF2技术可以让整个网络的扩展性更好,而且ROI投资回报率更高,为搜狗业务的未来提供了坚实的基础,所以我们对H3C提出的解决方案也更为满意。”搜狐网络运维部总监×××表示。

  在数据中心应用领域,互联网企业由于其业务特点,一直走在应用的前列,他们的选择往往代表着市场的“风向标”。在搜狗引擎业务方面,搜狐一直有一个口号:“搜狗—更懂网络”。从实际效果来看,H3C新一代数据中心解决方案不仅保障了搜狐现有业务的连续性,满足了搜狐不断增长的业务带宽需求,同时,面向未来也可以承载不断涌现的新业务,让搜狐在激烈的搜索引擎市场竞争中,真正做到“搜狗—更懂网络”。  

爱华网本文地址 » http://www.aihuau.com/a/9101032201/238942.html

更多阅读

怎么才能让QQ升级更快 qq怎么能快速升级

怎么才能让QQ升级更快——简介我想现在有很多人郁闷一件事,为什么我每天都在挂QQ,可为什么升级这么慢?别人币我晚申请一年的时间居然都能赶上我,殊不知QQ升级有好多种方法,如果全都用上,那等级上升的速度真的是:飞一般的感觉啊。怎么才能

声明:《略懂 搜狗 让搜狗更懂网络》为网友傲剱紅塵分享!如侵犯到您的合法权益请联系我们删除