IBM正在设计一款新软件,希望藉此成为商业搜寻技术中的Google。
蓝色巨人(Big Blue)已经暗中在设计一款数据储存软件,预计可大幅改进公司企业寻找分散于网络上的各种商业文件的效率,IBM信息管理事业群总经理Janet Perna表示。
新的软件,再加上IBM原有的其它信息撷取产品,也显示出IBM已经全力从低毛利的硬件(特别是PC)产品转向高毛利的软件和服务。此举也意谓着IBM从关系型数据库(relational database)厂商转型为全方位的信息管理软件供货商,Perna表示。
「我们从关系型数据库的基础逐渐成长起来,」Perna表示「企业所要的不只是储存与管理之用的信息基础建设,他们还需要搜寻与存取所有的信息。」
新的数据库相关软件将让企业客户以XLM格式储存文件,她表示,这将大幅加速文字式的查询速度。该版软件的alpha版,或者是初期的测试版工具,已经有30位客户开始在测试,可望在明年下半年开始加入市场竞争。然而IBM尚未帮这款产品取名,也未决定如何包装销售。
关系型数据库是企业在储存记录及交易等数据的重要支柱,但是企业的数据大概有85%是以所谓的「非结构性数据」(unstructured data)方式在储存,例如文书处理档案,XML文件,及图档,Perna表示,这些资料很难定位。
IBM透过收购及大笔的投资,暗中要成为搜寻技术的领导厂商。其搜寻事业的目标是为企业网络建立一种简单的查询,让它像在因特网上使用Google或Yahoo一样的简单。
这个想法也吸引了川崎重工(Kawasaki Motors)的数据管理及信息存取服务经理Victor Martinez。在看到网络搜寻引擎的成功之后,Martinez认为,搜寻工具可以让公司内的员工更方便的做好信息的处理,特别是商业报表。
「每个人都对诸如Google及Yahoo一类的搜寻功能相当熟悉。所以,我们的愿景是要以同样的方式来撷取企业的信息。」他表示,「而我们将会成功,是因为这不需要任何的教育训练。」
往往,公司的员工是透过口头告知而知道商业报表,或者可能是被要求制作一份已经写好并储存在公司服务器内的报告,他表示,透过搜寻既有的报告,将可加速许多流程,并减少可能的浪费。
但在扩张这块领地时,IBM可能与微软及Oracle(甲骨文)直接竞争,同时还有一些专门做企业搜寻,如文字撷取的小厂,分析师认为。
甲骨文将在周三发表多年来在内容管理上的发展成果。Oracle Files 10g可望让甲骨文将势范围扩张到数据库市场之外,这项产品设计是为了要协助企业客户储存、管理,最后还可搜寻所储存的文字数据。
微软在搜寻方面也相当积极,并正在开发一种所谓的WinFS的档案系统。同时微软也在销售内容管理软件,为MSN入口网站所开发的网络搜寻引擎也要与Google及Yahoo一较高下。
另一方面,一些较小型的专业公司也已经有文字储存及撷取软件,可以让企业搜寻企业网络内的数据。这些商用的搜寻公司包括了Verity、Autonomy、Fast Search & Transer,以及一些新创公司。
企业网络的搜寻比因特网的搜寻还要复杂很多,虽然它的数据量相较之下非常的少。通常,企业信息是以各种不同的格式(如电子表格、PDF、HTM网页,甚至多媒体文件)储存在各个不同的地方。同时,企业客户要求要有可靠的储存系统,如数据库,还有协作工具,安全,甚至是法规相容的追踪。
另一个重大的不同点在于,企业搜寻需要有更聪明的功能,如从各种不同的信息来源做信息的搜集和关联。
IDC预估,企业搜寻市场在2003年的规模大约是6.2亿美金,比前一年显示出相当稳健的20%成长率。IDC分析师Feldman表示,由于许多企业信息管理公司的纷纷投入争食这块市场,因此传统内容管理软件厂商与专业的搜寻及文字撷取厂商不免要狭路相逢。
「原本内容管理及搜寻厂商彼此很快乐的共存。但现在,我们开始看到两块市场在统一了。」Feldman表示。「这一块新兴的信息基础建设市场就是IBM还有甲骨文等厂商想要跨入的。」
IBM已经透过收购及研发实验室的调整而在重整内容管理及搜寻产品。IBM大约有300名研发人员投入了搜寻的相关技术。
WebFontain就是一项要改进文字比对搜寻公式的计划,同时要以文句中文字的比对来找出更多文件的意义。此外还有一款Marvel的搜寻引擎原型,甚至可以找出影片剪辑中的特殊句子。
走出实验室
一些实验室中的计划,如WebFountain已经开始成为产品。另一个计划Cinnamon,将可改进IBM DB2内容管理的XML文件处理,可望在明年上半年更新。
IBM在今年稍早之前DB2 Information Integrator(信息整合器,代号Masala)出货时就已经开始在企业搜寻市场尝试水温。这款数据库的外挂功能让商业人士可搜寻不同的数据源。IBM已经签下初期的客户,并把Masala用在其内部入口网站上做文件式的搜寻。