科大讯飞语音合成系统 科大讯飞胜算几何



 

2008年,科大讯飞成立9周年,公司在深交所成功上市。但是另外两件不为外人所熟知的事情,对公司的长远发展却有着同样深远的影响。一是继连续三年在代表国际最高水平的Blizzard Challenge国际英文合成大赛上夺得桂冠后,讯飞首次参加由美国国家标准技术研究院举办的NIST国际说话人识别大赛,就获得了第一名。这意味着讯飞取得了从语音合成到语音识别技术的全面领先;另一个是讯飞成立了数码产品事业部,要打造面向教育领域的营销平台,这是讯飞“语音家庭风暴”战略的一个重要布局,对于一家一直致力于技术领先的公司来说,这将是一个大胆的尝试。

找到落地点

1999年,从中国科技大学拿到硕士学位的刘庆峰带领十几个同学校友成立了科大讯飞公司。读研究生时就带领科大语音实验室参加国家863项目比赛的刘庆峰,对语音技术广阔的应用前景充满信心,但一开始却并没有想要自己做公司。读书的时候,福建一家公司看到了语音合成技术的市场应用前景,出资买下了这项技术,聘请刘庆峰担任总工。一年之后刘庆峰发现,把市场和管理完全交给别人的做法与自己的预期大相径庭。“今天提一个想法,明天又换一个想法。失败了,也没有想清楚为什么失败。”作为一项市场应用还处于开发早期的技术,企业带头人对于技术的理解和对产品开发周期足够的容忍度很重要。

成立了自己的公司,刘庆峰和他的团队踌躇满志。2000年讯飞确定了公司的战略发展规划:第一步,要做全球最大的中文语音技术提供商;第二步,做全球最出色的多语种语音技术提供商。目标是产业规模过百亿元,成为行业的第一。当时的口号是“要做燃烧最亮的火把,要么率先燎原,要么最先熄灭”。然而现实中语音技术的应用,并没有如预期的那样有爆发性的增长,作为一个学生创业团队,在市场中的学习也才刚刚开始。

放弃个人用户 讯飞的创始团队,有当时号称科大“绝地战警”的黑客版版主,BBS站站长…,这些人热衷前沿技术,却不喜欢相对枯燥的产品开发。经过了近一年的刻苦研发,讯飞推出了语音合成、识别和手写结合的软件,在当时被业内认为是最好用的输入软件。然而,当时的讯飞没有任何市场推广和渠道建设经验,对目标用户的认识也不清晰。最有可能购买这种输入软件的是政府官员,但这些人对产品的要求很苛刻,售价几百块钱的软件,可能服务两次成本就差不多了。同时,这样的零售软件,又存在很大被盗版的可能性。最终,讯飞不得不痛苦地放弃了这个产品。

放弃行业用户 个人用户做不了,讯飞瞄准的另一个方向是当时欣欣向荣的电信的168信息服务台。利用讯飞的信息合成技术,动态性强的海量信息就不再需要提前录音,可以直接由文本转换成语音进行播报。电信部门觉得讯飞的技术不错,但最后的结论却是不敢用。“我承认你的技术好,但你们科大的学生,都喜欢出国。今天我用了你,明天你走了,我找谁维护去?!”刘庆峰回忆起当时电信的一个很现实的担忧。对于电信级的服务来说,可靠性和厂商的持续服务能力至关重要,而这是由十几个学生组成的讯飞所不具备的。

做供应商的供应商 个人用户和行业用户拓展相继失利,讯飞开始重新审视自己的策略。进入2000年第三季度,讯飞的技术在高交会上受到了华为注意,开始参加华为电信级产品的大规模严格测试。这才发现,从自己的研究院原型做出来的产品,距离华为电信级产品要求还有明显的差距。“当时由技术总监直接带队,吃住在办公室,连续奋战了一个多星期,最终通过了华为的测试”。在讯飞团队中最早开始负责市场,现任数码产品事业部总监的徐玉林回忆起那次的关键突破。自此,讯飞与华为建立了合作关系,向华为提供语音合成技术平台。同时也确定了公司向IT行业开发商提供语音引擎的产业链定位。这个策略的确定,使得当时的讯飞得以扬长避短,获得了生存的空间。

理想在现实中找到了落地点。

技术制胜

沿着这个策略,讯飞相继打开了包括电信、银行、证券、政府等多个市场。2004年,又在国内市场率先推出了应用于车载导航系统的嵌入式语音合成软件,打开了消费电子领域的新的市场空间。经过几年的积累,包括手机、学习机、车载导航等领域的领先厂商都已与讯飞建立了合作。有数据显示,讯飞的电信级语音合成技术在电信、金融、电力、社保、交通、政府等呼叫中心重点行业的市场占有率达到80%,而其嵌入式中文语音合成软件在学习机和国产手机中的市场份额超过80%,在导航产品中的市场份额超过70%。

建立广泛的各行业开发商的合作联盟,对于讯飞要把智能语音技术在国内进行产业化的目标,无疑是一个正确的策略。而支撑这一策略的是其强大的技术能力。

讯飞在1999年获得的第一笔融资,就用来建立利益共享机制,整合了国内在语音技术不同领域优势互补的研发资源,先后与中国科技大学、中科院声学所、中国社科院语言所及清华大学等研究机构成立联合实验室;并于2003年被国家863专家组、国家标准委、国家技术监督局确定为组长单位牵头制定中文语音技术的接口标准与规范,把握了标准制定和技术研发的产业制高点。

如何将核心技术转换成一个完善的产品,讯飞建立了三个梯次的布局。联合实验室倾向于技术的基础研究,讯飞研究院负责面向产品的应用技术研究,而讯飞各事业部的产品部门则负责把方案进行代码级的优化,变成完善的产品。

对于这个技术体系中最为关键的要素——人才,讯飞有自己独特的认识。作为讯飞核心人才的一个重要来源,科大毕业的顶尖学生,拥有出国或者去国际大公司的选择。IBM、微软在中国的研究院都有语音方面的研究方向。“把有可能成为国家栋梁的人变成国家栋梁”,讯飞研究院主持日常工作的副院长胡郁这样比喻讯飞的人才观。讯飞从成立伊始就确定并一直坚守的致力于把智能语音技术在中国进行产业化的使命,对于有创新和冒险潜质的顶尖技术人才而言,无疑是有吸引力的。尽早地帮助具备这种潜质的技术人才了解自己,了解不同的选择,从而能够做出清晰的决定,胡郁把这看作是自己的责任。从讯飞创立就加入,并且在中间由公司派到香港进修了两年,胡郁亲身经历过这个曾经困惑而后坚定的过程。除了联合实验室,讯飞还与科大合作成立了讯飞研究生班和软件工程硕士班,并建立了自己的企业博士后工作站。在这些地方,已经形成讯飞特色的研究和培养氛围,这些都是讯飞核心技术人才的摇篮。

回到消费市场

 科大讯飞语音合成系统 科大讯飞胜算几何

讯飞2008年的销售收入是2.57亿元人民币,年均增长在20%到30%之间。这对于一个IT行业的高科技企业而言,是一个并不能算高的增长率。对比讯飞的技术在各相关行业的市场占有率数字,说明语音技术的市场本身在国内还处在一个开发培育的阶段;另一方面,也说明,语音技术在这些行业中,还并非“重要价值”。“我只卖软件,假设一套卖十块钱,那么我做芯片,可能一套能卖50块钱,而如果我做整个产品,可能一套就卖一千多块钱。”刘庆峰打的这串数字的比喻说明了问题。

语音技术从大的方面分,包括语音合成和语音识别。语音合成,就是把文字变成语音,即所谓“会说”,而语音识别,则是把语音变成文字及相关信息,即“能听”。虽然已经建立了超过500家的开发商合作联盟,但严格说来,讯飞还没有形成类似于“Intel inside”那样的产业生态。语音引擎或芯片,目前对于这些开发商的产品或系统而言,还并非CPU相对于电脑那样是占据产业核心基础地位的要素。为了提高在产业中的话语权,加快推进语音技术应用的广度和深度,大幅度扩大产业规模,讯飞似乎又回到原点,针对量大面广且与合作伙伴不冲突的终端产品市场,开始自己进行最终产品的开发和销售。

面向行业用户提供“软件+服务”的整体解决方案,是讯飞进行市场探索的一个方向。比如,在电信运营商的电信增值服务领域,讯飞提供语音搜索(目前主要是音乐、彩铃/炫铃的搜索)整体解决方案,采取与运营商合作运营分成的商业模式。目前这一块的收入经过几年的积累,已呈现出高速增长的态势。

探索的另一个方向,是个人用户。讯飞相信,找到使语音技术进入千家万户的路径,是真正可以做大语音产业规模的战略方向。所以,讯飞提出了“语音家庭风暴”战略,而教育领域是讯飞选择的切入点。2008年成立的数码产品事业部,目前在力推的产品,是面向各中小学教师和学生使用的智能语音教学产品,这是一个包括软件、硬件和后台内容服务的完整的产品。而公司研发的“能听会说”的智能玩具,则将目标用户直接定在了亿万家庭的孩子身上。

直接向市场销售完整产品与只卖软件相比,在刘庆峰的比喻中,价值相差了百倍。但这个价值背后,是对企业更多能力的要求。在零售终端这个市场中,讯飞需要足够的市场运作能力和品牌影响力,这对以技术见长的讯飞而言,不能说没有危险。

选择了教育行业作为这一战略的切入点,可以看出讯飞经过了仔细的考虑。成立头几年讯飞就开始与国家教育部相关部门探讨如何把智能语音技术应用于基础教育领域,后来推出的普通话口语评测系统是目前唯一获得国家语委鉴定在十几个省进行试点并已开始在五个省(直辖市)正式使用的技术。对教育行业多年的理解和人脉的积累,为讯飞面向这一行业推出终端产品打下了一定的基础。智能语音教学产品在设计的过程中,反复征集了教育人士的意见,在功能上充分考虑了教师和学生实际使用的需求和体验。而讯飞推广这项产品的渠道是从教育部到各省的教育厅。推广几个月,全国已经有十几个省有了明确的合作意向,但距离实际订单,还有一定的距离。

推出“能听会说”的智能玩具,这个想法在讯飞已经酝酿了几年,但因为没有找到可以在市场上制胜的策略和资源保障而一直没做。今年讯飞推出了以卡通形象承载的智能语音玩具,目前在安徽本地做尝试性推广。关于讯飞的竞争策略,喜欢下围棋的刘庆峰做了个生动的比喻,“比方说这是一个棋子,假如我们想要,可能先在周围战略布局,布到最后这个棋子谁都认为非得拱手相让不可,不得不是我们的,润物细无声。”

从原来供应商的供应商,从原来的以技术为主要驱动力的企业向以市场和消费者需求驱动的公司转变,科大讯飞胜算几何?在结果出来以前,没有人能够给出答案。

采访手记

在人与战略之后

讯飞从99年成立后不久就确立了“宏伟蓝图”,到现实中在市场上艰苦的摸索,直到04年才达到盈亏平衡。期间的这几年,目标与现状的巨大落差对讯飞年轻气盛的团队而言是一个严峻的考验。“那个时候,企业就像每天都在流血,每个月都在花钱,但是我看不到钱从哪里来,或者偶尔来一单,第二天又不知道从哪里来。”刘庆峰回想起那时的艰难记忆犹新;而另一方面,背靠中国科技大学的讯飞公司,从成立伊始,就得到了当地政府的大力支持。

1999年创立公司时,只有300万的注册资金,很快就得到了几家地方国有企业的入股注资,资产迅速达到几千万。这种情况下,有人开始怀疑持续进行大规模技术投入却始终看不见收入的必要性,各种各样的想法纷至沓来。可以收购一些公司,迅速做大规模,或者,在刚刚兴起的国内资本市场上买壳上市,又或者,运用政府资源,做一些可以挣快钱的生意…诱惑摆在眼前。“大的产业方向有问题吗?没有。有人超越我吗,也没有。那么,就是需要时间去积累的问题。”这是刘庆峰自己当时对局势的判断。在艰难困惑的时候,人的因素起了作用,企业的发展方向没有发生偏移。

坚持技术领先,这个战略在讯飞至今的成长路径中非常鲜明。在这个战略的支撑下,企业在市场上摸索、尝试,经过不断的试错,找到了自己的市场定位,为其他企业提供好的技术和产品,而不是直接面对最终用户。随着在市场上的逐渐积累,面对产业发展还处在早期培育的现状,讯飞选择了尝试重新直接面对市场,企业的战略开始发生变化。

战略似乎没有对错,但要与企业彼时彼刻的实际情况相匹配。要落实一个新的战略,讯飞是否有足够的资源和能力来支撑,这是关键问题。谈到讯飞的语音家庭风暴战略时,刘庆峰提起当初索尼在市场成功创造了WALKMAN潮流的经典案例。“一流的企业满足市场,超一流的企业创造市场。”这是他给自己和团队提出的最高要求。不管这家技术主导的公司在未来的家庭语音市场上会有怎样的表现,目前来说它最需要的是尽快补齐自己在销售和品牌方面的短板。

  

爱华网本文地址 » http://www.aihuau.com/a/9101032201/327247.html

更多阅读

三分屏课件制作方法 ppt怎么与视频同步播放

  德威课件大师是一款真正的三分屏课件制作(合成)系统,是德威录播大师的有效补充(三分屏录制)。它能轻松基于既有的视频文件和PPT、DOC、网页、图片等讲稿文件,打包成三分屏课件样式,右边为网页格式。  课件播放时,右侧网页可实时

传奇1.85二合一雪域版 1.85皓月二合一

版本介绍:版本是根据盛大1.85版修改而来 无任何漏洞 无任何限制。。。可以直接开区[更新]宠物系统 。完美实现宠物功能 可以去领养 [更新]新添加几大活动和任务[更新]火焰婚礼 [更新]合成系统。。。完美实现 2 合 1 系统[更新]行会

经验分享Valve官方:DOTA与DOTA2的不同之处

Valve对Dota2制作是不同寻常的,整个游戏将会保持原有风格不变。从某种程度上来说,DotA2是现有dota的技术升级版。DotA中的100多位英雄正在逐步的移植到DotA2中。可以说DotA2和在魔兽争霸3上运行的DotA是极其相似的。物品,技能和升级路

声明:《科大讯飞语音合成系统 科大讯飞胜算几何》为网友紫海棠开暖冬天分享!如侵犯到您的合法权益请联系我们删除