截至7月12日,科大讯飞(002230.SZ)在苹果App Store上传的智能语音软件“讯飞语点”依旧处于“Waiting For Review”(等待审核)状态。
“讯飞语点6月20日提交,苹果一直到7月5天日通知我们被拒绝上架,理由是我们没有提供该App在使用中的视频。”科大讯飞副总裁江涛告诉记者,一般苹果的应用仅需7-10天就上传成功。
7月9日上午,科大讯飞又按照苹果的要求拍了一段视频继续上传讯飞语点。讯飞方面怀疑,苹果可能是为其中文版Siri让路,从而拒绝掉同类第三方产品上架。
7月11日,记者就讯飞语点在苹果App Store被拒一事向苹果中国区公关部致信询问,截至发稿时尚未收到回复。
讯飞语点是一款针对个人用户的智能语音手机软件,可以实现语音控制打开网页和程序等功能,和Siri很类似。此前,虽然已经拥有讯飞语音输入法等B2C产品,但科大讯飞主要收入仍来自B2B的行业应用。该公司刚刚预告其上半年盈利将同比增长40%-50%,也是得益于其语音识别技术在全国各个行业的大面积应用,尤其教育行业。据了解,由于技术领先,讯飞语音产品授权费用卖得很贵。
苹果商店受阻
在此之前,讯飞在Android操作系统上推出了“讯飞语点”。讯飞副总江涛指出,之所以率先选在Android系统上线,是因为Android系统更加开放,能实现多任务调取,而苹果iPhone(参数图片 样张 评测)版有许多功能被迫被放弃。
一位刚刚去讯飞考察过的某知名投资机构副总裁向记者分析,即使讯飞的产品进入苹果App Store,一样面临苹果Siri的巨大竞争,因为苹果将Siri集成在操作系统底层,它可以和其它苹果应用深度绑定。
未来将语音识别植入到手机系统底层是大势所趋,苹果、谷歌都已经动手。除此之外,国内的一些手机Android ROM厂商也在开发类似产品,把语音技术植入到操作系统深层。相比之下,讯飞的B2C手机软件产品更多做成一个App,例如讯飞语点、讯飞输入法、开心熊宝。
江涛表示,讯飞也试图将自己的语音技术卖给苹果,但由于种种原因未能如愿。苹果目前用的是全球最大语音技术公司Nuance的产品。按照讯飞的说法,在中文识别技术上,讯飞要强于外来的Nuance。
“我们和苹果的利益是一致的。”江涛指出,因为苹果最核心的价值点还是在出售iPhone硬件上。他认为,讯飞语点能让苹果用户获得更好的体验从而带动苹果硬件销售。江涛表示,苹果的Siri进来对讯飞是好事情,“苹果的市场教育能力是我们不能比的”。
江涛指出,在盈利模式上,讯飞的B2C业务基本走互联网的路线,而互联网所有的产品基本特征都是要形成规模用户,再根据服务的特点才形成价值。但他表示目前还不便透露具体的盈利模式,但公司已经有较多的规划。
一家同样在将语音技术用于B2C领域的某移动互联网公司高管则分析,目前移动互联网的变现链条太长,更多的是作为长线的布局,因此这块业务短期内不会为讯飞带来直接的收益。
对手入场
“讯飞的业务,主要分为语音引擎和语音合成两块。”一位不久前刚刚去讯飞考察过的某知名投资机构副总裁指出,目前讯飞的主要收入多来自语音合成这块,语音引擎的收入刚刚开始。
语音引擎是将人讲话的声音识别出来,而语音合成则是用电脑模拟真人的说话。在语音合成方面,讯飞在国内具有绝对的领先地位,而在语音引擎方
面,讯飞可能面临{词语被屏蔽}公司的竞争。语音引擎技术的关键在于算法和数据采样。在算法上,国际上已经有许多公开的资料、文献,大家的水平差别不会太大。
真正奠定讯飞在语音引擎领域江湖地位的,是其国内最全的语音数据库。由于讯飞的产品最先在国内大规模商用,因此相对于其它几家的语音产品,讯飞的引擎在国内应用的范围最广、用户最多,这让讯飞积累了丰富的用户语音数据——这些数据库可以让讯飞的语音识别更加准确。
“等到讯飞的语音数据库积累到一定程度,数据就饱和了,就不会对其体验改进起到什么新的作用,反而会加重其数据处理负担。”国内一家语音识别企业的高管指出,其它语音识别厂商的技术正在逐步追赶上讯飞,届时有望打破讯飞在这一领域的垄断。
对此江涛强调,尽管竞争对手在追赶,但讯飞自己的语音技术也在不断迭代发展中,讯飞对自己在技术上的领先抱有信心。
上述投资人近期曾挨个调研过国内主要的语音识别企业,他认为北京的纳象立方和另一个从盛大出来创业的团队都可能是讯飞的强劲对手。
其中北京纳象立方已在业内小有名气,该公司由松禾资本投资,纳象立方的技术在电视台等媒体中应用广泛,中央电视台和北京电视台都是其客户,主要用于电视台便利地进行字幕制作,该公司也有较强的技术积累。
另外一个从盛大出来的团队的技术实力也很强。这个团队此前在摩托罗拉进行语音技术的开发,其负责人名叫黄伟。摩托罗拉的语音识别团队曾经在业内有很高的地位,但在金融危机期间,摩托的整个语音识别团队被卖给了Nuance——全球排名第一的语音技术供应商。
黄伟于2009年7月加入盛大网络旗下的创新院,并于2010年10月创建了语音分院。2010年五月,他带领团队参加由美国国家标准技术署主办的“声纹识别评测(Speaker Recognition Evaluation, SRE )”大赛,取得综合排名第一的好成绩,力压美国麻省理工、斯坦福等名校和机构,并在一些国际比赛中力压科大讯飞。
但在此后,黄伟由于种种原因离开了盛大创业,他带领的这一团队在投资界估值非常之高。有消息称,黄伟的团队近期刚刚获得某上市公司CEO的投资。
上述投资人指出,在B2C业务上,讯飞的真正对手可能是国内的互联网公司。不管是腾讯、百度还是盛大,都非常重视语音这块业务。
2010年,腾讯宣布2亿打造合肥研发中心,此后又成立了全资子公司合肥世纪讯微,开发和讯飞类似的语音技术。知情人士透露,该公司的办公楼就在讯飞斜对面,并已经从讯飞挖走了几十号人。在利用语音技术通过互联网变现方面,腾讯、百度等显然有着更丰富的经验。
“我们和国内的主要互联网公司都有合作,主要是卖授权的方式。”江涛强调,讯飞和互联网巨头之间是合作关系。