科极网 - 鲜活的科技创新资讯传播平台,一个关注互联网前沿信息的综合媒体 2024年03月29日,星期五
当前位置:首页 / 物联网 / 正文

百度阿里腾讯进入语音识别 这家创业公司押宝物联网对抗巨头

来源:互联网

2016年3月,围棋人工智能程序AlphaGo击败李世石,再次引发人工智能关注热潮。“坐了十几年冷板凳”的云知声CEO黄伟,顺着物联网兴起的兆头,也许迎来语音识别最好的发展时机。

云知声CEO黄伟

云知声CEO黄伟

2003年前后,这个行业曾经经历过一次高潮,因为语音识别实验室识别精确度达到90%以上水平,大小公司蜂拥而至。2005年全球领先的语音识别公司Nuance上市,市值最高突破90亿美元。2008年,科大讯飞(002230)上市,国内市场占有率一度占到70%以上。

但是,只有极少数公司在这一波浪潮里突出重围。语音识别在实际使用场景精确度降到很低,短时间内技术解决基本无望。大公司纷纷关闭语音识别相关部门,热潮不过昙花一现。

平台化实现弯道超车

移动互联网的兴起、机器深度学习(AlphaGo的主要工作原理)的发展,让语音识别再次呈现上升之势。苹果2亿美元收购Siri Inc.公司,2011年发布Siri语音助手。同年,谷歌连续收购语音通信公司SayNow和语音合成公司Phonetic Arts,亚马逊收购语音识别公司Yap。

2012年6月,梁家恩创立云知声。这个时候,科大讯飞已经在国内语音识别市场筑起了深厚的壁垒。要想实现弯道超车,梁家恩想得很清楚:第一是算法;第二是数据。如果算法是引擎,那么数据就是燃料。哪怕算法得到极大提升,如果没有油的话,车还是跑不起来。

左起:云知声董事长兼CTO梁家恩、云知声CEO黄伟

左起:云知声董事长兼CTO梁家恩、云知声CEO黄伟

梁家恩决定做开发者平台。对于一家创业公司而言,平台包袱无疑很重,团队也有过纠结。“我们必须把平台先做起来,让市场看到云知声的能力。”语音识别技术最关键的是先要有充足的语料积累,不光是找人去录语音,更需要用户真实的数据。而做平台能够在短时间内完成大量的语音数据积累,以实现弯道超车。

淘宝上买机器、普通游戏显卡,10个人不到的工程师团队,自学深度学习算法,3个月平台上线。

“没有人想到这样一家刚成立的小公司真的能做出来。”云知声董事长兼CTO梁家恩现在说起来还颇为得意。2012年9月云知声发布的语音平台,当时精确度只能做到85%,如果真正应用到实际场景,甚至会降到60%。到2013年底,语音数据已从最开始的800小时积累到3000小时,精确度提高到95%,平台上的开发者大大小小已有8000多家。4年以来,云知声开发者平台每年保持400%的增长量,目前每天调用量在1.5亿到2亿次之间。

平台也打出了云知声的名气,语音识别技术在人工智能领域相对成熟,这家公司开始考虑商业化。一开始,他们就选择了从B端切入。云知声CEO黄伟始终认为,在人工智能领域,B2C在中国很难实现,这也是黄伟一直坚持不做单品的原因。

和搜狗合作,云知声一战成名。

当时搜狗和百度都在抢时间点,想率先发布语音助手。但搜狗本身并没有这部分技术,将市场上各家的产品一一测试,综合价格因素,一周时间便与云知声达成合作。

小i机器人(300024)也是云知声早期的客户。对方给银行提供服务,之前都是文本,后来逐渐拓展到语音领域。科大讯飞是它当时的服务提供商,收费很高,小i机器人便找到云知声。云知声以相对低的价格拿下客户。

黄伟说:“在市场、技术不成熟的前提下,过高的使用门槛无疑是杀鸡取卵。”

和乐视的合作,除了技术上的相对优势以外,乐视当时也处于起步阶段,而科大讯飞更愿意围绕运营商来提供服务。当乐视自身尚没有证明自己能力时,科大讯飞相对是保守的,这就给了云知声机会。

云知声早期合作公司多为互联网公司,他们更敢于尝试新的东西,快速迭代。传统公司相对保守,除了产品本身好坏,出身等其他因素也会被纳入考量。

“在云知声规模还很小的时候,对于客户而言,如果选择大厂商,出了问题是大厂商的责任。但如果选了云知声,出问题的话,决策者自己需负很大责任。”黄伟告诉“”。

2013年初,先后供职摩托罗拉中国研究中心、Nuance,一手创立盛大语音创新院的黄伟加入云知声,担任CEO。“从读书的时候开始,之后10年工作,我终于等到一个可以放手去做这件事情的机会。”黄伟穿着深绿色衬衣,牛仔裤,戴着无框眼镜,头发抓得一丝不苟。谈话之间偶尔取下手腕上的佛珠拨弄。

“商业上的技巧我们确实吃过很多亏,我们不是商务驱动型的公司,最开始就是拿产品过去,实打实地测试,比识别率、比响应速度等。”

差异化赢得时间

云知声IoT事业部副总裁康恒说:“平台给云知声带来的另一个收获,我们得以发现市场所聚焦的需求。通过不同行业用户在平台上的使用频度,能够精准捕获市场需求。”车载、家居、医疗和教育,是云知声的四大重点领域。

2014年,市场上已有汽车厂商将安卓系统和车载设备相结合,黄伟隐约看到车联网的兴起之势。很快,云知声成立专门的车载语音技术团队。

从整个车载语音设备行业来看,前装市场规模大,但产品周期长,且科大讯飞深耕已久。后装市场满足用户购车后的个性化需求,市场规模小,但少有入局者。

当时的后装市场鱼龙混杂,大大小小的厂商遍地都是,质量良莠不齐。黄伟也是摸着石头过河,只能一再谨慎,尽可能选择优质厂商合作,采取统一授权以减小风险。

截至2016年上半年,云知声车载行业的产品激活量近两百万台,收入规模达千万级别。

智能家居是云知声的又一重镇。

随着物联网概念的兴起,几乎所有的家居厂商都在探索智能家居的未来。语音识别在智能手机上的应用并不是刚需,触摸已经能够解决大部分的应用场景。对于鲜少拥有触控屏幕的家居产品,语音交互很快成为厂商间的共识。

早在2014年,云知声和一些家电巨头就有过接触,但先期落地的产品主要集中在创业公司。这些创业公司希望生产一些智能化的产品,虽然量都不大,云知声技术团队仍全力配合开发,不断试错,打磨技术。

“2015年,我们在家居行业的策略是和小公司玩;从2016年起,我们也要和巨头共舞。”黄伟说。

美的一直看重智能家居,尤其空调这个单品,从2012年起便不断寻找智能化解决方案,和科大讯飞、韩国Powervoice都有过合作。

2014年底,云知声开始和美的接触。对方要求明确:第一、用户直接通过语音方式控制空调,且不受噪声影响;第二、一定距离的远场语音交互得以实现;第三、方案成熟,成本控制。

远场语音交互是关键中的关键。

当时市场上普遍解决方案都是八个麦克风收音,虽然语音识别准度得以提高;但能耗、安装等问题却接踵而来。

云知声团队做了大量先期工作,发现像空调这类产品,它永远都是贴墙放,八个麦克风在实际应用上是多余的。云知声提出双麦克技术,两个麦克风间距不过三厘米,在任何产品上均可自然适配,即插即用。

一下少了六个麦克风,如何保证远场语音交互能达到测试要求,云知声花了一年半来解决这个问题,2015年底投入生产。

2016年8月1日,美的智能语音空调正式发布。

从2015年开始,云知声涉足医疗领域。2013年前后,云知声就想往医疗方向发展,初步接触下来,当时的时间点太早,需求尚没有爆发。

语音识别在人工智能各领域中虽然相对成熟,但远没有到顶。除了高度的提升,广度则是所有语音识别厂商需要发力的领域:比如特定行业的语音识别、歌曲识别、方言识别等。像之前在线上语音识别精确度能达到96%,当落实到和医院合作时,精确度急剧降到60%左右。

云知声销售杨拓刚开始做医疗客户时,也很不适应:医学里有大量专业术语,在日常生活中是鲜少应用。如何保证系统知识库既能准确识别日常对话交流,同时又能对这些专业术语进行分辨,平衡很重要。

当时客户需求反应过来,团队马上根据不同科室,短时间内人力收集专业信息,同时辅以机器学习,通过大量医疗数据积累推动算法提升。经过跟医院场景和医学术语的深度定制,语音识别的精确度提升至95%,部分科室经过优化达到98%。

2015年底,云知声的语音识别服务在北京协和医院四个科室上线使用,2016年起全院推广。“最开始我们确实会选择一些相对竞争不那么充分的领域先行切入,但我们不会为了回避竞争,而选择一些根本不存在的市场。”黄伟说。

Nuance在医疗市场,光美国一个国家的年收入就接近20亿美元。

押宝芯片深耕物联网

2015年,亚马逊推出家用智能音响Echo,被视为目前语音识别领域最出色的实体产品,依托亚马逊平台,2016年上半年,出货量300万台。

微软推出小冰,百度将语音团队独立,阿里巴巴将语音识别技术全面应用在阿里云系统上,腾讯智能语音服务系统也上线。

这一波人工智能热潮里,巨头们纷纷入场。

黄伟相信语音交互一定是人机交互最自然的形态。前端语音交互提供入口,后端互联网提供服务。只有二者充分的结合,才能为用户带来更多价值。

百度阿里腾讯进入语音识别 这家创业公司押宝物联网对抗巨头

而“云端芯”则是在这一轮语音交互竞争中黄伟的希望所在:云是线上平台,沉淀大量基础数据;端最开始是智能手机,现在已全面向物联网迁移;芯片则是云知声所有技术和服务的载体。

早在2014年底,云知声完成来自高通的5000万美元B轮融资后,便开始发力芯片领域。对于物联网而言,终端对功耗非常敏感,市场上现有芯片往往搭载很多不必要的功能,标准程度、稳定性达不到要求。

芯片的设计、制作困难重重。云知声之前和一家公司合作,当时在产品部门测试全部通过,结果到了工厂,实际操作中不适配。工厂的生产是有排期的,如果一定时间内不能测试通过投入生产的话,整个产品线都要延期。对方给了两天时间,云知声的工程师直接驻厂,一边不断调试一边和对方沟通。

现在,云知声与高通合作的特殊芯片,功能集中,能耗剧降,适配程度大幅提高。

2007年,第一代iPhone推出,接下来近十年里,移动互联网风生水起。随着智能手机普及率提升,2016年智能手机全球出货量增长几乎停滞,根据市场研究公司Strategy Analytics数据,全球智能手机出货量2016年二季度为3.404亿部,相比于2015年同期的3.38亿部,仅增加了1%。

那移动互联网之后呢?

“物联网将是一个比移动互联网更伟大的时代。”黄伟告诉“”。

目前云知声几乎将全部资源押宝物联网布局,智能家居、车联网、智慧医疗和教育四大领域,合作客户近两万家。他认为云知声的未来将是物联网领域内一家优秀的人工智能服务公司,让机器更好地理解用户,交互变得自然而智能。

“我希望它会成为万物互联之下的BAT。”

声明:

1、凡本网注明“来源:XXX(非科极网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,丰富网络文化,此类稿件并不代表本网赞同其观点和对其真实性负责。

2、如因作品内容、版权和其他问题需要与本网联系的,请在该事由发生之日起30日内进行。