音频应用

 找回密码
 快速注册

QQ登录

只需一步,快速开始

查看: 36426|回复: 0
收起左侧

[麦克风] 如何正确选择麦克风阵列阵型和技术?

[复制链接]

8034

积分

4

听众

-381

音贝

音频应用注册会员

Rank: 4Rank: 4

积分
8034
发表于 2007-3-13 10:36:44 | 显示全部楼层 |阅读模式
如何正确选择麦克风阵列阵型和技术?
: e& s! D( c" i从上面的分析来看,远场语音交互产品确实比较复杂,仅仅选用麦克风阵列就有如此多的问题。那么应当如何选择合适的麦克风阵列和技术呢?1 ^6 m  `! w. O* o1 X

( C& r% k, z: `! W  _' K! x' L3 K4 G
8 F+ R1 @4 K; S3 @# n
1、从产品实际角度出发,先定前端方案再定后端技术! `. x& Y6 |" ^2 l3 q
首先还是应该从产品实际角度出发,先定前端方案再定后端技术,前端技术包含了麦克风阵列、唤醒和识别技术,后端技术则包含了自然语言理解和内容服务。
) ~- R/ v7 Q5 V# U6 g
: Z9 `8 f. w; m( O0 o" S& a前端主要解决了产品是否听得准的问题,这其中有五个核心指标:远场语音唤醒率、复杂环境 误唤醒率、远场语音识别率、总体延迟时间和总体稳定性。这五个核心指标决定了用户的第一体验。& [% j: y' ~) R5 g: N* O! I

% n6 g4 @6 t2 J! ~# M  K$ X5 d由于用户无法忍受前端技术出现任何问题,所以前端技术的稳定性也是至关重要,这个指标需要大规模量产的验证。后端技术主要解决了产品是否听得懂的问题,但是仅有自然语言理解还不够,必须和内容服务串联成反馈才能达到用户满意的目的,事实上,产品的智能主要就体现在后端,而且涉及内容服务,当前也仅有BAT等巨头做的比较完善。0 w) t6 x6 k$ ~2 Y% W4 U' o6 s

! }0 |& @9 x' u2 N目前来看,全球经过量产验证的前端技术主要掌握在Amazon、Apple、科大讯飞、声智科技等厂商手中,而后端技术特别是内容及服务则主要被Google、Microsoft、Apple、Amazon、百度、腾讯、阿里等巨头所掌控,思必驰和云知声等语音识别厂商也相继转型发布了平台战略。
! q1 T% r  B( C, J, X4 o* n9 ]
/ z9 ]1 M5 O5 p2 C) F2、根据应用场景选取合适的阵型
2 u" W1 h& ?, d: h& ?其次应该是根据应用场景选取合适的阵型,比如产品定位的场景是否需要360度拾音?产品的用户群体大概都是什么年龄?产品的主要交互距离又是多少?产品的ID采用什么形状?产品是否考虑低功耗问题?4 C0 L/ [) e# }  j0 S! u
+ W7 p5 {: ~- f$ Y# f) P/ m
根据这些指标,可以由专业的技术方案商提供具体方案,比较复杂的场景可能还需要定制开发,但是以当前技术进展来看,比如声智科技已经不再约束阵型的尺寸和结构。0 \: o$ C% }6 g
4 J7 E; a/ ?+ K' v4 l5 M
3、在满足效果的前提下再考虑降低成本! M7 t7 g, }/ t$ ?
最后应该是在满足效果的前提下再考虑降低成本,这和具体场景还是有密切关系的,比如儿童故事机,由于儿童与机器之间的距离约束,成本实际上是第一考虑要素,那事实上用单麦克风方案就可以解决。对于技术实力比较雄厚的厂商,则可以兼顾成本与性能,向技术方案上定制专用麦克风阵列和优化技术。
" t( V; a1 ~1 I
2 ]2 R( Y* r0 N3 K. R对于大部分产品厂商来说,产品研发速度和稳定是第一考虑要素,那可以优先选择阵列的模组方案,这样更容易集成,成本也容易控制。这样可以让厂商腾出更多精力专注后端智能方面的开发,当前端技术稳定可靠后,真正体现产品差异的一定是后端技术。
$ n6 e; [8 [1 U# g9 I4 N" M- T6 B
3 Z% R( w! C( d3 R) m从Amazon来看产品与平台厂商的博弈; b$ k% u$ c6 {$ D: J- h
亚马逊做完Echo家族的产品发布会,其电商网站似乎只卖Echo产品了,而且价格几乎腰斩,这是一个很有意思的事情。因为Amazon同时还在鼓励Alexa的生态,力求把Alexa打造成一个AI平台。但是从当前的窘境来看,Alexa的平台进展似乎一直不太如意,Amazon似乎只对推广自家产品更有兴趣,何况Alexa还故意给产品开发厂商制造了很多困难。% i6 P; {$ ]& C& @
; F  }. x) m0 ^* L5 q. T" j" Z

8 H) t) G1 f: h$ Q3 s* D' c  D, O; R) C9 C
这也很容易理解,平台的开放和封闭本来就是难以兼容的关系,平台的天性就是开放,而产品的天性容易封闭,这是两类生态的竞争,还没有一家公司能够兼容并包。比如Apple依赖iPhone系列构建了封闭的平台体系,而Google则依赖Android建立了开放的平台体系。, q6 ?$ \% e5 \. W0 I7 P5 g
  W7 L6 M) ^1 D8 v
以Amazon当前的表现来看,其走向Apple的可能性更大一些,这样实际开放的只是内容和服务,更像Apple的Apple Store。这也很容易理解,因为平台需要积累大量客户,肯定倾向于能够带来大量客户的生态伙伴,若这个生态伙伴恰好还是自家的,没有理由不扶持自家产品。/ [; i: d% C8 U3 i# O' c
3 v) b2 o& p+ J+ `( O. s. A
所以Echo持续降价,销量不断攀升,这个结果导致其他生态伙伴无法生存,但是从Amazon来看也不重要,因为不管用户从哪来,其核心诉求实际上达到了。当Amazon的用户积累到一定规模,自然也就形成了平台优势,反而会给后端开发的用户带来盈利的空间,这样也能形成正向的逻辑。" K3 I: v4 E7 g0 k

- p& {  X3 s1 y: T+ e从正向的逻辑出发,Amazon的野心就很清晰了,这绝对是要挑战其他巨头的意思,因为一旦语音流形成,不管是搜索还是社交,Amazon绝对是有兴趣染指一把的,当然电商本来就是Amazon的优势。所以,Amazon和Google最近在Youtube较劲也就见多不怪了,相信这个事情还会发生很多。: [+ _& [3 K) x
- Q0 ]& B* [* Q* B8 k6 ~: ?
这对于我们国内远场语音交互生态有什么启示?
6 i+ f, ~& e8 A# _. A0 z$ o6 m3 I+ c" q( D9 N# y
& r9 K5 x' o6 ?2 a
这可能会影响三类厂商:产品厂商、前端技术提供商和后端技术提供商,后端技术提供商实际上就是平台。其中这对前端技术方案商没有太大影响,毕竟麦克风阵列、唤醒和识别都是一种管道型技术,同时服务于产品和平台两大厂商,其核心诉求更多是赚钱,并没有太多其他变现的价值,也就是说这部分用互联网思维来做也没有什么落脚点。+ T. j% Q" C9 p2 k' m3 g
; o; ?6 I# Q* o- o: T! B4 j
但是产品厂商和平台厂商就比较纠结,产品和平台厂商都需要用户,当用户量足够大的时候,产品和平台的后端变现价值就会凸显。但是实现这个目标都是实力的硬硬对坑,是走向开放模式还是封闭模式?开放模式必然意味着要放弃自家产品鼓励生态,带动生态伙伴一起发展。封闭模式则需要重金投入同时打造产品和平台,搞不好两败俱伤。这是一个难题,也是一家公司的战略决策,很难说哪种模式未来能够绝对制胜,但是摇摆于两种模式之间的厂商必然没有发展空间。所以,很多时候,战略判断和决策才是一家公司的核心能力。, _2 T% f3 y( \7 n; q/ b8 `

5 B; i$ `' P1 ^4 R! o2 X  ]* u
欢迎厂家入驻,推文!免费!微信:yinpinyingyong
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

音频应用搜索

小黑屋|手机版|音频应用官网微博|音频应用 ( 鄂ICP备16002437号 )

GMT+8, 2025-6-8 07:46 , Processed in 0.021971 second(s), 5 queries , Redis On.

Powered by Audio app

快速回复 返回顶部 返回列表