KTV 直播,也就是线上 K 歌房的玩法,真实地还原了线下 K 歌房的玩法。举个例子,小明是个麦霸,周末想去 K 歌房 K 歌,可是朋友们都没空,约不到人一起 K 歌。于是小明就通过手机或者 PC,进入线上的 K 歌房,房间里有和小明一样的其它用户。和其它用户一样,小明要排队轮流上麦 K 歌,在上麦之前要点好要唱的歌曲。K 歌的时候,小明能听到伴奏和看到歌词,其它同在 K 歌房的用户能听到小明的歌声和伴奏,还能看到同步的歌词,完美地还原了线下 K 歌房的体验。这样,小明就算约不到朋友,也可以在线上 KTV 找到网友一起 K 歌。
合唱直播,其实是 KTV 直播加上合唱的场景,真实地还原了在线下 K 歌房中合唱的玩法。合唱直播,指的是两个或者以上的用户,随着伴奏看着歌词一起 K 歌。合唱直播和 KTV 直播的关键区别在于,有两个或者以上的用户一起 K 歌,混音的场所(在哪个终端?是终端还是云端?)是考虑的关键,最终要让歌声、伴奏和歌词同步。KTV 直播混音的场所是歌手端设备,而合唱直播的混音场所可以是歌手端设备,也可以是云端,要根据不同的方案而定。
王菲的手机从音乐库下载 MV 播放,包含伴奏音乐、MV 视频和歌词;
王菲伴随着伴奏音乐演唱,歌声和伴奏音乐混音,形成音视频流 X 推送到实时传输网络;
马云的手机从实时网络拉取音视频流 X 播放,伴奏音乐包含王菲的歌声和 MV 伴奏;
马云伴随着伴奏音乐演唱,歌声和伴奏被混音,形成音视频流 Y 推送到实时传输网络;
音视频流 Y 经过实时传输网络加速后,被转推内容分发网络(CDN)进行分发;
直播间的观众从内容分发网络拉取音视频流 Y 播放。
歌手 A 从音乐库下载伴奏音乐和歌词,歌手 B 同样;
歌手 A 随着伴奏音乐和字幕演唱,歌手 B 同样;
歌手 A 把采集到的歌声和视频,封装成音视频流,推送到实时网络,歌手 B 同样;
歌手 A 从实时网络拉取歌手 B 的音视频流播放,歌手 B 同样,两个歌手实现连麦互动;
在云端把歌手 A 的歌声、歌手 B 的歌声、伴奏音乐混音,封装成音视频流;
在云端把歌词加入音视频流的媒体通道传输;
在云端把音视频流转推内容分发网络;
观众们从内容分发网络拉取音视频流播放。
这样可以实现全互动的合唱直播,好像歌手 A 和歌手 B 就在同一个 K 歌房里合唱一样:
歌手 A 和歌手 B 相互能听到对方的歌声;
歌手 A 和歌手 B 跟随着伴奏一起演唱;
观众们能听到歌手 A 和歌手 B 合唱,歌声和伴奏还有歌词大致同步。