權(quán)利要求
權(quán)利要求
1.一種基于數(shù)字孿生技術(shù)的音頻視頻的同步方法,其特征在于,所述同步方法包括:
獲取目標(biāo)用戶的音頻數(shù)據(jù)流和視頻數(shù)據(jù)流;
對所述音頻數(shù)據(jù)流標(biāo)記音頻時間戳,對所述視頻數(shù)據(jù)流標(biāo)記視頻時間戳,所述音頻時間戳和所述視頻時間戳相對應(yīng);
將所述音頻數(shù)據(jù)流和所述視頻數(shù)據(jù)流輸入至數(shù)字化人物模型,通過所述數(shù)字化人物模型按照所述音頻時間戳的時序輸出所述音頻數(shù)據(jù)流,以所述音頻數(shù)據(jù)流的時鐘為參考時鐘,通過所述數(shù)字化人物模型按照所述視頻時間戳的時序同步控制所述視頻數(shù)據(jù)流的播放速度,并根據(jù)所述視頻數(shù)據(jù)流中目標(biāo)用戶的口型數(shù)據(jù)控制所述數(shù)字化人物模型的口型同步變化。
2.根據(jù)權(quán)利要求1所述的基于數(shù)字孿生技術(shù)的音頻視頻的同步方法,其特征在于,所述對所述音頻數(shù)據(jù)流標(biāo)記音頻時間戳,對所述視頻數(shù)據(jù)流標(biāo)記視頻時間戳包括:
根據(jù)當(dāng)前時間的網(wǎng)絡(luò)帶寬確定音頻標(biāo)記時間間隔和視頻標(biāo)記時間間隔,其中,所述網(wǎng)絡(luò)帶寬與所述音頻標(biāo)記時間間隔和所述視頻標(biāo)記時間間隔呈正比;
以本地時鐘為參考,從所述音頻數(shù)據(jù)流的起點開始,按照所述音頻標(biāo)記時間間隔對所述音頻數(shù)據(jù)流標(biāo)記音頻時間戳,從所述視頻數(shù)據(jù)流的起點開始,按照所述視頻標(biāo)記時間間隔對所述視頻數(shù)據(jù)流標(biāo)記視頻時間戳。
3.根據(jù)權(quán)利要求1所述的基于數(shù)字孿生技術(shù)的音頻視頻的同步方法,其特征在于,所述獲取目標(biāo)用戶的音頻數(shù)據(jù)流和視頻數(shù)據(jù)流包括:
獲取所述目標(biāo)用戶的音頻數(shù)據(jù)和視頻數(shù)據(jù),對所述音頻數(shù)據(jù)和所述視頻數(shù)據(jù)進(jìn)行編碼后,得到所述音頻數(shù)據(jù)流和所述視頻數(shù)據(jù)流;
所述通過所述數(shù)字化人物模型按照所述音頻時間戳的時序輸出所述音頻數(shù)據(jù)流包括:
通過音頻解碼器解碼所述音頻數(shù)據(jù)流后,將解碼后的音頻數(shù)據(jù)流和音頻數(shù)據(jù)流中各音頻字節(jié)流對應(yīng)的音頻時間戳緩存至音頻緩存區(qū),按照所述音頻時間戳的時序從所述音頻緩存區(qū)中讀取音頻字節(jié)流并通過所述數(shù)字化人物模型播放;
所述通過所述數(shù)字化人物模型按照所述視頻時間戳的時序同步控制所述視頻數(shù)據(jù)流的播放速度包括:
通過視頻解碼器解碼所述視頻數(shù)據(jù)流,將解碼后的視頻數(shù)據(jù)流和視頻數(shù)據(jù)流中各視頻字節(jié)流對應(yīng)的視頻時間戳緩存至視頻緩沖區(qū),按照所述視頻時間戳的時序從所述視頻緩沖區(qū)中讀取視頻字節(jié)流并通過所述數(shù)字化人物模型同步控制所述視頻字節(jié)流的播放速度。
4.根據(jù)權(quán)利要求3所述的基于數(shù)字孿生技術(shù)的音頻視頻的同步方法,其特征在于,所述音頻數(shù)據(jù)的第一采集時間間隔與音頻標(biāo)記時間間隔相對應(yīng),所述視頻數(shù)據(jù)的第二采集時間間隔與視頻標(biāo)記時間間隔相對應(yīng)。
5.根據(jù)權(quán)利要求1-4任意一項所述的基于數(shù)字孿生技術(shù)的音頻視頻的同步方法,其特征在于,所述以所述音頻數(shù)據(jù)流的時鐘為參考時鐘,通過所述數(shù)字化人物模型按照所述視頻時間戳的時序同步控制所述視頻數(shù)據(jù)流的播放速度包括:
以所述音頻數(shù)據(jù)流的時鐘為參考時鐘,在所述視頻數(shù)據(jù)流中當(dāng)前播放的視頻字節(jié)流的視頻時間戳早于當(dāng)前播放的音頻字節(jié)流的音頻時間戳的情況下,則跳轉(zhuǎn)到當(dāng)前播放的音頻字節(jié)流的音頻時間戳對應(yīng)的視頻時間戳的視頻字節(jié)流并通過所述數(shù)字化人物模型播放,在所述視頻數(shù)據(jù)流中當(dāng)前播放的視頻字節(jié)流的視頻時間戳晚于當(dāng)前播放的音頻字節(jié)流的音頻時間戳的情況下,則暫停所述視頻數(shù)據(jù)流中當(dāng)前播放的視頻字節(jié)流,并在音頻字節(jié)流的音頻時間戳與當(dāng)前播放的視頻字節(jié)流的視頻時間戳再次對應(yīng)的情況下,再通過所述數(shù)字化人物模型控制視頻數(shù)據(jù)流中當(dāng)前播放的視頻字節(jié)流開始播放。
6.一種基于數(shù)字孿生技術(shù)的音頻視頻的同步裝置,其特征在于,所述裝置包括:
獲取模塊,用于獲取目標(biāo)用戶的音頻數(shù)據(jù)流和視頻數(shù)據(jù)流;
標(biāo)記模塊,用于對所述音頻數(shù)據(jù)流標(biāo)記音頻時間戳,對所述視頻數(shù)據(jù)流標(biāo)記視頻時間戳,所述音頻時間戳和所述視頻時間戳相對應(yīng);
同步模塊,用于將所述音頻數(shù)據(jù)流和所述視頻數(shù)據(jù)流輸入至數(shù)字化人物模型,通過所述數(shù)字化人物模型按照所述音頻時間戳的時序輸出所述音頻數(shù)據(jù)流,以所述音頻數(shù)據(jù)流的時鐘為參考時鐘,通過所述數(shù)字化人物模型按照所述視頻時間戳的時序同步控制所述視頻數(shù)據(jù)流的播放速度,并根據(jù)所述視頻數(shù)據(jù)流中目標(biāo)用戶的口型數(shù)據(jù)控制所述數(shù)字化人物模型的口型同步變化。
7.根據(jù)權(quán)利要求6所述的基于數(shù)字孿生技術(shù)的音頻視頻的同步裝置,其特征在于,所述標(biāo)記模塊,還用于根據(jù)當(dāng)前時間的網(wǎng)絡(luò)帶寬確定音頻標(biāo)記時間間隔和視頻標(biāo)記時間間隔,其中,所述網(wǎng)絡(luò)帶寬與所述音頻標(biāo)記時間間隔和所述視頻標(biāo)記時間間隔呈正比;以本地時鐘為參考,從所述音頻數(shù)據(jù)流的起點開始,按照所述音頻標(biāo)記時間間隔對所述音頻數(shù)據(jù)流標(biāo)記音頻時間戳,從所述視頻數(shù)據(jù)流的起點開始,按照所述視頻標(biāo)記時間間隔對所述視頻數(shù)據(jù)流標(biāo)記視頻時間戳。
8.根據(jù)權(quán)利要求6所述的基于數(shù)字孿生技術(shù)的音頻視頻的同步裝置,其特征在于,所述同步模塊,還用于以所述音頻數(shù)據(jù)流的時鐘為參考時鐘,在所述視頻數(shù)據(jù)流中當(dāng)前播放的視頻字節(jié)流的視頻時間戳早于當(dāng)前播放的音頻字節(jié)流的音頻時間戳的情況下,則跳轉(zhuǎn)到當(dāng)前播放的音頻字節(jié)流的音頻時間戳對應(yīng)的視頻時間戳的視頻字節(jié)流并通過所述數(shù)字化人物模型播放,在所述視頻數(shù)據(jù)流中當(dāng)前播放的視頻字節(jié)流的視頻時間戳晚于當(dāng)前播放的音頻字節(jié)流的音頻時間戳的情況下,則暫停所述視頻數(shù)據(jù)流中當(dāng)前播放的視頻字節(jié)流,并在音頻字節(jié)流的音頻時間戳與當(dāng)前播放的視頻字節(jié)流的視頻時間戳再次對應(yīng)的情況下,再通過所述數(shù)字化人物模型控制視頻數(shù)據(jù)流中當(dāng)前播放的視頻字節(jié)流開始播放。
9.一種音頻視頻的同步系統(tǒng),其特征在于,包括:
第一服務(wù)器,用于獲取目標(biāo)用戶的音頻數(shù)據(jù)流,對所述音頻數(shù)據(jù)流標(biāo)記音頻時間戳;
第二服務(wù)器,用于獲取目標(biāo)用戶的視頻數(shù)據(jù)流,對所述視頻數(shù)據(jù)流標(biāo)記視頻時間戳,所述音頻時間戳和所述視頻時間戳相對應(yīng);
第三服務(wù)器,用于將所述音頻數(shù)據(jù)流和所述視頻數(shù)據(jù)流輸入至數(shù)字化人物模型,通過所述數(shù)字化人物模型按照所述音頻時間戳的時序輸出所述音頻數(shù)據(jù)流,以所述音頻數(shù)據(jù)流的時鐘為參考時鐘,通過所述數(shù)字化人物模型按照所述視頻時間戳的時序同步控制所述視頻數(shù)據(jù)流的播放速度,并根據(jù)所述視頻數(shù)據(jù)流中目標(biāo)用戶的口型數(shù)據(jù)控制所述數(shù)字化人物模型的口型同步變化。
10.一種電子設(shè)備,其特征在于,包括處理器、通信接口、存儲器和通信總線;其中,所述處理器、所述通信接口以及所述存儲器通過通信總線完成相互間的通信;所述存儲器,用于存放計算機程序;所述處理器,用于執(zhí)行所述存儲器上所存放的程序,實現(xiàn)如權(quán)利要求1-5任一項所述的基于數(shù)字孿生技術(shù)的音頻視頻的同步方法的步驟。