最近幾周微軟獲得了不少非常有趣的技術(shù)專利,包括無人機(jī)運(yùn)輸系統(tǒng),為Cortana的第三方應(yīng)用整合語音輸入功能等等 。而現(xiàn)在微軟又獲得了一項(xiàng)技
最近幾周微軟獲得了不少非常有趣的技術(shù)專利,包括無人機(jī)運(yùn)輸系統(tǒng),為Cortana的第三方應(yīng)用整合語音輸入功能等等 。而現(xiàn)在微軟又獲得了一項(xiàng)技術(shù)專利,描述了一款能夠人工生成語音,解決低質(zhì)量通信會(huì)話的概念設(shè)備。
在系統(tǒng)中建立的VoIP(基于IP的語音傳輸)可以讓用戶通過網(wǎng)絡(luò)實(shí)現(xiàn)音頻信息的交互。然而在傳輸過程中由于丟包和網(wǎng)絡(luò)不穩(wěn)定等諸多原因,極有可能會(huì)影響呼叫通信時(shí)候的質(zhì)量。由于這些問題通常和網(wǎng)絡(luò)相關(guān),因此這些會(huì)議的質(zhì)量往往很難提高。
微軟在專利描述中認(rèn)為,目前緩解此類問題的技術(shù)手段不足,為此微軟構(gòu)思了一種設(shè)備。該設(shè)備可以檢測(cè)網(wǎng)絡(luò)問題可能影響語音呼叫質(zhì)量的情況。在檢測(cè)之后,它將開始將傳輸?shù)恼Z音信息轉(zhuǎn)換為文本包,將這些信息發(fā)送到接收設(shè)備。通過這種方式,可以在視覺顯示器上查看文本,與用于輸出音頻的揚(yáng)聲器分開。由于所有這些都將實(shí)時(shí)完成,即使網(wǎng)絡(luò)狀況不佳,接收器也能夠立即理解消息。
而在另一端,發(fā)送的文本分組也可以在接收端被轉(zhuǎn)換回音頻輸出,該過程被稱為語音合成。此外在此過程中可以向用戶發(fā)送一些視覺提示,或者也可以在特定頻道上播放文本轉(zhuǎn)語音的聲音。有趣的是理論上,這些實(shí)現(xiàn)也可以擴(kuò)展到視頻內(nèi)容。例如,在發(fā)送者的設(shè)備處捕獲的視頻可以被編碼并通過網(wǎng)絡(luò)發(fā)送到接收終端。在那里,它們可以在被觀看之前由接收端的設(shè)備解碼。