當前位置:聚美館>智慧生活>心理>

語音聊天輸出什麼意思

心理 閱讀(7.58K)
語音聊天輸出什麼意思

輸出是一串Subword,和NLP類似,目前Subword是最好的端到端系統的輸出單位,一般用sentence piece等工具將文字進行切分輸入是 Mel譜(MFCC特徵),可以理解爲將語音信號經過採樣,大約每10毫秒可以得到一個向量,向量的維度一般是80,如果語音有10秒,整個mel input的就是一個 80 * 1000 的矩陣