Oute AI 最近發布了一種名為 OuteTTS-0.1-350M 的文本轉語音合成方法,采用純語言建模,簡化了 TTS 方法,具有零樣本語音克隆功能,適用于廣泛的應用領域。該方法基于 LLaMa 架構,使用 WavTokenizer 生成音頻標記,性能可與更大、更復雜的 TTS 系統相媲美,具有高效率和可訪問性。
OuteTTS-0.1-350M 利用純語言建模,無需外部適配器,提供簡化的 TTS 方法。
OuteTTS-0.1-350M 使用 WavTokenizer 直接生成音頻標記,流程更高效。
OuteTTS-0.1-350M 具有零樣本語音克隆功能,與 llama.cpp 兼容,適用于實時應用。


產品與服務
聯系站長
關于我們