近日,在科大訊飛舉辦的高級別多語言基座大模型國際學術研討會上,科大訊飛研究院院長劉聰宣布,星火大模型X1已支持130余種語言,其中阿拉伯語、德語、法語、韓語、日語等核心語種的綜合表現(xiàn)優(yōu)于GPT-4.1。
通過混合語種路由等技術創(chuàng)新,星火語音大模型實現(xiàn)100種語言的高精度語音識別,整體效果優(yōu)于Whisper V3,并具備55種語言的語音合成能力,自然度與流暢度領先行業(yè)。
劉聰表示,星火多語言大模型未來將重點推進三大方向:一是融合語音與文本多模態(tài)數(shù)據(jù),打破模態(tài)間語義壁壘;二是構建原生多語種語音大模型基礎架構,提升模型對全球語言生態(tài)的理解;三是發(fā)展跨語言知識遷移技術,提升泛化能力以實現(xiàn)語種間知識共享,支撐全球化AI應用。
目前,科大訊飛多語種技術已應用于華為、比亞迪、海爾等企業(yè)的1.2億臺智能設備,覆蓋23種語言,并在非洲、東南亞等地區(qū)實現(xiàn)規(guī)模化落地,成為“中國智造”全球化的重要技術支撐。
在技術生態(tài)方面,科大訊飛已向全球53萬開發(fā)者開放813項AI能力接口,其中272項專為多語種需求設計,涵蓋語音識別、機器翻譯、跨語言交互等核心場景,持續(xù)推動全球AI協(xié)作與創(chuàng)新。


產(chǎn)品與服務
聯(lián)系站長
關于我們