國家超算互聯網平臺近日宣布上線阿里巴巴開源推理模型QwQ-32B的API接口服務,用戶可免費獲得100萬Tokens的使用額度。QwQ-32B是阿里Qwen團隊基于Qwen2.5-32B與強化學習技術構建的最新模型,在AIME24數學能力評測和LiveCodeBench代碼能力評估中表現優異,與DeepSeek-R1相當,優于o1-mini及同尺寸R1蒸餾模型。
平臺已完成QwQ-32B的全面適配,支持基于vLLM和PyTorch的推理,并提供模型鏡像和文件,用戶無需本地下載即可通過Notebook功能一鍵啟動,實現模型開發或私有化部署。此外,超算互聯網還上線了DeepSeek-R1全家桶及最高671B滿血版API部署與AI Web應用服務。
目前,平臺已連接國內14個省的20多家超算和智算中心,提供超6500款算力商品,其中包括近240款AI模型服務,涵蓋DeepSeek、Qwen等國內模型以及Llama、Stable Diffusion、Gemma等國際開源模型。


產品與服務
聯系站長
關于我們