據(jù)智能涌現(xiàn)消息,前字節(jié)跳動(dòng)剪映AI產(chǎn)品負(fù)責(zé)人廖謙宣布創(chuàng)立新公司“極致上下文”,專注于打造一款營(yíng)銷多模態(tài)Agent。
10月15日,TeleStudio全模態(tài)視頻創(chuàng)作挑戰(zhàn)賽正式啟動(dòng)。大賽由中電信人工智能科技有限公司和中國(guó)電信人工智能研究院(TeleAI)共同發(fā)起,基于近日全新上線的“TeleStudio全鏈路AI視頻創(chuàng)作平臺(tái)”,現(xiàn)面向廣大用戶征集創(chuàng)意視頻作品
9月24日,2025年云棲大會(huì)開(kāi)幕,阿里巴巴發(fā)布通義全模態(tài)預(yù)訓(xùn)練大模型Qwen3-Omni系列模型。通過(guò)引入多種架構(gòu)升級(jí)和技術(shù)迭代,Qwen3-Omni系列的模型表現(xiàn)和效率大幅提升。
就在今天,OpenAI宣布了一項(xiàng)令人振奮的消息——ChatGPT的項(xiàng)目功能正式向免費(fèi)用戶開(kāi)放。這一舉措不僅讓更多用戶能夠體驗(yàn)到高級(jí)功能,同時(shí)也對(duì)不同用戶群體進(jìn)行了細(xì)致的功能升級(jí)。
8月31日,上海人工智能實(shí)驗(yàn)室(上海AI實(shí)驗(yàn)室)宣布開(kāi)源發(fā)布多模態(tài)大模型書(shū)生·萬(wàn)象InternVL5。該模型通過(guò)創(chuàng)新的級(jí)聯(lián)式強(qiáng)化學(xué)習(xí)(CascadeRL)、動(dòng)態(tài)視覺(jué)分辨率路由與解耦部署架構(gòu),實(shí)現(xiàn)了推理能力、部署效率與通用能力的全面升
多模態(tài)大模型在圖像問(wèn)答和視覺(jué)理解等領(lǐng)域雖然取得了顯著進(jìn)展,但在數(shù)學(xué)推理這一核心挑戰(zhàn)上依然存在明顯短板。北京郵電大學(xué)、騰訊微信和清華大學(xué)的聯(lián)合研究團(tuán)隊(duì)針對(duì)這一痛點(diǎn),正式發(fā)布了We-Math0——一個(gè)突破性的多模態(tài)數(shù)
8月28日消息,中文多模態(tài)視覺(jué)語(yǔ)言模型測(cè)評(píng)基準(zhǔn)(SuperCLUE-VLM)8月榜單正式發(fā)布,百度ERNIE-5-Turbo-VL多模態(tài)大模型以47分的成績(jī)并列位居國(guó)內(nèi)模型第一,在真實(shí)場(chǎng)景任務(wù)下的領(lǐng)先優(yōu)勢(shì)明顯。
騰訊近日發(fā)布了基于Megatron-Core和SGLang/vLLM研發(fā)的大模型訓(xùn)練庫(kù)WeChat-YATT(YetAnotherTransformerTrainer),內(nèi)部項(xiàng)目代號(hào)為gCore。這一訓(xùn)練庫(kù)專注于強(qiáng)化學(xué)習(xí)和多模態(tài)模型訓(xùn)練,致力于為開(kāi)發(fā)者提供易擴(kuò)展、簡(jiǎn)潔、高效、
近日,字節(jié)跳動(dòng)宣布開(kāi)源其內(nèi)部開(kāi)發(fā)的VeOmni框架,這是一款專注于多模態(tài)模型訓(xùn)練的統(tǒng)一框架。隨著人工智能技術(shù)的不斷發(fā)展,特別是從單一語(yǔ)言模型向文本、圖像和視頻的多模態(tài)演進(jìn),算法工程師們?cè)谟?xùn)練過(guò)程中面臨諸多挑戰(zhàn),特別是
-------------沒(méi)有了-------------