香港大學計算機視覺與機器智能實驗室(CVMI Lab)和 TCL AI Lab 的研究人員共同開發(fā)了一種名為 MarS3D 的輕量級模型,可以顯著提升自動駕駛 AI 的物體運動狀態(tài)判別能力。
該模型通過給語義分割模型添加一個稱為 BEV Branch 的分支,利用鳥瞰視角提取點云數(shù)據(jù)的運動狀態(tài)信息,并與其他單掃描任務模型的語義信息特征進行融合,實現(xiàn)了3D 點云的語義分割。與其他多掃描方法相比,MarS3D 具有以下特點:
輕量級模型:MarS3D 的參數(shù)量僅為約100K 大小,與主流點云分割模型相比僅增加了不到0.5% 的參數(shù)量。
即插即用:MarS3D 可以與任意主流點云分割模型結(jié)合使用,無需額外的計算量,推理時間僅增加不到0.03秒。
提升分割性能:在 SemanticKITTI 數(shù)據(jù)集上的測試結(jié)果表明,MarS3D 在主流的單掃描點云分割模型上,將性能提升了近5%。
快速計算:MarS3D 的推理過程僅需要一塊英偉達 GeForce RTX3090GPU 即可完成,具有較低的計算成本。
該研究論文已被 CVPR2023收錄,項目已在 GitHub 開源。這項研究為自動駕駛系統(tǒng)的感知能力提供了一種高效而準確的解決方案,為自動駕駛技術的發(fā)展帶來了新的可能性。


產(chǎn)品與服務
聯(lián)系站長
關于我們