中大研新通用視覺技術「書生」

港聞
更新時間:03:54 2021-11-26
發佈時間:03:50 2021-11-26

人工智能(AI)應用層面愈來愈廣泛。中文大學聯同人工智能實驗室、商湯科技及上海交通大學,研發名為「書生」(INTERN)的新一代通用視覺技術系統,可改善現時人工智能視覺領域中,AI模型在任務和場景通用性、數據學習效率方面的瓶頸問題,業界可以極低成本獲取下游資料,快速驗證多個新場景等。有關技術已於論文發布平台arXiv發布。

可同時完成多項任務

新系統名為「書生」,寓意系統擁有如書生般的特質,通過持續學習,舉一反三。目前的AI模型只擅長處理一項任務,在新場景、數據學習、新任務的通用性有限,面對不同任務需求,須獨立開發模型。但「書生」系統則可同時完成多項任務,應用於多樣化的場景,包括自動駕駛、智慧製造、智慧城市等。技術測試結果顯示,一個「書生」基礎模型可全面覆蓋分類、目標檢測、語義分割、深度估計四大視覺核心任務。

相比現時最先進的開源模型CLIP,「書生」在準確性和數據使用效率方面均大幅提升。例如應用同樣的下游場景,「書生」在上述四大任務的平均錯誤率,降低9.4%至47.3%不等;另外,在數據使用效率方面的提升尤為突出,例如只需要十分之一的下游資料,便能準確識別花卉的種類,比CLIP以完整下游資料進行分析的準確度更高。中大指,利用這個新系統,業界可以極低成本獲取下游資料,快速驗證多個新場景,體現了產學研合作在通用視覺領域的全新探索,為走向通用人工智能邁出堅實一步。

原文刊《星島日報》教育版