中大研新通用視覺技術「書生」

港聞

更新時間：03:54 2021-11-26
發佈時間：03:50 2021-11-26

人工智能（AI）應用層面愈來愈廣泛。中文大學聯同人工智能實驗室、商湯科技及上海交通大學，研發名為「書生」（INTERN）的新一代通用視覺技術系統，可改善現時人工智能視覺領域中，AI模型在任務和場景通用性、數據學習效率方面的瓶頸問題，業界可以極低成本獲取下游資料，快速驗證多個新場景等。有關技術已於論文發布平台arXiv發布。

可同時完成多項任務

新系統名為「書生」，寓意系統擁有如書生般的特質，通過持續學習，舉一反三。目前的AI模型只擅長處理一項任務，在新場景、數據學習、新任務的通用性有限，面對不同任務需求，須獨立開發模型。但「書生」系統則可同時完成多項任務，應用於多樣化的場景，包括自動駕駛、智慧製造、智慧城市等。技術測試結果顯示，一個「書生」基礎模型可全面覆蓋分類、目標檢測、語義分割、深度估計四大視覺核心任務。

相比現時最先進的開源模型CLIP，「書生」在準確性和數據使用效率方面均大幅提升。例如應用同樣的下游場景，「書生」在上述四大任務的平均錯誤率，降低9.4%至47.3%不等；另外，在數據使用效率方面的提升尤為突出，例如只需要十分之一的下游資料，便能準確識別花卉的種類，比CLIP以完整下游資料進行分析的準確度更高。中大指，利用這個新系統，業界可以極低成本獲取下游資料，快速驗證多個新場景，體現了產學研合作在通用視覺領域的全新探索，為走向通用人工智能邁出堅實一步。

原文刊《星島日報》教育版