文本檢測和識別技術(shù)處于一個學(xué)科交叉點,其技術(shù)演進(jìn)不斷受益于計算機(jī)視覺處理和自然語言處理兩個領(lǐng)域的技術(shù)進(jìn)步。 它既需要使用視覺處理技術(shù)來提取圖像中文字區(qū)域的圖像特征向量,又需要借助自然語言處理技術(shù)來解碼圖像特征向量為文字結(jié)果。 從公開論文中可以看到,起源于圖像分類、檢測、語義分割等視覺處理任務(wù)的各個基礎(chǔ)網(wǎng)絡(luò)(backbone network),紛紛被征用來提取圖像中文字區(qū)域的特征向量。