سلام.
کانتور در واقع بیانگر شکل کاراکترها هستش خود tesseract که OCR متن باز هستش از کانتور جهت شناسایی کاراکتر استفاده می کنه.
مهم ترین علت استفاده از کانتور کاهش بار محاسباتی هستش از جمله ابتدایی ترین ویژگی ها از جمله مساحت و محیط و خصوصیات هندسی کانوکس بودن یا نبودن وجود حفره در کانتور یا عدم آن. استخراج ویژگی پیشرفته تر همانند محاسبه HOG برای کانتور ها یا محاسبه ضرایب فوریه مربوط به کانتور
کتاب زیر هم در زمینه OCR مطالب خوبی داره.
دانلود