سلام ، بنده در حال طراحی سیستم تشخیص پلاک هستم ، برای قسمت ocr از کتابخانه tesseract استفاده کردیم که به نظر انتخاب مناسبی برای این کاره ، ولی مشکلی که با tesseract دارم اینه که این کتابخونه در تشخیص پلاک های نویز دار خوب عمل نمیکنه ، یا بهتره بگم خیلی بد عمل میکنه ، برای رفع این مشکل باید کارکتر های پلاک رو به صورت تک به تک به tesseract بدیم ، در این صورت سیستم به خوبی عمل میکنه .
همونجوری که میبینید با استفاده از لبه یابی تونستیم موقعیت حروف و اعداد رو مشخص کنیم ، ولی اینکه چطور فقط حروف و اعداد رو استخراج کنیم برای من سواله ، اگه دوستان دیگه تجربه ای دارن ممنون میشم.
چالش بعدی حروف نقطه دار مثل ج هست که باید بتونه نقطه رو هم جز همون حرف حساب کنه.
ضمناً مراحل زیر روی تصویر اصلی اعمال شده :
1 morphological operations
2 applying topHat/blackHat operations
3 add and subtract between morphological operations
4 applying gaussian blur on subtract image
5 thresholding
6 check for contours on thresh