سلام
چطور میتونم با استفاده از nlp کلمات درست را ازخروجی ocr دریافت کنم ؟
من با استفاده از مدل East محل کلمات را پیدا میکنم .سپس خروجی را به مدل pytesseract میدهم .خروجی به صورت زیر میباشد :
text = """les Google Chrome + ETO\n\n38519 lg! | SS oui\n€ C_ @ dr-r00t3r.ir oa @ incognito"""
یه مدل nlp پیاده سازی کردم ولی با استفاده از روش ماسک گزاری کلماتی را جایگذاری میکنه که خروجی به
صورت زیر میشود:
[MASK] Google Chrome [MASK] [MASK] 38519 lg ! [MASK] SS [MASK] [MASK] [MASK] [MASK] [MASK] . ir [MASK] [MASK] incognito
s Google Chrome a
38519 lg! a SS i
a a a in.ir a a incognito
در صورتی که من فقط به کلمات Google chrome ,dr-r00t3r.ir,incognito نیاز دارم ؟
از رجکس نمیخوام استفاده کنم چون به صورت عمومی نمیدونم قرار با چه کلماتی مواجه بشه !
ممنون از هر کمکی که انجام بشه