Prajakta Bastawade, professeur Bharati Dixit
La détection de texte dans les images de scènes naturelles est une tâche importante pour des applications telles que la navigation assistée, la lecture auxiliaire, la recherche d'images, la compréhension de scènes, etc. Cet article explore un nouveau cadre pour détecter des chaînes de texte dans des images de scènes naturelles complexes qui se compose de deux étapes : A) partition d'image pour trouver des candidats caractères de texte en fonction des caractéristiques de gradient local et de l'uniformité des couleurs des composants de caractères et 2) regroupement de candidats caractères pour détecter des chaînes de texte en fonction des caractéristiques structurelles conjointes des caractères de texte. Dans Boundary Clustering, une nouvelle méthode basée sur l'uniformité des couleurs bigrammes est développée pour modéliser à la fois le texte et la surface de fixation, et regrouper les pixels de bord en fonction des paires de couleurs et des positions spatiales dans des couches limites qui sont données en entrée pour l'ensemble du cadre. Le cadre donné surpasse les résultats de l'état de l'art sur le RRD public qui contient du texte uniquement dans une orientation horizontale. et plus efficace sur MSRA-TD500 qui contient du texte dans des orientations arbitraires