Muheet Ahmed Butt, Majid Zaman
Les documents sont les sources de données qui génèrent des informations et des connaissances. Le traitement automatisé des documents pour en extraire le contenu est une tâche essentielle dans tous les types d'organisations pour des applications variées. La classification des documents en cours de traitement est nécessaire pour leur reconnaissance efficace car elle réduit le nombre de recherches et réduit également les risques d'erreur à différentes étapes du processus. Par conséquent, dans cette recherche proposée, un mécanisme de classification robuste pour les images de documents basé sur la structure de mise en page de ses différents éléments, qui aboutit à une reconnaissance basée sur la cognition, est présenté. L'image du document est considérée comme contenant uniquement du texte ou du texte ainsi que des tableaux et des images. La classification est basée sur un schéma de préservation de la structure de la mise en page d'une image de document. Les algorithmes sont basés sur les relations spatiales existant entre les composants visuels présents dans le document.