Abstrait

EXTRACTION DE TEXTE BRUT À PARTIR D'UN DOCUMENT WORD CORROMPU

Saptarshi Naskar, Souvik Sarkar et Krishnendu Basuli

La conversion de texte est un processus écrit dans un langage de programmation dont la tâche principale est d'extraire le texte brut du fichier source fourni dans un format donné et de placer le texte dans un fichier de format différent. Dans cette procédure de conversion, l'extension du fichier sera modifiée, mais les données qu'il contient resteront inchangées en termes de format et de taille des données réelles. Cette procédure de conversion est effectuée via un langage de programmation (peut être écrit en C ou C++ ou un autre langage de programmation), dont la tâche principale est de lire le fichier source ligne par ligne (dans de nombreux systèmes, il lit par caractère) et chaque fois que le texte approprié (c'est-à-dire les données ou caractères valides) est trouvé, il copie alors l'intégralité du texte dans un format de fichier différent, en conservant inchangé le format du texte qui se trouve dans le fichier source. Ici, nous concevons le convertisseur de texte en langage de programmation C qui accepte le format de fichier avec une extension de .doc, .rtf et également .txt, et extrait le texte brut de ces fichiers et place les textes dans un fichier texte dont le format de texte du fichier source reste inchangé.

Avertissement: Ce résumé a été traduit à l'aide d'outils d'intelligence artificielle et n'a pas encore été examiné ni vérifié

Indexé dans

Google Scholar
Academic Journals Database
Open J Gate
Academic Keys
ResearchBible
CiteFactor
Electronic Journals Library
RefSeek
Hamdard University
Scholarsteer
International Innovative Journal Impact Factor (IIJIF)
International Institute of Organised Research (I2OR)
Cosmos

Voir plus