Ching Y Suen
L'écriture manuscrite est l'un des principaux médias de communication humaine. Nous écrivons et lisons tous les jours. Bien que l'écriture manuscrite puisse varier considérablement en termes de mode et de propreté, nous reconnaissons facilement les documents manuscrits. En fait, les humains développent leur capacité d'écriture dans leur enfance et l'affine progressivement tout au long de leur vie. Cet article examine les façons dont les humains écrivent (de l'école primaire à l'écriture adulte) et les moyens d'apprendre à l'ordinateur personnel à reconnaître (technologie de l'écriture manuscrite) ce qu'ils produisent depuis l'antiquité (comme les écritures gravées, les vieux livres et documents) jusqu'à l'époque (comme les formulaires d'entrée au port d'immigration, les chèques, les bordereaux de paiement, les enveloppes et différents types de notes et de messages). Des méthodes telles que l'apprentissage automatique et les structures de classificateurs profonds, l'extraction de l'espace et des marges, l'inclinaison et la direction des lignes, la largeur et l'étroitesse, les connexions et les déconnexions des traits seront analysées avec de grandes quantités de données. Les procédures de formation et les principes d'apprentissage seront présentés, par exemple les méthodologies permettant aux ordinateurs de fournir des taux de reconnaissance robustes pour des applications pratiques au bureau et sur les téléphones portables. En outre, l'art et la science de la graphologie seront passés en revue, et les techniques d'informatisation de la graphologie seront illustrées par des exemples intéressants. La reconnaissance de l'écriture manuscrite (HWR), également appelée reconnaissance de texte manuscrit (HTR), est la capacité d'un ordinateur à extraire et à déchiffrer des contributions écrites à la main compréhensibles à partir de sources telles que des documents papier, des photos, des écrans tactiles et d'autres appareils. L'image de la traduction peut également être détectée "déconnectée" d'une feuille de papier par examen optique (reconnaissance optique de caractères) ou reconnaissance de mots perspicace. D'autre part, les mouvements de la pointe du stylet peuvent également être détectés "en ligne", par exemple par un écran d'affichage à stylet, une tâche généralement plus simple car il y a plus de signes disponibles. Un système de reconnaissance de l'écriture manuscrite gère la conception, effectue une division correcte en caractères et trouve les principaux mots possibles. Le déchiffrage physique d'un grand nombre de données écrites à la main est un processus difficile qui est voué à être plein d'erreurs. La reconnaissance de l'écriture manuscrite robotisée peut réduire considérablement le temps nécessaire à la traduction d'énormes volumes de texte et également élaborer une structure pour la création d'utilisations futures de l'IA. La reconnaissance de caractères transcrits est un champ d'investigation continu englobant l'IA, la vision par ordinateur et la reconnaissance d'exemples. Un ordinateur qui effectue la reconnaissance de l'écriture manuscrite peut sécuriser et distinguer les qualités des images, des appareils à écran tactile et les convertir en une structure compréhensible par la machine. Il existe deux principaux types de systèmes de reconnaissance de l'écriture manuscrite : en ligne et hors ligne.La reconnaissance de l'écriture manuscrite en ligne est une particularité des tâches de dénomination de schémas dans la mesure où le générateur caché des informations observées, par exemple le mouvement du stylo, est enregistré directement. Cependant, les informations sont souvent difficiles à déchiffrer étant donné que chaque lettre est répartie sur plusieurs zones du stylo. Par conséquent, une préparation préalable moderne est nécessaire pour obtenir des entrées appropriées pour les calculs de marquage de séquence réguliers, tels que les HMM. Dans cet article, nous décrivons un système capable de traduire correctement les informations de calligraphie en ligne brutes. Le système comprend un système neuronal intermittent préparé pour la dénomination de schémas, associé à un modèle de langage probabiliste. Déconnecté de la reconnaissance de l'écriture manuscrite, l'interprétation des images de contenu écrit à la main est une tâche stimulante, dans la mesure où elle combine la vision informatique avec l'apprentissage de séquence. Dans de nombreux systèmes, les deux composants sont traités indépendamment, avec des méthodes de prétraitement complexes qui veulent supprimer les points forts de l'image et des modèles successifs comme les HMM veulent fournir les traductions. En consolidant deux avancées en cours dans les systèmes neuronaux, les systèmes neuronaux répétitifs multidimensionnels et l'ordre mondial connexionniste, cet article présente un outil de reconnaissance d'écriture manuscrite déconnectée préparé tout compris qui accepte les informations brutes sur les pixels comme informations.