Abstrait

Machine Learning 2018 : Apprentissage profond : une application de l'apprentissage automatique pour classer les images - Aisha Al Owais-Sharjah Center for Astronomy and Space Sciences

Aïcha Al Owais

Au XXIe siècle, l'arme la plus puissante de l'humanité est la technologie. Le domaine technologique qui nous intéresse est l'informatique, en particulier l'IA (IA). Comme son nom l'indique, l'IA consiste à transformer les appareils en agents intelligents qui prennent des mesures en fonction de l'environnement qu'ils perçoivent. Ils sont également flexibles en termes d'ajustement de leur objectif - ce qu'ils sont censés essayer d'atteindre - ainsi que d'ajustement de leurs actions en fonction de l'évolution de leur environnement. Ce qui rend les agents IA particuliers, c'est leur capacité à apprendre et à se souvenir de leurs erreurs. De plus, l'apprentissage automatique (ML) est l'une des applications de l'IA qui permettent aux systèmes de découvrir automatiquement, de s'améliorer grâce à l'expérience et d'ajuster leurs actions sans intervention humaine. Cela nous amène à l'apprentissage profond (DL), un sous-domaine de remplacement du ML qui concerne les algorithmes inspirés de la structure et des performances du cerveau humain, appelés réseaux neuronaux artificiels. Il dispose de réseaux capables d'apprendre des données obtenues à partir de données instruites ou non étiquetées ; c'est pourquoi il est également connu sous le nom de réseau neuronal profond (DNN). Tous ces termes nous conduisent à ce qui nous intéresse le plus, les réseaux neuronaux convolutionnels (CNN), qui sont des réseaux neuronaux profonds particulièrement adaptés à la classification des images, dans notre cas pour classer les images de météorites. La classification d'images est un problème d'apprentissage supervisé : définir un ensemble de classes cibles (objets à identifier dans les images) et entraîner un modèle à les reconnaître à l'aide d'exemples de photos étiquetées. Les premiers modèles de vision par ordinateur s'appuyaient sur des données de pixels bruts comme entrée du modèle. Cependant, comme le montre la figure 2, les données de pixels bruts à elles seules ne fournissent pas une représentation suffisamment stable pour englober la myriade de variations d'un objet tel qu'il est capturé dans une image. La position de l'objet, l'arrière-plan derrière l'objet, l'éclairage ambiant, l'angle de la caméra et la mise au point de la caméra peuvent tous produire des fluctuations dans les données de pixels bruts ; ces différences sont suffisamment importantes pour ne pas pouvoir être corrigées en prenant des moyennes pondérées des valeurs RVB des pixels. Pour modéliser les objets de manière plus flexible, les modèles de vision par ordinateur classiques ont ajouté de nouvelles fonctionnalités dérivées des données de pixels, telles que les histogrammes de couleurs, les textures et les formes. L'inconvénient de cette approche était que l'ingénierie des fonctionnalités devenait un véritable fardeau, car il y avait tellement d'entrées à modifier. Pour un classificateur de chats, quelles couleurs étaient les plus pertinentes ? Quelle devait être la flexibilité des définitions de forme ? Étant donné que les fonctionnalités devaient être réglées avec une telle précision, la création de modèles robustes était assez difficile et la précision en souffrait. Les voitures autonomes sont un excellent exemple pour comprendre où la classification d'images est utilisée dans le monde réel. Pour permettre la conduite autonome, nous pouvons créer un modèle de classification d'images qui reconnaît divers objets, tels que des véhicules, des personnes, des objets en mouvement, etc. sur la route. Nous verrons quelques autres cas d'utilisation plus loin dans cet article, mais il existe de nombreuses autres applications autour de nous.Utilisez la section commentaires sous l'article pour me faire savoir quels cas d'utilisation potentiels vous pouvez proposer ! Les données sont précieuses en ce qui concerne les modèles d'apprentissage profond. Votre modèle de classification d'images a de bien meilleures chances de fonctionner correctement si vous avez une bonne quantité d'images dans l'ensemble d'entraînement. De plus, la forme des données varie en fonction de l'architecture/du cadre que nous utilisons.  

Biographie :

Aisha Al Owais a obtenu sa licence en informatique au College of Engineering de l'American University of Sharjah. Elle travaille comme assistante de recherche au Meteorites Center du Sharjah Center for Astronomy and Space Sciences.

Avertissement: Ce résumé a été traduit à l'aide d'outils d'intelligence artificielle et n'a pas encore été examiné ni vérifié

Indexé dans

Google Scholar
Academic Journals Database
Open J Gate
Academic Keys
ResearchBible
CiteFactor
Electronic Journals Library
RefSeek
Hamdard University
Scholarsteer
International Innovative Journal Impact Factor (IIJIF)
International Institute of Organised Research (I2OR)
Cosmos

Voir plus