Abstrait

Machine Learning 2018 : Deep learning : Approche multi-objectifs par renforcement profond pour la planification du réapprovisionnement en espèces des distributeurs automatiques de billets - Nabil Belgasmi-Banque de Tunisie

Nabil Belgasmi

Le système actuel d'apprentissage par renforcement repose sur une amélioration de l'exécution d'une cible unique qui amplifie les gains normaux en fonction des récompenses scalaires qui proviennent soit d'une réaction conditionnelle univariée aux activités de l'opérateur, soit d'un total pondéré d'une réaction multivariée. Cependant, dans de nombreuses circonstances avérées, des compromis doivent être faits entre plusieurs destinations conflictuelles qui ont des niveaux significatifs, des unités d'estimation et des paramètres commerciaux spécifiques différents liés au problème abordé (par exemple, les coûts, le délai d'exécution, la nature du service, les avantages, etc.). Le total de ces sous-récompenses pour obtenir une récompense scalaire nécessite une information idéale sur les inclinations du leader et la manière dont il perçoit l'importance de chaque cible. Dans cette étude, nous examinons la question de l'apprentissage des meilleures approches de renouvellement d'argent ATM dans un environnement multi-cibles douteux compte tenu d'un historique subjectif de retraits d'argent qui peuvent ne pas être fixes et peuvent contenir des exceptions. Nous proposons une approche d'apprentissage par renforcement profond multi-cible sans modèle qui nous permet de rivaliser avec le leader humain et de localiser la meilleure stratégie par GAB qui bat l'arrangement humain actuel. L'idée est de désagréger la présentation d'une stratégie de recharge pour encadrer un vecteur de capacités cibles. La présentation de l'arrangement humain est alors un point de référence multidimensionnel (Rh). La tâche du calcul d'apprentissage par renforcement profond est de découvrir un arrangement qui crée un grand nombre de points d'exécution qui dépassent au sens de Pareto le point de référence humain actuel (Rh). Pour améliorer les chiffres de demande d'argent des GAB, cet article préconise l'espérance de taux d'intérêt pour les groupes de GAB avec des modèles de demande d'argent par jour de la semaine comparatifs. Nous avons précédemment regroupé les habitats de GAB en groupes de GAB ayant des modèles de retrait par jour de la semaine comparatifs. Pour récupérer les limites d'irrégularité de retrait du « jour de la semaine » (effet d'un lundi, etc.), nous avons fabriqué un modèle d'arrangement de temps pour chaque GAB. Pour le regroupement, la progression de sept limites d'irrégularité de retrait quotidiennes incessantes des GAB est discrétisée. Ensuite, la similarité entre la succession d'irrégularités de retrait quotidiennes discrétisées des différents distributeurs automatiques de billets est estimée par la méthode d'alignement de séquence (SAM). Pour chaque groupe de distributeurs automatiques de billets, quatre systèmes neuronaux, à savoir le système neuronal de rechute générale (GRNN), le système neuronal à propagation avant multicouche (MLFF), la stratégie de groupe pour la gestion des données (GMDH) et le système neuronal à ondelettes (WNN), sont utilisés pour prévoir la demande d'argent d'un emplacement de distributeur automatique de billets. La stratégie proposée est appliquée sur l'ensemble de données de concurrence NN5. Nous avons vu que GRNN a donné le meilleur résultat d'erreur de taux suprême moyen symétrique de 18,44 % (SMAPE), ce qui est meilleur que l'effet d'Andrawis, Atiya et El-Shishiny (2011). Cela est dû au regroupement suivi d'une étape déterminante. De plus,L'approche proposée a donné des valeurs SMAPE beaucoup plus faibles que la méthodologie de prévision directe sur l'ensemble de l'exemple sans regroupement. D'un point de vue administratif, la jauge de demande d'argent par groupe aide la haute direction de la banque à concevoir des plans de renouvellement d'argent comparables pour tous les GAB d'un même groupe. Ces plans de renouvellement au niveau du groupe pourraient permettre d'économiser des coûts d'exploitation colossaux pour les GAB fonctionnant dans une zone géographique comparable. (c) 2013 Elsevier BV Tous droits réservés. Le composant, intégré plus tard dans Google Photos en 2015, a été largement considéré comme un avantage distinct, une preuve de l'idée que les logiciels de vision par ordinateur pouvaient regrouper des images en mesures humaines, ajoutant une incitation de plusieurs manières différentes : les utilisateurs n'étaient plus alors obligés d'étiqueter les photos avec des signes tels que "plage" pour organiser le contenu de l'image, supprimant ainsi une tâche manuelle qui pouvait s'avérer très fastidieuse lors de la gestion d'ensembles de centaines ou de milliers d'images. Les utilisateurs pouvaient explorer leur collection de photos de nouvelles manières, en utilisant des mots-clés pour trouver des photos avec des objets qu'ils n'auraient peut-être jamais étiquetés. Par exemple, ils pourraient rechercher « palmier » pour faire apparaître toutes leurs photos d'excursion qui avaient des palmiers hors de vue. La programmation pourrait « voir » des différenciations taxonomiques que les clients finaux eux-mêmes n'auront probablement pas la possibilité de voir (par exemple, reconnaître les félins siamois et abyssins), élargissant ainsi de manière adéquate les informations de localisation des clients.

Biographie :

Nabil Belgasmi est titulaire d'un doctorat et d'un diplôme d'ingénieur en informatique de l'Université de Manouba. Il est Data Scientist full stack à la Banque de Tunisie, Tunisie. Il est impliqué dans trois activités principales : (1) R&D appliquée, (2) Veille technologique en analyse de données et (3) Conseil en science des données. Il a réalisé avec succès de nombreux POC et Quick-Wins en science des données : notation de crédit, prévision, planification de trésorerie, détection d'anomalies/fraudes, profilage des clients, notation et surveillance intelligentes des transactions, etc. Il est membre du comité éditorial industriel de la revue Engineering Applications of Artificial Intelligence (EAAI).

Avertissement: Ce résumé a été traduit à l'aide d'outils d'intelligence artificielle et n'a pas encore été examiné ni vérifié

Indexé dans

Google Scholar
Academic Journals Database
Open J Gate
Academic Keys
ResearchBible
CiteFactor
Electronic Journals Library
RefSeek
Hamdard University
Scholarsteer
International Innovative Journal Impact Factor (IIJIF)
International Institute of Organised Research (I2OR)
Cosmos

Voir plus