Abstrait

Data Mining 2016 : Exploration de données avec visualisation de données - Robert S Laramee - Université de Swansea

Robert S Laramee

Certains pensent que nous vivons à l'ère de l'information. Je pense qu'il est beaucoup plus exact de dire que nous vivons à l'ère des données. Avec l'avancée rapide des technologies de stockage de données massives et donc la baisse constante des coûts du matériel, notre capacité à extraire et stocker des données est sans précédent. Cependant, un écart démesuré subsiste entre notre capacité à obtenir et stocker de grandes collections de données complexes et dépendantes du temps et notre capacité à en tirer des informations et des connaissances utiles. La visualisation des données exploite notre sens le plus puissant, la vision, afin d'extraire des connaissances et d'obtenir un aperçu de grands ensembles de données multivariées qui décrivent des comportements complexes et parfois dépendants du temps. Cette conférence présente le traitement des données du point de vue de la visualisation des connaissances avec trois applications très différentes : la dynamique des fluides computationnelle (CFD), la biologie marine et le rugby, mettant en avant un certain nombre de forces, de faiblesses et d'objectifs de la visualisation. La visualisation des données est essentielle au traitement réussi des données et à l'extraction de connaissances et d'informations à partir de big data. L'exploration de données est utilisée pour trouver des modèles, des anomalies et des corrélations dans le grand ensemble de données afin de faire des prédictions à l'aide d'un large éventail de techniques. Ces informations extraites sont utilisées par l'organisation pour augmenter ses revenus, réduire les coûts, réduire les risques, améliorer la relation client, etc. tandis que la visualisation des données est la représentation graphique des données et des informations extraites de l'exploration de données à l'aide d'éléments visuels tels que des graphiques, des diagrammes et des cartes, un outil de visualisation des données et des techniques qui aident à analyser une quantité massive de données et à prendre des décisions en fonction de celles-ci. Sans le concept de visualisation, l'exploration et l'analyse ne jouent aucun rôle important car le traitement des données consiste à trouver des inférences en analysant les informations à travers des modèles et ces modèles ne peuvent être représentés que par différentes techniques de visualisation. L'exploration de données est le processus d'identification de nouveaux modèles et informations dans les données. À mesure que le volume de connaissances collectées et stockées dans les bases de données augmente, il devient de plus en plus nécessaire de fournir un résumé des données (par exemple, via la visualisation), d'identifier les modèles et les tendances importants et d'agir sur la base des résultats. Les informations obtenues grâce au traitement des données peuvent apporter une valeur considérable, souvent cruciale pour les entreprises qui cherchent à trouver des avantages concurrentiels. Un bref aperçu de l'exploration des connaissances et des résultats théoriques importants est fourni, suivi des avancées et des défis récents. La quantité de données stockées sur les supports électroniques augmente de manière exponentielle. Les entrepôts de données d'aujourd'hui éclipsent les bases de données les plus importantes créées il y a dix ans, et il devient de plus en plus difficile de donner un sens à ces données. La vente au détail en ligne à l'ère d'Internet, par exemple, est très différente de la vente au détail d'il y a dix ans, car les trois facteurs les plus importants du passé (emplacement, emplacement et emplacement) ne sont plus pertinents pour les magasins en ligne. L'un des plus grands défis auxquels nous sommes confrontés aujourd'hui est de donner un sens à toutes ces données. Exploration de données,La découverte de connaissances est le processus d'identification de nouveaux modèles et de nouvelles perspectives dans les données, que ce soit pour comprendre le génome humain afin de développer de nouveaux médicaments, pour découvrir de nouveaux modèles dans les données de recensement récentes afin d'avertir des tendances cachées, ou pour mieux comprendre vos clients dans une boutique en ligne électronique afin de leur offrir une expérience personnalisée en face à face. Les exemples présentés dans cet article proviennent du monde du commerce électronique, mais le traitement des données a été largement utilisé dans de nombreux domaines, y compris de nombreuses applications scientifiques. L'article se limite également à l'exploration structurée ; il existe une littérature importante sur l'exploration de texte et la récupération de connaissances.  

Biographie:

Robert S Laramee a obtenu une licence en physique de l'université du Massachusetts à Amherst. En 2000, il a obtenu une maîtrise en informatique de l'université du New Hampshire à Durham. Il a obtenu un doctorat de l'université de technologie de Vienne, en Autriche, à l'Institut d'infographie et d'algorithmes en 2005. De 2001 à 2006, il a été chercheur au centre de recherche VRVis (www.vrvis.at) et ingénieur logiciel à l'AVL (www.avl.com) dans le département des technologies de simulation avancées. Actuellement, il est professeur associé au département d'informatique de l'université de Swansea, au Pays de Galles. Ses intérêts de recherche portent sur la visualisation des mégadonnées, l'analyse visuelle et l'interaction homme-machine. Il a publié plus de 100 articles scientifiques évalués par des pairs.

Avertissement: Ce résumé a été traduit à l'aide d'outils d'intelligence artificielle et n'a pas encore été examiné ni vérifié

Indexé dans

Google Scholar
Academic Journals Database
Open J Gate
Academic Keys
ResearchBible
CiteFactor
Electronic Journals Library
RefSeek
Hamdard University
Scholarsteer
International Innovative Journal Impact Factor (IIJIF)
International Institute of Organised Research (I2OR)
Cosmos

Voir plus