UniR

UniR

UniR

 



 

UniR version 1.0.2

UniR est un add-on à STATGRAPHICS Centurion offrant à tous les utilisateurs de ce logiciel un accès aisé et transparent à des librairies statistiques du langage R. Il lui ajoutera dans sa première version bientôt disponible trois procédures :

Analyse en Composantes Indépendantes (ICA) Classification par cartes auto-organisatrices de Kohonen (SOM)
Réseau de neurones artificiels (ANN)  

D'autres méthodes seront ajoutées dans les futures versions du logiciel UniR. Nous envisageons actuellement les ajouts suivants :

Analyse procrustéenne généralisée (GPA) Classement par séparateurs à vastes marges (SVM)
Recherche de règles d'association (algorithme Apriori) Analyse en composantes principales sur données symboliques

UniR est un logiciel entièrement piloté par des rubans, des menus et des boîtes de dialogue : aucune connaissance de la programmation R n'est donc nécessaire !

Pour une description complète du logiciel, voir le Manuel de l'Utilisateur.

Logiciel UniR

Analyse en composantes indépendantes

L'Analyse en Composantes Indépendantes (Independent Component Analysis - ICA) est une méthode d'analyse des données qui relève des statistiques, des réseaux de neurones et du traitement du signal. Elle est notoirement et historiquement connue en tant que méthode de séparation aveugle de signaux mélangés dans des proportions inconnues et est aujourd'hui appliquée à de nombreux problèmes, notamment en chimiométrie pour l'analyse de spectres (Wikipedia). Cette procédure du logiciel UniR appelle le package R "ica". Illustrons cette technique par un exemple dans lequel les colonnes S1 et S2 du tableur ci-dessous contiennent les signaux sources inconnus, les colonnes A1 et A2 la matrice de mélange de ces signaux inconnus et les colonnes X1 et X2 les signaux mélangés observés. Les données du tableur sont contenues dans un fichier Statgraphics Centurion (format *.sgd). L'objectif est à partir de ces signaux X1 et X2 observés de retrouver au mieux les signaux inconnus d'origine S1 et S2.

Logiciel UniR

Visualisons les données d'origine (première ligne) et les données mélangées (deuxième ligne) :

Logiciel UniR 

Renseignons la boîte de dialogue de la procédure ICA comme montré ci-dessous :

Logiciel UniR

Trois algorithmes sont poposés dans cette procédure : JADE, FastICA et Infomax. Choisissons l'algorithme JADE et exécutons le traitement. Après quelques secondes le rapport au format explorateur s'affiche dans le tableur d'UniR :

Logiciel UniR 

Demandons l'affichage des graphiques des données initiales (X1, par exemple) et des deux composantes indépendantes extraites (CI_1 et CI_2). Nous retrouvons les signaux d'origine au signe près.

Logiciel UniR 

Logiciel UniR 

Logiciel UniR 

Logiciel UniR 

Les résultats de cette procédure ainsi que divers indicateurs et calculs intermédiaires peuvent être enregistrés dans un fichier Statgraphics Centurion (format *.sgd) pour d'autres traitements graphiques ou statistiques.

Logiciel UniR

Classification par cartes auto-organisatrices de Kohonen

Les cartes auto adaptatives, cartes auto-organisatrices ou cartes topologiques forment une classe de réseau de neurones artificiels fondée sur des méthodes d'apprentissage non-supervisées. Elles sont souvent désignées par le terme anglais « self organizing maps” (SOM), ou encore cartes de Kohonen du nom du statisticien ayant développé le concept en 1984. La littérature utilise aussi les dénominations : « réseau de Kohonen », « réseau auto-adaptatif » ou « réseau auto-organisé ». Elles sont utilisées pour cartographier un espace réel, c'est-à-dire pour étudier la répartition de données dans un espace à grande dimension. En pratique, cette cartographie peut servir à réaliser des tâches de discrétisation, quantification vectorielle ou classification (source Wikipédia). Cette procédure du logiciel UniR appelle le package R "kohonen". Illustrons cette technique par un exemple concernant des vins italiens. Les données concernant ces vins sont constituées de 13 caractéristiques chimiques et spectroscopiques collectées sur 177 échantillons de vins provenant de la région du Piémont en Italie. Une partie du fichier des données est montrée ci-dessous.

Logiciel UniR 

Renseignons la boîte de dialogue de la procédure SOM comme montré ci-après :

Logiciel UniR

Standardisons les données pour éviter les effets d'échelle et choisissons la distance euclidienne au carré pour évaluer les distances. Définissons une grille de dimension 5x5, de topologie hexagonale et une fonction de voisinage gaussienne. Conservons les options par défaut pour le nombre de présentations et le taux d'apprentissage. Cliquons sur Ok. Après quelques secondes le rapport au format explorateur s'affiche dans le tableur d'UniR.

Logiciel UNIR
 

Divers graphiques sont proposés :

 
Logiciel UniRLogiciel UniR  
 
Logiciel UniRLogiciel UniR  
 
Logiciel UniRLogiciel UniR  
 
Logiciel UniRLogiciel UniR  
 
Logiciel UniRLogiciel UniR
 
Les résultats de cette procédure ainsi que divers indicateurs et calculs intermédiaires peuvent être enregistrés dans un fichier Statgraphics Centurion (format *.sgd) pour d'autres traitements graphiques ou statistiques. 
 
Réseaux de neurones artificiels (ANN)
 

Un réseau de neurones artificiels, ou réseau neuronal artificiel, est un système dont la conception est à l'origine schématiquement inspirée du fonctionnement des neurones biologiques, et qui par la suite s'est rapproché des méthodes statistiques. Les réseaux de neurones sont généralement optimisés par des méthodes d’apprentissage de type probabiliste, en particulier bayésien. Ils sont placés d’une part dans la famille des applications statistiques, qu’ils enrichissent avec un ensemble de paradigmes permettant de créer des classifications rapides (réseaux de Kohonen en particulier), et d’autre part dans la famille des méthodes de l’intelligence artificielle auxquelles ils fournissent un mécanisme perceptif indépendant des idées propres de l'implémenteur. Cette procédure du logiciel UniR appelle le package R "neuralnet". Illustrons cette technique en utilisant le fichier "Boston" qui contient des informations collectées par le "U.S Census Service" concernant la valeur des habitations dans l’agglomération de Boston.

 
Logiciel UniR
 
Renseignons la boîte de dialogue de la procédure ANN comme montré ci-après : 
 
Logiciel UniR 
 
Définissons deux couches cachées ayant respectivement 5 et 3 neurones, choisissons la méthode de régression (medv est la variable à expliquer), standardisons les données, chosissons l'algorithme rprop+ (resilient backpropagation with weight backtracking), l'erreur quadratique comme fonction d'erreur et une fonction d'activation logistique. Cliquons sur Ok. Après quelques secondes le rapport au format explorateur s'affiche dans le tableur d'UniR.
 
Logiciel UniR 
 
Divers graphiques sont proposés : graphique du réseau, des poids généralisés, des valeurs prévues vs valeurs observées, des résidus et ceci pour les jeux d'apprentissage et de validation.
 
Logiciel UniR  
 
Logiciel UniR Logiciel UniR  
 
 
Les résultats de cette procédure ainsi que divers indicateurs et calculs intermédiaires peuvent être enregistrés dans un fichier Statgraphics Centurion (format *.sgd) pour d'autres traitements graphiques ou statistiques.  
 

Un site de la société FRANCESTAT    |   Copyright © 2021   |   Tous droits réservés    |   Mentions légales