UniR

UniR

UniR

 



 

UniR version 1.0

UniR est un nouveau module complémentaire à STATGRAPHICS Centurion offrant à tous les utilisateurs de ce logiciel un accès aisé et transparent aux librairies statistiques du langage R. Il lui ajoutera dans sa première version bientôt disponible deux procédures :

Analyse en Composantes Indépendantes (ICA) Classification par cartes auto-organisatrices de Kohonen (SOM)

D'autres méthodes seront ajoutées dans les futures versions du logiciel UniR. Nous envisageons actuellement les ajouts suivants :

Analyse procrustéenne généralisée (GPA) Réseau de neurones artificiels (perceptron multi-couches)
Recherche de règles d'association (algorithme Apriori) Classement par séparateurs à vastes marges (SVM)
Analyse en composantes principales sur données symboliques  

UniR est un logiciel entièrement piloté par des rubans, des menus et des boîtes de dialogue : aucune connaissance de la programmation R n'est nécessaire !

Logiciel UniR

Analyse en composantes indépendantes

L'Analyse en Composantes Indépendantes (Independent Component Analysis - ICA) est une méthode d'analyse des données qui relève des statistiques, des réseaux de neurones et du traitement du signal. Elle est notoirement et historiquement connue en tant que méthode de séparation aveugle de signaux mélangés dans des proportions inconnues et est aujourd'hui appliquée à de nombreux problèmes, notamment en chimiométrie pour l'analyse de spectres (Wikipedia et Douglas N. Rutledge). Illustrons rapidement cette technique par un exemple dans lequel les colonnes S1 et S2 du tableur ci-dessous contiennent les signaux sources inconnus, les colonnes A1 et A2 la matrice de mélange de ces signaux inconnus et les colonnes X1 et X2 les signaux mélangés observés. Les données du tableur sont contenues dans un fichier Statgraphics Centurion (format *.sgd). L'objectif est à partir de ces signaux X1 et X2 observés de retrouver au mieux les signaux inconnus d'origine S1 et S2.

Logiciel UniR

Visualisons les données d'origine (première ligne) et les données mélangées (deuxième ligne) :

Logiciel UniR 

Renseignons la boîte de dialogue de la procédure ICA comme montré ci-dessous :

Logiciel UniR

Trois algorithmes sont poposés dans cette procédure : JADE, FastICA et Infomax. Choisissons l'algorithme JADE et exécutons le traitement. Après quelques secondes le rapport au format explorateur s'affiche dans le tableur d'UniR :

Logiciel UniR 

Demandons l'affichage des graphiques des données initiales (X1, par exemple) et des deux composantes indépendantes extraites (CI_1 et CI_2). Nous retrouvons les signaux d'origine au signe près.

Logiciel UniR 

Logiciel UniR 

Logiciel UniR 

Logiciel UniR 

Les résultats de cette procédure ainsi que divers indicateurs et calculs intermédiaires peuvent être enregistrés dans un fichier Statgraphics Centurion (format *.sgd) pour d'autres traitements graphiques ou statistiques.

Logiciel UniR

Classification par cartes auto-organisatrices de Kohonen

Les cartes auto-organisatrices font partie de la famille des méthodes neuronales, elles-mêmes basées sur l'algorithmique : la solution du problème n'est pas calculée directement mais approchée de manière itérative. Elles permettent de faire de la classification non supervisée de données, tout comme le permettent les méthodes des centres mobiles et de classification ascendante hiérarchique, par exemple. Les travaux de référence dans ce domaine sont ceux de Teuvo Kohonen. A la différence des méthodes de classification ordinaires, les cartes auto-organisatrices organisent les classes trouvées sur une carte dont la topologie cherche à respecter la topologie des données d'origine. Illustrons rapidement cette technique par un exemple concernant des vins italiens. Les données concernant ces vins sont constituées de 13 caractéristiques chimiques et spectroscopiques collectées sur 177 échantillons de vins provenant de la région du Piémont en Italie. Une partie du fichier des données est montrée ci-dessous.

Logiciel UniR 

Renseignons la boîte de dialogue de la procédure SOM comme montré ci-après :

Logiciel UniR

Standardisons les données pour éviter les effets d'échelle et choisissons la distance euclidienne au carré pour évaluer les distances. Définissons une grille de dimension 5x5, de topologie hexagonale et une fonction de voisinage gaussienne. Conservons les options par défaut pour le nombre de présentations et le taux d'apprentissage. Cliquons sur Ok. Après quelques secondes le rapport au format explorateur s'affiche dans le tableur d'UniR.

Logiciel UNIR
 

Divers graphiques sont proposés :

 
Logiciel UniRLogiciel UniR  
Logiciel UniRLogiciel UniR  
 
Logiciel UniRLogiciel UniR  
 
Logiciel UniRLogiciel UniR  
 
Logiciel UniRLogiciel UniR
 
Les résultats de cette procédure ainsi que divers indicateurs et calculs intermédiaires peuvent être enregistrés dans un fichier Statgraphics Centurion (format *.sgd) pour d'autres traitements graphiques ou statistiques. 
 

Un site de la société FRANCESTAT    |   Copyright © 2018   |   Tous droits réservés    |   Mentions légales