Statistiques de base

STATGRAPHICS Centurion contient un grand nombre de procédures pour les statistiques de base. Parmi celles-ci :

  1. Statistiques résumées - calcul des moyennes, médianes, écarts-types et autres statistiques résumées.

  2. Analyse d'un échantillon - caractérisation d'un échantillon de données issu d'une population unique.

  3. Identification de point extrêmes - tests statistiques pour déterminer si une ou plusieurs valeurs extrêmes sont présentes dans l'échantillon.

  4. Comparaison de deux échantillons - comparaison de données collectées dans deux jeux de conditions différentes.

  5. Analyse de données de type attribut - méthodes pour résumer des données de type attribut.

  6. Détermination de la taille d'un échantillon - calcul de la taille requise pour un échantillon dans des cas courants.

  7. Lois de probabilités - calcul de probabilités et de nombres aléatoires pour 45 lois différentes.

Statistiques résumées

Un des buts des calculs statistiques est de résumer l'information contenue dans des échantillons de données. Dans STATGRAPHICS Centurion, vous pouvez sélectionner un large nombre de statistiques résumées comme par exemple la moyenne (Winsor) ou l'écart-type (Winsor) qui sont moins sensibles aux points extrêmes que les habituels moyenne et écart-type. Les coefficients d'asymétrie standardisée et d'aplatissement standardisé sont également importants car ils permettent de tester si les échantillons suivent on non une loi normale. Le StatAdvisor met en évidence en couleur rouge les échantillons dont les valeurs indiquent un écart significatif à la normalité.

  Width MPG City MPG Highway Horsepower Fueltank Length
Effectif 93 93 93 93 93 93
Moyenne 69.37634409 22.3655914 29.08602151 143.827957 16.66451613 183.2043011
Médiane 69.0 21.0 28.0 140.0 16.4 183.0
Mode 67.0 18.0 26.0      
Moyenne géométrique 69.27515865 21.779904 28.64501492 135.0576292 16.33432101 182.6204355
Moyenne écrêtée à 5% 69.30704898 21.8255675 28.72162485 140.1212664 16.64241338 183.29092
Moyenne (Winsor) à 5% 69.37634409 22.04301075 28.84946237 142.5591398 16.58817204 183.311828
Variance 14.28073866 31.58228144 28.42730248 2743.078775 10.75427069 213.2295465
Ecart-type 3.77898646 5.619811513 5.331726032 52.37440954 3.279370471 14.60238154
Coef. de variation 5.447082157% 25.12704186% 18.33088802% 36.41462386% 19.67876202% 7.970545151%
Erreur-type 0.3918626414 0.5827473072 0.5528742344 5.430973274 0.3400548768 1.514196428
Ecart-type (Winsor) à 5% 3.807617611 4.763237141 4.595407222 49.59705789 3.079418987 13.24852058
MAD 3.0 3.0 3.0 30.0 2.1 9.0
Sbi 3.817263495 4.566424932 4.675016279 49.21030463 3.310922087 14.35213606
Minimum 60.0 15.0 20.0 55.0 9.2 141.0
Maximum 78.0 46.0 50.0 300.0 27.0 219.0
Etendue 18.0 31.0 30.0 245.0 17.8 78.0
1er quartile 67.0 18.0 26.0 103.0 14.5 174.0
3ème quartile 72.0 25.0 31.0 170.0 18.8 192.0
Etendue inter-quartiles 5.0 7.0 5.0 67.0 4.3 18.0
1er sextile 66.0 18.0 25.0 92.0 13.2 172.0
5ème sextile 74.0 28.0 33.0 185.0 20.0 198.0
Etendue inter-sextiles 8.0 10.0 8.0 93.0 6.8 26.0
Asymétrie 0.2640273811 1.704430146 1.229896739 0.9517282451 0.108146202 -0.09009462207
Asymétrie std. 1.039476839 6.710348196 4.842108303 3.746957848 0.4257720232 -0.3547028818
Aplatissement -0.2464277039 4.00430589 2.614200606 1.11088259 0.127206499 0.4492504133
Aplatissement std. -0.4850934203 7.882484027 5.14605904 2.186774565 0.2504062437 0.8843503229
Somme 6452.0 2080.0 2705.0 13376.0 1549.8 17038.0
Somme des carrés 448930.0 49426.0 81293.0 2176206.0 26816.06 3141052.0

Analyse d'un échantillon

Lorsque n observations ont été collectées pour une unique population, il est habituel d'afficher les données sous la forme d'un histogramme. L'une quelconque des 45 lois de probabilités disponibles peut être ajustée aux données de façon à permettre de faire des prévisions sur de futurs échantillons de la population sous-jacente.

Identification de points extrêmes

Toute personne qui analyse des données est confrontée à la question suivante : conserver ou retirer les données qui provoquent un écart apparent à la normalité. Les conséquences d'une mauvaise décision peuvent être importantes. Dans STATGRAPHICS Centurion, la procédure d'identification des points extrêmes calcule plusieurs tests (dont Grubbs et Dixon) pour déterminer si une valeur suspecte est de façon probable un point extrême.

Comparaison de deux échantillons

Un problème courant en analyse statistique est de comparer deux échantillons et de déterminer s'il y a ou non une différence significative entre eux. STATGRAPHICS Centurion met à disposition des procédures pour comparer à la fois des échantillons appariés et non appariés. Les tests paramétriques t et F ainsi que le test non paramétrique des rangs signés sont disponibles. De plus, en complément du tableau numérique fourni, le StatAdvisor donne des conseils et des suggestions concernant cette analyse.

Comparison of Means
95.0% confidence interval for mean of Placebo: 118.3 +/- 6.477   [111.8,124.7]
5.0% confidence interval for mean of Test Agent: 100.0 +/- 3.285   [96.72,103.3]
95.0% confidence interval for the difference between the means
   not assuming equal variances: 18.27 +/- 7.023   [
11.24,25.29]

t test to compare means
Null hypothesis: mean1 = mean2
Alt. hypothesis: mean1 NE mean2
   not assuming equal variances: t = 5.423   P-value =
0.00002557
Reject the null hypothesis for alpha = 0.05.

The StatAdvisor
This option runs a t-test to compare the means of the two samples.  It also constructs confidence intervals or bounds for each mean and for the difference between the means.  Of particular interest is the confidence interval for the difference between the means, which extends from 11.24 to 25.29. Since the interval does not contain the value 0.0, there is a statistically significant difference between the means of the two samples at the 95.0% confidence level. 

A t-test may also be used to test a specific hypothesis about the difference between the means of the populations from which the two samples come.  In this case, the test has been constructed to determine whether the difference between the two means equals 0.0 versus the alternative hypothesis that the difference does not equal 0.0.  Since the computed P-value is less than 0.05, we can reject the null hypothesis in favor of the alternative. 

NOTE: these results do not assume that the variances of the two samples are equal. In this case, the variances appear to be significantly different based on the results of an F-test to compare the standard deviations. You can see the results of that test by selecting Comparison of Standard Deviations from the Tabular Options menu.

Analyse de données de type attribut

Lorsque les données sont de type attribut plutôt que des mesures, les méthodes statistiques nécessaires pour analyser ces données sont différentes. Dans de tels cas, l'intérêt porte surtout sur le calcul de taux ou de proportions. Les procédures de Tri à plat, de Tri croisé, de Comparaison de proportions et de Comparaison de taux sont alors applicables. Dans le cas de deux variables qualitatives, le graphique en mosaïque est un outil utile pour visualiser les associations.

Détermination de la taille d'un échantillon

STATGRAPHICS Centurion possède des procédures pour déterminer les tailles d'échantillons à partir de moyennes, d'écarts-types, de taux et de proportions. Les tailles peuvent être basées sur l'intervalle de confiance désiré ou sur la puissance du test d'hypothèse.

Lois de probabilités

STATGRAPHICS Centurion permet d'effectuer des calculs sur 45 lois de probabilités. Aires sous la courbe, valeurs critiques et nombres aléatoires peuvent être calculés.

Copyright © 2012 - Christian R. CHARLES - Tous droits réservés