Περιγραφική Στατιστική [Descriptive Statistics]
Το αντικείμενο της Περιγραφικής Στατιστικής [Descriptive Statistics] αποτελεί η οργάνωση, η σύνοψη και η παρουσίαση των δεδομένων με τη χρήση κατάλληλων τεχνικών.
Τεχνικές παρουσίασης των αποτελεσμάτων:
- Γραφήματα: Αναπαριστούν τα δεδομένα
- Αριθμητικοί Δείκτες: Αντιπροσωπεύουν ιδιότητες των δεδομένων
Μέτρα Περιγραφικής Στατιστικής
- Μέτρα κεντρικής θέσης ή τάσης (θέση του κέντρου ή του μεγαλύτερου όγκου των δεδομένων κάθε μεταβλητής).
- Μέτρα διασποράς (η διασπορά των δεδομένων κάθε μεταβλητής)
- Μέτρα ασυμμετρίας (ασυμμετρία της κατανομής των δεδομένων)
Σημείωση: Τα μέτρα κεντρικής θέσης υπολογίζουν, με διάφορους τρόπους την κεντρική θέση κάθε μεταβλητής, ωστόσο αξίζει να τονιστεί ότι αφορούν σχεδόν αποκλειστικά συνεχείς μεταβλητές
Τα κυριότερα Μέτρα Κεντρικής Τάσης που εφαρμόζονται σε συνεχείς μεταβλητές είναι τα εξής:
- Μέσος όρος (mean, average, expected value): Αποτελεί το πιο γνωστό μέτρο θέσης και υπολογίζεται από το λόγο του αθροίσματος όλων των τιμών μίας μεταβλητής προς το πλήθος των τιμών
- Διάμεσος (median): Πρόκειται για τη μεσαία παρατήρηση, δηλαδή, αυτή που χωρίζει το δείγμα σε δύο ίσα μέρη
- Τεταρτημόρια (quartiles): : Είναι οι τιμές που χωρίζουν τα δεδομένα σε τέσσερα ίσα μέρη
- Εκατοστημόρια ή ποσοσοστημόρια ή ποσοστιαία σημεία (percentiles): Αποτελούν επέκταση της έννοιας των τεταρτημορίων
- Επικρατούσα τιμή ή κορυφή (mode): Πρόκειται για τη συχνότερη παρατήρηση
Σημείωση: Σχετικά με τα μέτρα διασποράς εξετάζουν το πόσο «απλωμένα» ή «διεσπαρμένα» είναι τα δεδομένα, καθώς επίσης αναφέρονται σε συνεχή δεδομένα
Τα κυριότερα μέτρα διασποράς είναι τα ακόλουθα:
- Διακύμανση ή διασπορά (variance) και τυπική απόκλιση (standard deviation): Η τυπική απόκλιση αποτελεί το κυριότερο μέτρο διασποράς και δηλώνει τη μέση απόσταση κάθε παρατήρησης από το μέσο όρο των δεδομένων. Επίσης, η διακύμανση και η τυπική απόκλιση είναι μαθηματικά ισοδύναμες ποσότητες, αφού η δεύτερη είναι η τετραγωνική ρίζα της πρώτης.
- Εύρος (range): Πρόκειται για τη διαφορά μεταξύ της μικρότερης και της μεγαλύτερης παρατήρησης
- Ενδοτεταρτημοριακό εύρος (interquartile range): Αναφέρεται στη διαφορά του πρώτου από το τρίτο τεταρτημόριο. Στο μεταξύ τους διάστημα συγκεντρώνεται το μεσαίο 50% των τιμών του δείγματος
Επιπλέον, άλλα μέτρα Περιγραφικής Στατιστικής αποτελούν:
- Συντελεστές ασυμμετρίας (skewness coefficients): Καταγράφουν τη συμμετρία ή μη των δεδομένων σχετικά με την κορυφή τους
- Συντελεστής μεταβλητότητας (CV-coefficient of variation): Χρησιμοποιείται για τη σύγκριση της μεταβλητότητας-ανομοιογένειας μεταξύ δύο ή περισσότερων δειγμάτων, όταν διαφέρει η τυπική απόκλιση αλλά και ο μέσος όρος τους