Η Δουλειά ενός Αναλυτή Δεδομένων
[Data Analyst Job]
Ο όρος data analytics έγινε δημοφιλής στις αρχές της δεκαετίας του 2000. Η ανάλυση δεδομένων ορίζεται ως η εφαρμογή υπολογιστικών συστημάτων για την ανάλυση μεγάλων συνόλων δεδομένων (big datasets) ώστε να παρθούν σωστά και τεκμηριωμένα οι αποφάσεις. Η ανάλυση δεδομένων είναι ένα διεπιστημονικό πεδίο που έχει υιοθετήσει πτυχές από πολλούς άλλους επιστημονικούς κλάδους, όπως η στατιστική, η μηχανική μάθηση, αναγνώριση προτύπων, θεωρία συστημάτων, επιχειρησιακή έρευνα ή τεχνητή νοημοσύνη. Η ανάλυση δεδομένων μπορεί να πραγματοποιηθεί σε διάφορες φάσεις. Συγκεκριμένα, τα δεδομένα αξιολογούνται και επιλέγονται, καθαρίζονται και φιλτράρονται, οπτικοποιούνται και αναλύονται, και τα αποτελέσματα της ανάλυσης ερμηνεύονται και αξιολογούνται.
Ένας data scientist πολλές φορές έχει γνώσεις στην μηχανική, στην στατιστική και στην ανάλυση.
1) Μηχανική γνώση (Mechanical knowledge): Οι ειδικοί της μηχανικής μάθησης γνωρίζουν ότι δεν υπάρχει το τέλειο εγχειρίδιο. Όμως έχοντας μεγάλη διαίσθηση για το πόσο χρόνο θα τους πάρει να δοκιμάσουν κάθε νέα επιλογή, είναι ένα τεράστιο πλεονέκτημα και είναι πιο πολύτιμο από την βαθιά γνώση του τρόπου λειτουργίας των αλγορίθμων.
2) Στατιστική γνώση (Statistical knowledge): Οι στατιστικολόγοι είναι ειδικοί στο να καταλήγουν σε συμπεράσματα πέρα από τα δεδομένα με ασφάλεια. Γι’ αυτούς, ένα πρόχειρο συμπέρασμα είναι ένα μεγάλο αμάρτημα. Τους ενδιαφέρει βαθιά αν οι μέθοδοι που εφαρμόζονται να είναι σωστές για το πρόβλημα και αγωνιούν για το ποια συμπεράσματα είναι έγκυρα από τις διαθέσιμες πληροφορίες.
3) Αναλυτική γνώση (Analytical knowledge): Οι αναλυτές είναι προγραμματιστές οι οποίοι μπορούν να σερφάρουν σε τεράστια σύνολα δεδομένων και να αναδύουν πιθανές ιδέες γρηγορότερα από άλλους ειδικούς. Η γνώση της οπτικής παρουσίασης των πληροφοριών βοηθά, όπως επίσης, και η ταχύτητα είναι ύψιστη αρετή τους, ακολουθούμενη στενά από την ικανότητα εντοπισμού δυνητικά χρήσιμων πολύτιμων λίθων.
Μηχανικοί & Στατιστικοί: Έχουν κάποια κοινά χαρακτηριστικά, ένα από αυτά είναι ότι παρέχουν λύσεις υψηλής προσπάθειας σε συγκεκριμένα προβλήματα.
Αναλυτές: Ο αναλυτές δεν αποφαίνονται κάτι σχετικά με το πρόβλημα πέρα από τα δεδομένα που προκύπτουν.
Λήψη αποφάσεων (Decision making): Ο υπεύθυνος λήψης αποφάσεων θα πρέπει στη συνέχεια να λειτουργεί ως φίλτρο μεταξύ των διερευνητικών αναλύσεων δεδομένων και της στατιστικής αυστηρότητας. Ένας στατιστικολόγος θα αφιερώσει χρόνο για να πραγματοποιήσει μία πιο αυστηρή ανάλυση μόνον εφόσον πάρει την έγκριση από έναν ειδικό των λήψεων απόφασης.
Τεχνητή νοημοσύνη (Artificial intelligence): Οι μηχανικοί μάθησης περνούν πολλά δεδομένα ώστε να ξεκινήσει ο αλγόριθμος να τρέχει, έπειτα προσαρμόζουν τις ρυθμίσεις (εντολές) στις ανάγκες της εκάστοτε εργασίας. Επαναλαμβάνουν την όλη διαδικασία μέχρι να παραχθεί το επιθυμητό αποτέλεσμα.
Βιβλιογραφία:
Cassie Kozyrkov, 2018, What Great Data Analysts Do — and Why Every
Organization Needs Them, Harvard business review.
Thomas A. Runkler, 2016, Data Analytics Models and Algorithms for Intelligent Data Analysis, Lehrbuch, 2nd endition, (1-3)
Για περισσότερα σχετικά με την δουλειά ενός Αναλυτή Δεδομένων, καθώς και για περαιτέρω πληροφορίες, επικοινωνήστε με την ομάδα της DatAnalysis!