Horizon Scanning

Τεχνολογική περιοχή: ΠΛΗΡΟΦΟΡΙΚΗ

Pexels Pixabay 373543

Data scientist 2.0: Από αστροναύτης σε οδηγός αγώνων αυτοκινήτων

Σύμφωνα με το Γραφείο Στατιστικών Εργασίας των ΗΠΑ, η απασχόληση data scientist (επιστημόνων δεδομένων) προβλέπεται να αυξηθεί κατά 36% μεταξύ 2021 και 2031, πολύ ταχύτερα από τον μέσο όρο για όλα τα επαγγέλματα. Οι εταιρείες είναι έτοιμες να πληρώσουν αδρά για να προσλάβουν τέτοια ταλέντα: ο μέσος μισθός στις ΗΠΑ για έναν επιστήμονα δεδομένων είναι 103.500$, σε σύγκριση με 97.430 $ για τα συνολικά επαγγέλματα πληροφορικής, σύμφωνα με το Γραφείο. 
Ωστόσο, εύχρηστα λογισμικά στους οργανισμούς απλοποιούν πολύπλοκα καθήκοντα που απαιτούσαν Data Scientists, όπως τα εργαλεία τεχνητής νοημοσύνης DataRobot και AutoML, λύσεις για τη μετατροπή της ομιλίας σε κείμενο ή τον εντοπισμό αντικειμένων, οι οποίες διατίθενται δωρεάν από πρωτοπόρους ανοιχτού κώδικα, όπως το HuggingFace. Για τους περισσότερους Data Scientists, ένα σημαντικό κομμάτι της εργασίας περιλαμβάνει “scrubbing” των δεδομένων: collecting, cleaning, structuring, and processing για να αποφευχθεί η δημιουργία ελαττωματικών αλγορίθμων. Ωστόσο, τα επόμενα χρόνια, αναμένουμε ότι η προετοιμασία δεδομένων θα πραγματοποιηθεί με χρήση εργαλείων λογισμικού, όπως ο IBM InfoSphere Information Server ή καινοτόμες λύσεις από νεοεισερχόμενους, όπως η Sweephy, μια εκκίνηση καθαρισμού δεδομένων χαμηλού κώδικα. Η Gartner προβλέπει ότι το 70% των νέων εφαρμογών που αναπτύσσονται από οργανισμούς θα χρησιμοποιούν λύσεις χαμηλού ή χωρίς κώδικα έως το 2025, από λιγότερο από 25% το 2020.

Η ταχεία ανάπτυξη και προσαρμογή των παραγωγικών εργαλείων AI, όπως το ChatGPT, έχει δώσει ακόμη μεγαλύτερη ώθηση στον αυτοματισμό, με τρεις δυνάμεις να διαβρώνουν σταδιακά την ανάγκη για άτομα που έχουν δεξιότητες δημιουργικότητας, αναλυτικής σκέψης και επιχειρηματικής οξυδέρκειας: Πρώτον, η μεγάλης κλίμακας εμπορευματοποίηση υπηρεσιών δεδομένων που χρησιμοποιούνται συχνά, όπως μηχανές συστάσεων, chatbot και συστήματα αντιστοίχισης. Δεύτερον, ο τεράστιος όγκος δεδομένων, και όχι ο ίδιος ο αλγόριθμος. Η σημασία του όγκου έναντι της πολυπλοκότητας είναι ορατή σε πολλές εφαρμογές όπως TikTok, Spotify και Netflix, οι οποίες όλες αξιοποιούν απλές μηχανές συστάσεων για να δημιουργήσουν αξία για τους χρήστες. Τρίτον, πολλοί επιστήμονες δεδομένων είναι τεχνικοί ειδικοί που δεν διαθέτουν επιχειρηματικό υπόβαθρο. Αυτό μπορεί να οδηγήσει σε έλλειψη εκτίμησης των πραγματικών προβλημάτων που προορίζεται να αντιμετωπίσει το εργαλείο τους, καθώς και σε παρανόηση για το πώς θα χρησιμοποιηθεί από τους πελάτες.
Συνολικά, αυτές οι τρεις δυνάμεις οδηγούν σε έναν διαφορετικό ρόλο για τον επιστήμονα δεδομένων: από αυτόν του αστροναύτη (που χρησιμοποιεί τεχνολογία αιχμής για να βγει σε αχαρτογράφητη περιοχή) σε αυτόν ενός πρωταθλητή οδηγού αγώνων αυτοκινήτων (χρησιμοποιώντας τυποποιημένα τεχνολογίες για πλοήγηση στον πραγματικό κόσμο).
 
Ο Data Scientist 2.0: Μια αυξανόμενη ευθύνη του είναι να γεφυρώσει το χάσμα μεταξύ επιχειρήσεων και τεχνολογίας μετατρέποντας γενικές επιχειρηματικές ερωτήσεις σε σαφείς ευκαιρίες δεδομένων, καθώς και επιλέγοντας το σωστό σύνολο υπηρεσιών και εργαλείων για να αξιοποιήσουμε τις ευκαιρίες. 
Αυτό σημαίνει ότι χρειάζονται διαφορετικά σύνολα δεξιοτήτων, με μεγαλύτερη εστίαση στην προσαρμοστικότητα, τη δημιουργικότητα και την επιχειρηματική οξυδέρκεια. Οι οργανισμοί δεν χρειάζονται πλέον επιστήμονες δεδομένων με διδακτορικό στα μαθηματικά ή τη στατιστική για να λάβουν καθαρά δεδομένα και έξυπνους αλγόριθμους, τουλάχιστον όχι στον βαθμό που έκαναν κάποτε. Τρεις είναι οι συστάσεις για εταιρείες που θέλουν να αξιοποιήσουν τη δύναμη της ανάλυσης δεδομένων: 
1.       Εκπαιδεύστε τους υπαλλήλους να ενεργούν ως «μεταφραστές δεδομένων»
2.       Συνεχίστε να προσλαμβάνετε επιστήμονες δεδομένων, αλλά για συγκεκριμένες εργασίες
3.       Επενδύστε σε υποδομές ανάλυσης

Πηγή: https://www.imd.org/ibyimd/innovation/the-changing-role-of-the-data-scientist-from-astronaut-to-race-car-driver/
Photo by Chris Peeters / pexels

Βαθμολογήστε την Τάση

(Πρέπει να βαθμολογήσετε και τις δύο παραμέτρους.)

Πόσο πιθανό είναι να συμβεί;

Πόση επίδραση στην περιοχή ενδιαφέροντος έχει;

Βαθμολογία κοινού μέχρι σήμερα

Βαθμολογία τάσης με βάση το πόσο πιθανό είναι να συμβεί

Βαθμολογία τάσης με βάση την επίδρασή της