Εξόρυξη δεδομένων και γνώσης με τη χρήση τεχνολογιών μηχανικής μάθησης

Η ιστορία της DataScouting ξεκινά το 2012 στη Θεσσαλονίκη, όταν ο Αναστάσιος Αβράμης, έμπειρος προγραμματιστής, αποφασίζει μαζί με τους συνεταίρους του να ιδρύσει την DataScouting, η οποία σχεδιάζει εφαρμογές για την ανάλυση πολυμέσων.

Οκτώ χρόνια μετά, η DataScouting έχει καταφέρει να εδραιώσει τη θέση της στην παγκόσμια αγορά λογισμικού ανάλυσης πληροφοριών για τα μέσα ενημέρωσης (Media Intelligence), ενώ στην εγχώρια αγορά σημαντική είναι η παρουσία της στον κλάδο διαχείρισης της πολιτισμικής κληρονομιάς.

Media Intelligence

Η εξόρυξη δεδομένων μέσω τεχνητής νοημοσύνης και η ανακάλυψη και η αξιοποίηση γνώσης (knowledge mining) από μεγάλα σύνολα δεδομένων που παράγονται σε κοινωνικά δίκτυα, ραδιόφωνο, τηλεόραση και έντυπο Τύπο είναι το αντικείμενο στο οποίο η DataScouting εξειδικεύεται έχοντας αναπτύξει δικά της λογισμικά. Με τη χρήση τεχνολογιών υπολογιστικής μάθησης (machine learning), όπως η οπτική αναγνώριση χαρακτήρων (OCR), η αυτόματη αναγνώριση λόγου (ASR), η αναγνώριση λογοτύπων (logo detection) και προσώπων (face recognition) και η ηχητική αποτύπωση (audio fingerprinting), η DataScouting παρέχει ολοκληρωμένες λύσεις λογισμικού για την εξόρυξη πληροφορίας και εισαγωγής από ψηφιοποιημένο οπτικοακουστικό, έντυπο υλικό, καθώς και από διαδικτυακές πηγές.

Η DataScouting με το MediaScouting Suite δίνει σε εταιρείες και οργανισμούς τη δυνατότητα να μετατρέψουν τις ροές δεδομένων σε αξιοποιήσιμη πληροφορία. Το MediaScouting Suite διαθέτει μια ολοκληρωμένη λύση για την:

  • Εξαγωγή πληροφορίας σε πραγματικό χρόνο από ζωντανές ροές τηλεόρασης, ραδιοφώνου ή IP streams με την καταγραφή, την επεξεργασία, την ανάλυση και την ανάκτηση της εμπλουτισμένης πληροφορίας.
  • Παρακολούθηση έντυπου Τύπου και διαδικτύου, που ξεκινά από την ψηφιοποίηση ή την εισαγωγή εφημερίδων και διαδικτυακών ιστότοπων σε ψηφιακή μορφή, την εξαγωγή άρθρων, την αυτόματη εισαγωγή μεταδεδομένων, την αντιστοίχισή τους σε θεματικές ενότητες.

DataScouting_Media Monitoring Software_MediaScouting

Διαχείριση πολιτισμικής κληρονομιάς

Τα τελευταία χρόνια, η DataScouting έχει επενδύσει στη δημιουργία αρχειονομικού και βιβλιοθηκονομικού τμήματος και συνεργάζεται με κάποιες από τις μεγαλύτερες ακαδημαϊκές και δημόσιες βιβλιοθήκες στην Ελλάδα για την ψηφιοποίηση, την καταλογογράφηση και την προβολή έντυπου, φωτογραφικού, εικαστικού και οπτικοακουστικού υλικού. Η διάχυση του υλικού και η διαλειτουργικότητα των ιστοτόπων με άλλους φορείς πολιτιστικού περιεχομένου γίνεται με λογισμικό ανοιχτού κώδικα, όπως επιβάλλεται σε μία εποχή ελεύθερης πρόσβασης στον πολιτισμό.

Παράλληλα, η επιστημονική ομάδα της DataScouting συνεισφέρει στη βιβλιοθηκονομική κοινότητα με νέες τεχνολογίες για τη λειτουργία των οργανισμών, όπως η διασύνδεση RFID με Συστήματα Αυτοματισμού Βιβλιοθηκών (ILS) για δανεισμό χωρίς επαφή και πρόσβαση στον κατάλογο των βιβλιοθηκών από το σπίτι για αναζήτηση και κράτηση βιβλίων χωρίς φυσική παρουσία στη βιβλιοθήκη.

Επενδύοντας δυναμικά στην έρευνα και την καινοτομία 

H έρευνα αποτελεί σημαντικό παράγοντα για την DataScouting και εδώ και αρκετά χρόνια έχει δημιουργήσει ερευνητικό τμήμα στα πεδία της μηχανικής μάθησης προχωρώντας την τεχνολογική στάθμιση και δίνοντας έμφαση σε ανάλυση κειμενικών και οπτικοακουστικών μέσων με τεχνικές deep και active learning.

«Στόχος μας είναι το ευφάνταστο πάντρεμα της ερευνητικής παραγωγής, τόσο της δικής μας όσο και της κοινότητας, με τη δημιουργία εμπορικών εφαρμογών με υψηλές απαιτήσεις ακρίβειας. Έχουμε τη χαρά να παίζουμε με ήχο, εικόνα και κείμενο χρησιμοποιώντας state of the art τεχνολογίες και εφαρμόζοντάς τες σε τεράστιο όγκο δεδομένων», μας ανέφερε ο Σταύρος Δωρόπουλος, CIO και Senior Researcher.

Ταυτόχρονα, η DataScouting συμμετέχει σε ευρωπαϊκά ερευνητικά προγράμματα για να ενισχύσει την τεχνογνωσία της αλλά και την εξωστρέφεια που έχει ως εταιρεία. Πολύ ενδιαφέρον παράδειγμα είναι το DACHS (A data-driven approach to countering hate speech), με σκοπό την καταπολέμηση της ρητορικής μίσους στα social media κατά των δημοσιογράφων, και τα μοντέλα βαθιάς μάθησης για την ανίχνευση ρητορικής μίσους και μισαλλόδοξης ομιλίας σε πέντε γλώσσες (αγγλικά, ελληνικά, ισπανικά, γαλλικά και γερμανικά).

Ο Αναστάσιος Αβράμης, Managing Partner της DataScouting στη διεθνή έκθεση IBC Show στο Άμστερνταμ, Σεπτέμβριος 2019

Ο Αναστάσιος Αβράμης, Managing Partner της DataScouting στη διεθνή έκθεση IBC Show στο Άμστερνταμ, Σεπτέμβριος 2019

Ο ανθρώπινος παράγοντας

Η DataScouting επενδύει διαρκώς σε προσωπικό, υποδομές και τεχνογνωσία. Αυτό που ενώνει τους ανθρώπους της είναι το πάθος για καινοτομία, η διαρκής εξέλιξη δεξιοτήτων και το υψηλό επίπεδο συνεργατικότητας. Παράλληλα εκπαιδεύει νέους επιστήμονες με υψηλού επιπέδου mentoring μέσα στην εταιρεία. Όσο για τις νέες συνθήκες εργασίας λόγω της πανδημίας COVID-19, η DataScouting είχε ήδη εφαρμόσει την τηλεργασία και είχε την υποδομή και τις διαδικασίες για το συντονισμό όλων των ομάδων και την ομαλή εκτέλεση όλων των έργων από απόσταση.

«Πέρα από τις επιτυχίες, το μεγαλύτερο επίτευγμα της DataScouting είναι η δημιουργία κορυφαίας εταιρικής κουλτούρας και συναδελφικότητας», υπογράμμισε ο Αναστάσιος Αβράμης, Managing Partner της DataScouting.

Διεθνή παρουσία

Η DataScouting «εξάγει» ελληνική τεχνογνωσία έχοντας αναπτύξει ένα παγκόσμιο δίκτυο πωλήσεων, χτίζοντας συνεργασίες με πολυεθνικές εταιρείες, με εγκαταστάσεις σε Αμερική, Ασία, Αφρική και Αυστραλία, έχει πολυετή συμμετοχή σε διεθνείς εκθέσεις ως χορηγός και εκθέτης και είναι μέλος διεθνών οργανώσεων (FIBEP, AMEC).

 

Το πρωτότυπο άρθρο δημοσιεύτηκε στο περιοδικό Startupper, τεύχος Νοέμβριος 2020, σελίδες 50-51

Εξόρυξη δεδομένων και γνώσης με χρήση τεχνολογιών μηχανικής μάθησης_DataScouting_Startupper, NOV 2020

Pin It

Comments are closed.