2022: Μια μεγάλη επανάσταση στη ρομποτική

Γιατί όλα πρόκειται να αλλάξουν.

πρότυπο από τον Greg Nichols

Eδώ και λίγο καιρό, όσοι παρακολουθούν την ανάπτυξη της ρομποτικής έχουν σημειώσει μια ήσυχη επανάσταση στον τομέα. Ενώ τα αυτόνομα αυτοκίνητα έχουν κατακτήσει όλα τα πρωτοσέλιδα, το έργο που συμβαίνει στη διασταύρωση της τεχνητής νοημοσύνης , της μηχανικής όρασης και της μηχανικής μάθησης γίνεται γρήγορα το θεμέλιο για την επόμενη φάση της ρομποτικής.

Συνδυάζοντας τη μηχανική όραση με τις δυνατότητες εκμάθησης, οι μηχανικοί ανοίγουν ένα ευρύ φάσμα νέων δυνατοτήτων όπως drones που βασίζονται στην όραση, ρομποτική συγκομιδή, ρομποτική ταξινόμηση στην ανακύκλωση και επιλογή αποθήκης. Βρισκόμαστε επιτέλους στο σημείο καμπής: Η στιγμή που αυτές οι εφαρμογές γίνονται αρκετά καλές ώστε να παρέχουν πραγματική αξία σε ημι-δομημένα περιβάλλοντα όπου τα παραδοσιακά ρομπότ δεν θα μπορούσαν ποτέ να πετύχουν.

Για να συζητήσω αυτή τη συναρπαστική στιγμή και πώς πρόκειται να αλλάξει ριζικά τον κόσμο στον οποίο ζούμε, συνδέθηκα με τον Pieter Abbeel, καθηγητή Ηλεκτρολόγων Μηχανικών και Επιστήμης Υπολογιστών στο Πανεπιστήμιο της Καλιφόρνια στο Μπέρκλεϋ, όπου είναι επίσης διευθυντής του ρομπότ Berkeley. Learning Lab και συνδιευθυντής του Berkeley AI Research lab. Είναι συνιδρυτής και επικεφαλής επιστήμονας του Covariant και οικοδεσπότης του εξαιρετικού podcast The Robot Brains .

Με άλλα λόγια, έχει καλή πίστη στη ρομποτική και αυτό που λέει για το εγγύς μέλλον του αυτοματισμού δεν είναι τίποτα λιγότερο από εκπληκτικό.

GN: Αποκαλείτε την AI Robotics μια ήσυχη επανάσταση. Γιατί είναι επαναστατικό, και γιατί πιστεύετε ότι οι πρόσφατες εξελίξεις βρίσκονται ακόμη στο ραντάρ, τουλάχιστον στη λαϊκή κάλυψη;

Τα τελευταία εξήντα χρόνια, είχαμε ρομπότ υψηλής φυσικής ικανότητας. Ωστόσο, δεν ήταν τόσο έξυπνα. Έτσι, αυτά τα σωματικά εξαιρετικά ικανά ρομπότ κατέληξαν περιορισμένα σε εργοστάσια — κυρίως εργοστάσια αυτοκινήτων και ηλεκτρονικών — όπου τους εμπιστεύονταν να εκτελούν προσεκτικά προγραμματισμένες κινήσεις. Αυτά τα ρομπότ είναι πολύ αξιόπιστα στο να κάνουν το ίδιο πράγμα ξανά και ξανά. Δημιουργούν αξία, αλλά μόλις και μετά βίας χαράζουν την επιφάνεια του τι θα μπορούσαν να κάνουν τα ρομπότ με καλύτερη νοημοσύνη.

Η αθόρυβη επανάσταση συμβαίνει στον τομέα της ρομποτικής τεχνητής νοημοσύνης (AI). Τα ρομπότ τεχνητής νοημοσύνης διαθέτουν εξελιγμένα μοντέλα τεχνητής νοημοσύνης και όραμα. Μπορούν να δουν, να μάθουν και να αντιδράσουν για να πάρουν τη σωστή απόφαση με βάση την τρέχουσα κατάσταση.

Δημοφιλής κάλυψη των τάσεων της ρομποτικής προς τα ρομπότ και τα αυτόνομα αυτοκίνητα σε στυλ οικιακού μπάτλερ, επειδή σχετίζονται πολύ με την καθημερινή μας ζωή. Εν τω μεταξύ, η AI Robotics απογειώνεται σε περιοχές του κόσμου μας που είναι λιγότερο ορατές αλλά κρίσιμες για τα μέσα διαβίωσής μας — σκεφτείτε κέντρα και αποθήκες εκπλήρωσης του ηλεκτρονικού εμπορίου, αγροκτήματα, νοσοκομεία, κέντρα ανακύκλωσης. Όλοι οι τομείς με μεγάλο αντίκτυπο στη ζωή μας, αλλά όχι δραστηριότητες που ο μέσος άνθρωπος βλέπει ή αλληλεπιδρά άμεσα με αυτές καθημερινά.

GN: Τα ημι-δομημένα περιβάλλοντα αποτελούν το επόμενο σύνορο για τα ρομπότ, τα οποία παραδοσιακά περιορίζονται σε δομημένες ρυθμίσεις όπως τα εργοστάσια. Πού θα δούμε νέες και πολύτιμες αναπτύξεις ρομποτικής τον επόμενο χρόνο περίπου;

Τα τρία μεγάλα που αναμένω είναι οι εργασίες συλλογής και συσκευασίας στην αποθήκη , η διαλογή ανακύκλωσης και η συγκομιδή/περιποίηση των καλλιεργειών . Από τεχνολογική άποψη, αυτά είναι φυσικά στο εντυπωσιακό φάσμα των πρόσφατων εξελίξεων της τεχνητής νοημοσύνης. Και επίσης, γνωρίζω ανθρώπους που εργάζονται σε AI Robotics σε καθεμία από αυτές τις βιομηχανίες και κάνουν μεγάλα βήματα προόδου.

GN: Γιατί η μηχανική όραση είναι ένας από τους πιο συναρπαστικούς τομείς ανάπτυξης στη ρομποτική; Τι μπορούν να κάνουν τώρα τα ρομπότ που δεν μπορούσαν να κάνουν, ας πούμε, πριν από πέντε χρόνια;

Ο παραδοσιακός ρομποτικός αυτοματισμός βασίστηκε σε πολύ έξυπνη μηχανική για να επιτρέψει στα ρομπότ προ-προγραμματισμένης κίνησης να είναι χρήσιμα. Σίγουρα, αυτό λειτούργησε σε εργοστάσια αυτοκινήτων και ηλεκτρονικών ειδών, αλλά τελικά είναι πολύ περιοριστικό.

Δίνοντας στα ρομπότ το δώρο της όρασης αλλάζει εντελώς αυτό που είναι δυνατό. Το Computer Vision, ο τομέας της τεχνητής νοημοσύνης που ασχολείται με το να βλέπουν οι υπολογιστές και τα ρομπότ, έχει υποστεί μια μεταμόρφωση νύχτα-μέρα τα τελευταία 5-10 χρόνια — χάρη στο Deep Learning. Η Deep Learning εκπαιδεύει μεγάλα νευρωνικά δίκτυα (βάση παραδεισμάτων) για την αναγνώριση προτύπων. Σε αυτήν την περίπτωση, η αναγνώριση μοτίβων επιτρέπει την κατανόηση του πού βρίσκεται στις εικόνες. Και τότε το Deep Learning, φυσικά, παρέχει δυνατότητες πέρα ​​από την όραση. Επιτρέπει στα ρομπότ να μάθουν επίσης ποιες ενέργειες πρέπει να κάνουν για να ολοκληρώσουν μια εργασία, για παράδειγμα, να διαλέξουν και να συσκευάσουν ένα αντικείμενο για να εκπληρώσουν μια ηλεκτρονική παραγγελία.

GN: Πολλή κάλυψη την τελευταία δεκαετία έχει επικεντρωθεί στην επίδραση των αισθητήρων σε αυτόνομα συστήματα (lidar, κ.λπ.). Πώς η τεχνητή νοημοσύνη επαναπλαισιώνει τη συζήτηση στην ανάπτυξη της ρομποτικής;

Πριν το Deep Learning εμφανιστεί στη σκηνή, ήταν αδύνατο να κάνει ένα ρομπότ να «δει» (δηλαδή να καταλάβει τι υπάρχει σε μια εικόνα). Κατά συνέπεια, στις μέρες πριν από τη Βαθιά Μάθηση, πολλή ενέργεια και εξυπνάδα δαπανήθηκε για την έρευνα εναλλακτικών μηχανισμών αισθητήρων. Το Lidar είναι πράγματι ένα από τα δημοφιλή (πώς λειτουργεί είναι ότι στέλνετε μια ακτίνα λέιζερ, μετράτε πόσο χρόνο χρειάζεται για να ανακλαστεί και στη συνέχεια πολλαπλασιάζετε με την ταχύτητα του φωτός για να προσδιορίσετε την απόσταση από το πλησιέστερο εμπόδιο προς αυτή την κατεύθυνση) . Το Lidar είναι υπέροχο όταν λειτουργεί, αλλά οι τρόποι αστοχίας δεν μπορούν να μειωθούν (π.χ., η δέσμη σας επιστρέφει πάντα; Απορροφάται από μια μαύρη επιφάνεια; Διέρχεται ακριβώς από μια διαφανή επιφάνεια; κ.λπ.. ).

Αλλά σε μια εικόνα κάμερας, εμείς οι άνθρωποι μπορούμε να δούμε τι υπάρχει εκεί, οπότε γνωρίζουμε ότι οι πληροφορίες έχουν καταγραφεί από την κάμερα. Χρειαζόμαστε απλώς έναν τρόπο ώστε ο υπολογιστής ή το ρομπότ να μπορεί να εξάγει τις ίδιες πληροφορίες από την εικόνα. Οι πρόοδοι της τεχνητής νοημοσύνης, ειδικά το Deep Learning, έχουν αλλάξει εντελώς ό,τι είναι δυνατό από αυτή την άποψη. Βρισκόμαστε σε έναν δρόμο για την κατασκευή τεχνητής νοημοσύνης που μπορεί να ερμηνεύσει τις εικόνες όσο αξιόπιστα μπορούν οι άνθρωποι, εφόσον τα νευρωνικά δίκτυα έχουν δείξει αρκετά παραδείγματα. Υπάρχει λοιπόν μια μεγάλη αλλαγή στη ρομποτική από την εστίαση στην εφεύρεση ειδικών αισθητηριακών συσκευών στην εστίαση στην κατασκευή της τεχνητής νοημοσύνης που μπορεί να μάθει και να ενδυναμώσει τα ρομπότ μας χρησιμοποιώντας τις φυσικές αισθητηριακές εισροές που έχουμε ήδη στη διάθεσή μας, ειδικά τις κάμερες.

G.N.: Η ρομποτική ήταν πάντα μια τεχνολογία συρροών. Εκτός από την τεχνητή νοημοσύνη και την όραση μηχανών, ποιες τεχνολογίες έχουν συγκλίνει για να καταστήσουν δυνατές αυτές τις αναπτύξεις;

Πράγματι, κάθε ρομποτική ανάπτυξη απαιτεί μια συρροή πολλών σπουδαίων στοιχείων και μια ομάδα που ξέρει πώς να τα κάνει όλα να λειτουργήσουν μαζί. Εκτός από την τεχνητή νοημοσύνη, υπάρχει, φυσικά, η μακροχρόνια τεχνολογία αξιόπιστων ρομπότ χειριστή βιομηχανικής ποιότητας. Και, το πιο σημαντικό, υπάρχουν κάμερες και υπολογιστές, που γίνονται όλο και καλύτεροι και φθηνότεροι.

GN: Τι θα εκπλήξει τους ανθρώπους σχετικά με τα ρομπότ τα επόμενα πέντε χρόνια;

Το μέγεθος με το οποίο τα ρομπότ συμβάλλουν στην καθημερινότητά μας, τις περισσότερες φορές χωρίς να βλέπουμε κανένα από αυτά τα ρομπότ. Πράγματι, πιθανότατα δεν θα δούμε προσωπικά τα ρομπότ να αλληλεπιδρούν σωματικά με τα πράγματα που χρησιμοποιούμε καθημερινά, αλλά σύντομα θα υπάρξει μια μέρα κατά την οποία τα περισσότερα από τα αντικείμενα του νοικοκυριού μας άγγιξαν ένα ρομπότ τουλάχιστον μία φορά πριν φτάσουν σε εμάς.