Vai al contenuto

Computer vision: la tecnologia che permetterà l’autonomia delle macchine

Come si fa ad insegnare alle macchine a riconoscere ciò che vedono? Ci pensa la computer vision, la nuova scienza applicabile ad ogni tecnologia, che secondo alcune stime vale circa 6,6 miliardi di dollari e che arriverà a triplicare la cifra nei prossimi anni.

La computer vision spazia senza problemi in ogni ramo della robotica e può essere applicata dallo smartphone all’automobile.

É senz’altro quest’ultima che gode della curiosità dei più: la computer vision darà infatti la possibilità di guida autonoma, senza pedali e senza volante, ai veicoli che sceglieranno di usufruire del soprannominato livello 5.

Leggi anche: Cinema e tv: la visione 3D finalmente senza occhiali

computer-vision

Cosa vuol dire? Che un veicolo sarà in grado di guidare in tutto e per tutto autonomamente, grazie ad una tecnologia talmente avanzata da permettere di “vedere” ciò che c’è intorno, ed essere in grado di guidare in tutta sicurezza.

L’ultimo modello che predispone una simile tecnologia è Drive PX Pegsus di Nvidia. É stato presentato pochi giorni fa e si tratta di una specie di supercomputer dalla potenza di calcolo capace di fornire il supporto per una guida autonoma.

La grande novità è che il nuovo supercomputer non occupa tutto il bagagliaio. Applicato ad un auto vettura, è un grande risultato. Se si considerano poi altri strumenti tecnologici come gli smartphone, la computer vision è in grado di avvicinarli alla qualità delle reflex.

Infatti Google ha usato la computer vision per i modelli Pixel 2, che permette di utilizzare la fotocamera di un telefonino come avesse il diaframma di una macchina fotografica.

Leggi anche: Bill Gates risponde sul Ctrl+Alt+Canc, la storica combinazione per riavviare il computer

Finora si era utilizzata una seconda fotocamera per metter a fuoco, oppure il machin learning, usato da Big G, facendo automaticamente focalizzare i pixel relativi ai volti umani.

Eppure il machine learning serve moltissimo alla computer vision: Ava ( atomic visual actions ) è il nuovo strumento di Mountain View, dotato di 210mila frame di pellicole che servono proprio per insegnare ed imparare a riconoscere quali sono le azioni umane nei film e, conseguentemente, anche nel mondo reale. Quindi l’intento è quello di fare mettere a fuoco più persone per azioni diverse, è questa la sfida per ogni riconoscimento reale. Ava è un immenso contenitore di azioni umane registrate, in quanto possiede all’interno del suo dataset circa 57mila spezzoni differenti di film, proprio per rappresentare il maggior numero di azioni umane. Ava costituisce dunque una miniera d’oro per la definizione e l’impiego di ogni tecnologia che si avvale della computer vision.