Version à l'échelle et nuTonomy nuScenes, un ensemble de données autonome avec plus de 1,4 million d'images

Les ensembles de données sont la pierre angulaire des algorithmes d'apprentissage automatique: ils «enseignent» à l'intelligence artificielle (IA) des faits sur le monde, en quelque sorte. Et dans des domaines tels que la conduite autonome, il est essentiel qu’ils soient de la plus haute qualité.

C'est pourquoi Scale, une entreprise d’étiquetage de données basée à San Francisco, a annoncé aujourd’hui la publication d’un ensemble de données autonome appelé nuScenes qui surpasse la taille et la précision des jeux de données publics tels que KITTI, ApolloScape de Baidu et Udacity Self-Driving. Bibliothèque de voiture.

«Nous sommes fiers de fournir les annotations… comme l'ensemble de données d'auto-conduite multi-capteurs open source le plus robuste jamais publié», a déclaré le PDG de Scale, Alexandr Wang. «Nous pensons que cela constituera une ressource inestimable pour les chercheurs qui développent des systèmes de véhicules autonomes, et qui contribuera à façonner et à accélérer leur production dans les années à venir.»

Scale s'est associé à nuTonomy, une start-up de voitures autonomes, pour compiler plus de 1 000 scènes contenant 1,4 million d'images, 400 000 balayages de lidars (systèmes laser évaluant la distance entre les objets) et 1,1 million de boîtes détecté avec une combinaison de caméras RVB, radar et lidar). Ils ont été méticuleusement étiquetés à l’aide de l’API Sensor Fusion Annotation de Scale, qui utilise l’IA et les équipes d’hommes pour l’annotation des données, et ils sont ouverts en open source à partir de cette semaine.

Les jeux de données sur les voitures autonomes ne sont pas une denrée rare – cet été, Flir Systems, basé en Oregon, a publié 10 000 photos étiquetées capturées par son système de caméras thermiques, Mapillary a publié 25 000 images téléchargé 100 000 séquences vidéo capturées par des caméras RVB. Mais Scale et nuTonomy affirment que nuScenes est plus complet que tout jeu de données similaire qui lui est présenté auparavant.

LIS  Le Galaxy Note 9 de Samsung est le plus puissant des téléphones Gear VR-prêts

Comme l'explique Scale sur son site Web, il a utilisé une combinaison de six caméras, d'un lidar, de cinq radars, d'un GPS et d'un capteur de mesure inertielle pour capturer les données nuScenes. Et les routes de conduite à Singapour et à Boston ont été spécifiquement choisies pour présenter des lieux, des horaires et des conditions météorologiques difficiles.

«Scale a été le partenaire idéal pour la production des annotations des ensembles de données image, caméra et lidar open source nuScenes», a déclaré Oscar Beijbom, responsable de l'apprentissage machine chez NuTonomy. «L’agilité, l’outillage, l’évolutivité et la qualité exceptionnels de Scale en ont fait notre partenaire privilégié et le choix naturel pour les partenaires d’annotation.»

Scale, qui rivalise avec Mighty AI, Appen, Cloud Factory, Samasource et Mechanical Turk d'Amazon, a décerné plus de 200 millions de miles à ses clients, dont Lyft, Voyage, General Motors, Zoox et Embark. Fondée en 2016, elle a récemment étendu ses activités à la robotique, aux drones, aux assistants virtuels et aux «autres solutions» qui dépendent fortement d'AI. En août, Scale a annoncé un financement de 18 millions de dollars mené par Index Ventures avec la participation d'Accel et de Y Combinator. .

À ce jour, la start-up a collecté 22,7 millions de dollars et rapporte que ses revenus ont augmenté 15 fois au cours de l'année écoulée.


Lien source

Comments

comments

Laisser un commentaire