Présentation de Wake Vision : un ensemble de données de grande qualité pour les applications de vision par ordinateur en TinyML

05 décembre 2024

Wake Vision est un nouvel ensemble de données conçu pour répondre aux besoins spécifiques du TinyML, un domaine de l'apprentissage automatique qui vise à faire fonctionner des modèles sur des appareils à très faible consommation d'énergie. Avec environ 6 millions d'images, Wake Vision est près de 100 fois plus grand que l'ensemble de données précédent, Visual Wake Words (VWW), et offre deux versions distinctes : une version « Large » qui privilégie la taille de l'ensemble de données et une version « Quality » qui met l'accent sur la qualité des étiquettes. Cela permet aux chercheurs d'explorer efficacement l'équilibre entre la taille et la qualité des ensembles de données pour les modèles TinyML, qui sont souvent limités à quelques centaines de kilo-octets. L'ensemble de données Wake Vision se distingue par son processus de filtrage et d'étiquetage complet, ce qui améliore considérablement la qualité des données. Contrairement aux ensembles de données traditionnels, où la quantité de données est souvent considérée comme plus importante que la qualité, Wake Vision montre que pour les modèles sous-paramétrés, la qualité des étiquettes est plus bénéfique. Cela est particulièrement important pour les applications de détection de personnes, qui sont au cœur des tâches de vision par ordinateur en TinyML. Wake Vision offre également des benchmarks détaillés pour évaluer les performances des modèles dans des scénarios réels, tels que la détection de personnes à différentes distances, dans diverses conditions d'éclairage et pour différentes représentations de personnes. Ces benchmarks aident les chercheurs à identifier les biais potentiels et les limitations des modèles dès la phase de conception. Les gains de performance obtenus avec Wake Vision sont impressionnants, avec une augmentation de la précision allant jusqu'à 6,6 % par rapport à l'ensemble de données VWW établi, et une réduction du taux d'erreur de 7,8 % à 2,2 % avec une validation manuelle des étiquettes sur les ensembles d'évaluation.

Points clés

Wake Vision est un ensemble de données de grande qualité pour le TinyML.
Il contient environ 6 millions d'images, soit 100 fois plus que l'ensemble de données précédent.
Il offre deux versions distinctes pour équilibrer taille et qualité des données.
Wake Vision améliore la précision des modèles TinyML jusqu'à 6,6 %.
Il permet d'évaluer les performances des modèles dans des scénarios réels.

Pourquoi c'est important

Wake Vision est crucial pour le développement du TinyML car il offre un ensemble de données de haute qualité et de grande taille, essentiel pour entraîner des modèles efficaces sur des appareils à faible consommation d'énergie. Cela permet d'améliorer la précision et la robustesse des applications de vision par ordinateur dans des conditions réelles.

Article original : https://blog.tensorflow.org/2024/12/introducing-wake-vision-new-dataset-for-person-detection-in-tinyml.html

Synthèse éditoriale issue d’une veille et d’outils d’IA. Des erreurs ou approximations peuvent subsister. Référez‑vous à la source originale et à notre disclaimer.