Le floutage est un élément essentiel car indispensable du projet Panoramax.
Geovisio utilise des briques existantes, des modèles déjà entraînés, mais les résultats sont soit longs en calcul, soit en dessous du niveau espéré.
Une des causes vient des modèles qui sont soit trop généralistes, soit entraînés sur des images assez différentes provenant par exemple de prises de vues faites un peu loin de chez nous. Je pense en particulier au jeu d’entraînement “cityscape” qui est basé sur des prises de vues plutôt urbaines et toutes en Allemagne à ce que j’ai compris.
Dans l’idéal il nous faut un jeu modèle entraîné sur des images qui correspondent plus à celles que nous allons collecté, des vues urbaines de villes françaises et des vues plus rurales.
J’ai commencé à explorer quelques outils permettant d’annoter des images soit localement, soit en ligne et de façon collaborative.
Pour l’instant Label Studio semble un bon compromis car il permet de partager la tâche d’annotation, il est opensource et déployable “on premise” (important pour ne pas transmettre à des tiers des images non floutées contenant donc visages et plaques d’immatriculation).
Voici une vue de l’interface d’annotation accessible avec un navigateur web :
Pour chaque image, il suffit de choisir la classe de l’objet qu’on va annoter (dans notre cas “face” ou"plate"), puis de tracer un rectangle autour, et ainsi de suite. Ctrl-ENTER pour enregistrer et passer à l’image suivante.
Cela va relativement vite, j’en ai fait 200 lors de mon test en un peu plus d’une heure et en découvrant l’outil et ses raccourcis.
Pour avoir une grande quantité d’images annotées, qui serait partant pour participer à une annotation collaborative pour se répartir cette tâche un peu ingrate mais des plus utile ?
Je peux déployer Label Studio chez moi et n’autoriser que l’ouverture de compte sur invitation pour que les images ne soient pas publiques.
Avec mes premières annotations, je vais maintenant tester un premier apprentissage en me basant sur YOLOv8 qui peut servir de modèle pré-entraîné car dès qu’un modèle même imparfait est entraîné, il peut ensuite être utilisé par Label Studio pour proposer des annotations et donc être encore plus efficace.
YOLO peut aussi être utilisé pour sélectionner des images où figurent des personnes ou des véhicules, car la sélection des images prend elle aussi du temps.
PS: YOLO pour You Only Look Once