Dédupliquer les détections automatiques, quel tag?

Hello, toujours dans la lancée de la discussion concernant les tags à utiliser, se pose la question d’indiquer que plusieurs photos affichent le même objet.

Par exemple, ce panneau “sens interdit” est détecté automatiquement sur 7 photos différentes :


Voir les photos 1 / 2 / 3 / 4 / 5 / 6 / 7

Numéro d’annotations

Il se trouve que chaque annotation dispose d’un numéro unique et pérenne (ça fait plaisir !). C’est pareil que pour les photos.

Donc la première détection, par exemple, est l’annotation 3e301b42-6028-4e17-9e7c-21ac9a518399 que vous pouvez retrouver dans la photo d37d2666-faf9-497c-a813-0195509b73b1.

L’'URL est en conséquence https://panoramax.openstreetmap.fr/?annot=3e301b42-6028-4e17-9e7c-21ac9a518399&pic=d37d2666-faf9-497c-a813-0195509b73b1

Lier des annotations

Aujourd’hui, toutes les informations de détection de ces panneaux sont dupliquées sur les 7 photos.

On voit sur cette interface (en cours de développement) que plusieurs panneaux stop s’affichent (alors qu’il n’en n’existe qu’un seul en réalité) :

Il va falloir imaginer des interfaces et aussi des algos automatisés pour dédupliquer les détections (et plus largement, toute annotation, même si elle est créée à la main).

Ça serait bien de 1. conserver tous les tags sur la détection de l’image la plus proche de la localisation de l’objet 2. créer un lien sur les autres détections (les tags seraient donc hérités implicitement de l’image la plus proche).

En attendant :

Quel tag utiliser ?

On pourrait partir sur la valeur de l’annotation source, par exemple 3e301b42-6028-4e17-9e7c-21ac9a518399 et puis trouver une clef simple.
Quelques idées :

  1. annotation
    On indiquerait donc annotation=3e301b42-6028-4e17-9e7c-21ac9a518399
  2. link
  3. inherited
  4. deduced
  5. similar
  6. represent
  7. depicts (non, je rigole, c’est un troll wikidata)

La première est la plus directe, la seconde la plus simple, la troisième la plus correcte.
Votre avis ?

Je comprends bien le besoin, mais conceptuellement c’est très bancal.

Il faudrait que l’objet détecté ait un identifiant et que chaque détection/annotation soit lié à cet identifiant.

Choisir arbitrairement une détection (comment qualifier “la première”) pour lier les autres, c’est peu recommandable dans un schéma de données.

C’est bien l’idée, oui

L’importance de choisir “la première” est pour moi minime.
Ça me semble intéressant de disposer d’une géoloc de photo par défaut la plus proche possible de l’objet.
Néanmoins, je pense que ça ne doit rester qu’une recommandation et que dans la pratique, toute annotation peut être déclarée comme étant la référence.

À noter que l’identifiant d’annotation persiste même si l’annotation est supprimée (il faudra réfléchir à la manière de conserver et modifier ses tags, mais au moins, l’identifiant est pérenne).

Si tu as une alternative à ma proposition, je suis preneur.

Je pensais aussi à quelque chose comme ça, une priorisation pour le choix de l’annotation de référence, et plus l’objet est proche plus il occupe en principe de pixels sur une même série de photos.

Par contre, si on repasse à proximité, avec un autre type de caméra, ça chamboule tout. Peut être qu’on aura des photos encore plus proches.

Bref, ça confirme que c’est bancal… mais j’ai pas mieux à proposer là dans l’immédiat !

Laissons l’intelligence collective se réveiller…

Le problème que tu essayes de résoudre n’est-il pas déjà un problème “métier” ?

D’autres utilisateurs pourraient sélectionner des photos différentes selon leur besoin (Accès Libre et l’annuaire des entreprises auront chacun une photo préférée, qui ne sera pas la même).

Tu cherches à disposer de “la meilleure photo pour la classification automatisée”. Tu peux t’inventer un tag pour ça.

favorite=classification
favorite=entrance_accessibility
favorite=building_entrance

L’objectif de disposer d’un ID unique et pérenne pour chaque objet me parait vraiment la prio. Savoir quelle photo est liée à cet ID importe peu, au final.