Description sémantique des photos

Suite au temps d’échange d’avril, j’ouvre ce fil de discussion pour réfléchir à la description sémantique des photos.

Lors du temps d’échange on a parlé de deux choses: des hashtags (ou tags clé/valeur) et le standard IPTC.

Les hashtags peuvent être mis à minima dans le nom de séquences, qui n’ont pour l’instant quasiment aucun usage et sont très artificiels (noms de dossiers, date/heure d’envoi).

On peut désormais modifier le nom des séquences, donc ajouter facilement ces tags dès maintenant par ce moyen. Il ne manque qu’un moyen de faire des recherches dessus.

Si des données IPCT figurent dans les images versées, il me semble qu’on n’y touche pas, elles sont donc conservées dans les fichiers image et exploitables à l’avenir si l’on veut par l’API qui les expose en théorie déjà (je n’ai pas vérifié), mais ne permet pas de chercher dessus actuellement.

Il me semble qu’on a donc moyen dès maintenant de décrire sémantiquement les photos, mais pas encore moyen de faire des recherches pour les retrouver… ce qui ne sera pas si complexe ni long à développer.

Bonjour Christian,

Les deux approches vont s’avérer utiles :

  • les mots clés associés aux photos pour pousser un système sémantique riche sous-jacent à un simple classement thématique
  • l’approche de type IPTC qui est riche avec quelques cadres en terme de méthodes et niveau qualitatif attendu, un formulaire minimaliste sera bienvenu avec automatisation si possible

Il semble que certains outils font déjà de la détection par géométries d’éléments évidents : bâtiment, paysage, église, animal…

De même à partir des métadonnées déduire des éléments comme les saisons, les noms des lieux.

Là où ce serait plus complexe c’est le mode de collecte : piéton, vélo, voiture, bateau…

Oui, c’est complémentaire ne vise pas les mêmes objectifs.

Je voulais juste déjà signaler que l’on peut déjà accoler expérimentalement ces infos aux photos (via IPTC) ou aux séquences via leur nom.

Pour les tags, il faudrait quand même prévoir une nomenclature commune, comme pour OSM, afin que cela puisse être réutilisé car homogène.

Une piste se trouve ici Media Topics - IPTC
image

Et une étude très intéressante ici : https://www.researchgate.net/publication/220232905_PhotoMap_From_Location_and_Time_to_Context-Aware_Photo_Annotations#pf9