Depuis le temps que je me préoccupe de sémantique associée à la vidéo, j’ai pu me rendre compte que les approches des experts en ce domaine, ceux notamment qui ont conçus la norme MPEG7, sont, non pas erronées, mais inopérantes en terme de répercussions sur les utilisateurs finaux, ceux qui vont consommer les médias décris et les décrire en retour. Pour avoir expérimenté des outils d’indexation vidéo puissants, et en avoir moi-même conçus, il m’apparait que ce qui pêche est la pensée initiale sur une certaine perfection de cette indexation : L’outil repose sur la structure finale de l’indexation a produire, l’utilisateur doit donc s’approprier l’outil, donc s’approprier la structuration du média que propose l’outil… et tout cela est bien compliqué, quand bien même des tonnes de travaux de recherche ont été effectués pour en arriver à ce résultat.
Il ne faut tout d’abord :
1) ne jamais oublier que l’indexation est quelque chose de purement subjectif, et qu’un même média aura autant de descriptions différentes que d’indexeurs différents.
2) que le coùt humain d’indexation des médias est quelque chose d’incommensurable et d’inenvisageable.
Bien entendu, il y a déjà des travaux qui sont engagés dans la direction des ontologies pour permettre de s’assurer que ce que l’on nomme un chat est bien un chat, mais une fois encore, ces outils d’ontologie restent utilisables par un nombre restreints d’utilisateurs avertis. Je pense au logiciel protégé.
Finalement, c’est à mon sens bien du côté des « social networks » et des « social software » qu’il faut se tourner. Car il est bien clair qu’une indexation ne prend son sens que lorsqu’il y a convergence. Les choses, le sens, apparaissent par pondération.
Tout cela me fait bien toujours penser à Wittgenstein, qui après un retentissant tractacus est revenu sur ses pas, ou plutôt, est allé plus loin en posant la question de la convergence du sens, de la notion de règle. Pourquoi, malgré la présence d’une partition musicale clairement « normalisée », une convergence va avoir lieu sur la « façon » de jouer un morceau de musique.
On peut je pense appliquer les mêmes réflexions à l’indexation des médias, et cela revient à dire que l’indexation va naitre des « communautés de sens ». Ce sont ces sus-nommés « social software » qui permettent de créer ces communautés de sens.
Un dernier élément fondamental est nécessaire pour que se répande massivement une approche sémantique, c’est la simplicité des outils et plus encore, leur intégration dans des processus courants d’usage. Les tags sont une première approche mais restent primaires. Par contre, si l’on parvient à faire se fusionner consommation et action productive, vers ce que l’on appelerait une consommaction (le terme prosuming?) alors on parviendra à rendre nécessaire et incontournable une action d’indexation systématique des médias. Comme pour les réseaux de neurones, tout n’est affaire que de PONDERATION.