samedi 11 juillet 2009

Pourquoi AND a offert ses données à OSM ?

Attention, ce que vous allez lire pourra vous offenser. Le trait est volontairement exagéré. Ames sensibles, changez de fil ;-)

La réponse est en fait très simple : parce qu'elles ne valent plus rien !
Ou alors, parce qu'il reste peu de temps avant que leur coût tende vers zéro. Plus précisément, parce qu'il ne sera bientôt plus possible d'en tirer une quelconque rentabilité, tout en restant dans le même paradigme de distribution unidirectionnelle de la donnée fermée.

Plusieurs raisons à cela.

La première est que OSM avance très vite, et sous peu, les données libres auront atteint le même niveau de qualité et de complétude (cf l'étude de Muki Haklay qui compare la qualité des données OSM avec un dataset commercial --Meridian2--, dont l'hypothèse conclusive est sans appel, au transparent 38) ...

La deuxième est que ce jeu de données leur coûte trop cher à maintenir (et donc leur couterait beaucoup plus cher à améliorer significativement - ce qui serait souhaitable pour certaines applications), alors que la communauté OSM fait ça très bien, bénévolement, et qu'elle en tire un plaisir non dissimulé.

La dernière est probablement parce que vendre de la donnée brute "de base" ne suffira plus (ce que semble confirmer cette interview). C'est la pertinence de la donnée qui va permettre de générer du revenu: délivrée au bon moment, d'actualité, mise en contexte et commentée. On rejoint le contexte des bien connus LBS.

La conclusion est la suivante : la véritable valeur d'un jeu de données est liée au nombre d'utilisateurs qui s'en servent, et qui donc sont en mesure de le corriger et de l'améliorer (car les utilisateurs de la donnée géographique sont aussi des contributeurs, dans le paradigme émergent).

Tout ceci suppose bien évidemment que la licence sur les données soit ouverte.
Il est en effet inimaginable de maintenir les remontées de bug des utilisateurs sur le long terme autour d'un jeu de données fermé, alors qu'une offre parallèle de données géographiques de qualité monte en puissance.

Les producteurs de données commerciales tels que Navteq et TeleAtlas ont du souci à se faire. Au fur et à mesure que OSM avance, leurs jeux de données perdent de leur valeur.
Ce ne sont pas les pseudo communautés mises en place autour de systèmes tels que MapShare qui vont permettre de compenser celà. Comme expliqué plus haut, ces datasets retiennent encore pour eux leur homogénéité, ainsi que la connaissance de leurs limites.

Un business modèle alternatif ? le service.
A l'image de l'écosystème bâti autour du logiciel libre, dans lequel les projets financent les ajouts fonctionnels à des briques de base libres, il est possible d'imaginer vendre du service autour de l'enrichissement (en POI, en données pertinentes pour un champ d'activité particulier, etc, mais peut être aussi en précision ?) d'un jeu de données ouvert sur une zone donnée.

L'apparition de tout ceci n'est plus qu'une question d'années.

Attention, je n'ai pas parle pas ici des données créées et maintenues par les agences cartographiques nationales (NMA), telles que l'IGN et l'Ordnance Survey. J'examinerai ce cas dans un prochain billet.

1 commentaire:

Anonyme a dit…

Si je suis d'accord depuis longtemps sur le fond, j'ai depuis un peu nuancé mes propos.

Certes une communauté d'utilisateurs est nécessaire pour faire remonter de la donnée, la qualifier, l'améliorer, bref, la créer. Et cette communauté n'a d'existence possible que si la donnée est libre.

Vincent

Mais ce serait oublier un peu vite qu'il existe d'autres moyens de créer de la donnée. Et notamment des moyens automatisés, rendus possibles grâce à l'émergence de nouveaux capteurs : satellites, photos aériennes (voire par UAV), gps embarqués dans les voitures, dans les téléphones, vidéos géoréférencées (streetview)...

Tous ces systèmes de capteurs ont un coût, qui peut être supporté par des investissement d'entreprises privées pour produire de la donnée en masse, souvent plus vite que les communautés, qui elles ne peuvent pas forcément se permettre ces outils.

La force de Téléatlas ne sera pas la pseudo communauté mapshare, mais les remontées automatisées des GPS tomtom dans les voitures.

On sera dans un mode mixte pendant encore longtemps je pense. Une chose est sure cependant, c'est que les modèles communautaires autour des données libres font exploser les pratiques établies. Pour le meilleur.