Les données touristiques à l’ère de l’IA – un facteur décisif AI & Data quality

22.06.2026Digital


Interview avec Sandy Rischette, Head of Digital & Data Management
 

1. Qu'entend-on concrètement par « qualité des données » dans le contexte LFT, et pourquoi est-ce devenu un sujet stratégique aujourd'hui ?

Sandy Rischette : La qualité des données se définit selon quatre dimensions dans notre base de données touristique nationale.

La complétude : toutes les informations essentielles sont-elles renseignées : horaires, tarifs, descriptions, contacts, photos ? Et disponibles dans les quatre langues (DE/FR/EN/NL) ?  
La cohérence : les données sont-elles alignées entre les langues et adaptées aux différents canaux de distribution − site web, application Visit Luxembourg, bornes digitales partenaires ?  
L'actualité : les informations reflètent-elles la réalité d'aujourd'hui, et pas celle d'il y a un an ?  
Et enfin l'exactitude : ce qui est affiché correspond-il à ce que le visiteur retrouve réellement sur place ?

La qualité des données a toujours été au cœur de notre mission. Disposer d'une base de données touristique nationale, une seule source de vérité pour l'ensemble du pays, est précisément ce qui permet d'éviter que le visiteur se retrouve face à des informations contradictoires selon les canaux.

Ce qui change aujourd'hui, c'est l'enjeu. De nombreux systèmes IA consomment directement ces données : moteurs de recherche, assistants conversationnels, agents de planification de voyage. Une IA ne peut pas compenser des données incomplètes ou obsolètes. Garbage in, garbage out s'applique d'autant plus fort avec l'IA générative.

2. Quel est l'état actuel de vos données : quels sont les principaux défis en termes de complétude, cohérence et actualité des informations ?

Sandy Rischette : Sans entrer dans des chiffres précis qui relèvent d'un audit interne, les défis structurels sont communs à la plupart des DMO.

La complétude est inégale : certains partenaires ont des fiches complètes et bien renseignées, d'autres n'indiquent même pas leurs heures d'ouverture. L'écart entre grands établissements et petits prestataires indépendants est significatif.

Sur l'actualité : les mises à jour saisonnières − horaires d'été et d'hiver, fermetures temporaires, nouvelles offres − arrivent avec retard ou pas du tout, lorsqu'elles dépendent de l'initiative du partenaire. Et souvent, ce n'est pas un manque de bonne volonté : beaucoup de partenaires ne perçoivent tout simplement pas la nécessité de maintenir leurs données à jour. Ils ne font pas le lien entre une fiche obsolète et un visiteur déçu.

Quant à la cohérence multilingue : le contenu existe généralement en DE, FR et EN, mais le NL est souvent partiel, daté, voire absent − alors que le marché néerlandophone représente une part importante de notre fréquentation.

Ce sont des défis structurels du secteur, pas une exception luxembourgeoise.

3. Comment l'IA est-elle aujourd'hui intégrée dans vos processus, de la collecte à la valorisation des données ?

Sandy Rischette : Nous sommes actuellement à la phase initiale de notre stratégie IA, qui s'étend sur 24 mois. Cette phase est délibérément consacrée à la gouvernance, aux fondations et aux expérimentations − sans déploiement en production avant que le cadre soit en place.

Ce qui est actif aujourd'hui : l'IA est utilisée dans nos workflows internes − rédaction, synthèse, traduction assistée, recherche et premiers audits de qualité sur notre base de données. Ce qui est en construction : le cadre de gouvernance IA − registre des systèmes, évaluation des risques, conformité EU AI Act. C'est le prérequis à tout déploiement en production. On ne déploie rien avant d'avoir posé ce socle.

À moyen terme, nous souhaitons intégrer des outils plus avancés pour faciliter et automatiser la mise à jour des données dans notre base, ainsi qu'un agent interne qui exploite ces données pour simplifier le travail quotidien de l'équipe. À long terme, l'objectif est de mettre ces données au service de l'utilisateur final, via un assistant conversationnel sur le site web et dans l'application Visit Luxembourg, capable de répondre à des questions concrètes de planification de voyage.

4. L'IA peut-elle améliorer la qualité des données de façon automatisée, ou faut-il toujours une validation humaine ? Où placez-vous le curseur − et concrètement, à quoi pourrait ressembler une assistance IA proactive pour les partenaires ?

Sandy Rischette : Le curseur est clairement du côté de l'IA assistante, pas de l'IA décisionnaire − du moins pour tout ce qui touche aux données publiées.

L'IA peut automatiser sans validation systématique la détection d'anomalies : identifier des heures d'ouverture improbables ou manquantes, des photos basse résolution ou au mauvais format, des incohérences entre ce que le partenaire déclare dans notre base et ce qui figure sur des sources tierces fiables. Elle peut également assister à la saisie en guidant le partenaire lors de la mise à jour de sa fiche et en suggérant les champs manquants.

En revanche, certaines opérations nécessitent impérativement une validation humaine : toute modification effective d'une fiche publiée, le contenu éditorial, les informations tarifaires et d'accessibilité, l'attribution de labels de qualité, ainsi que la distribution du contenu vers les canaux partenaires.

La raison est simple : responsabilité et confiance. Si une IA modifie automatiquement les horaires d'un restaurant et se trompe, c'est LFT qui porte la responsabilité vis-à-vis du visiteur et du partenaire. L'IA accélère et fiabilise le processus − elle ne le remplace pas.

5. Votre base regroupe des centaines de partenaires touristiques. Comment gérez-vous la mise à jour régulière de toutes ces fiches, et quel est le principal obstacle quand on demande à des hôteliers, restaurateurs ou attractions de maintenir leurs propres données ?

Sandy Rischette : L'imx.Platform fonctionne sur un modèle de saisie partenaire : les prestataires touristiques − hébergements, restaurants, attractions − sont responsables de la mise à jour de leurs propres fiches. Pour les communes et syndicats d'initiative, c'est eux qui assurent la mise à jour des attractions sur leur territoire. LFT et les Offices Régionaux de Tourisme jouent en théorie un rôle de contrôle qualité et de support ; en pratique, ce sont aujourd'hui les ORT qui sont les acteurs les plus actifs dans la maintenance des données. C'est un modèle scalable, mais qui repose entièrement sur l'engagement des partenaires.

Le défi numéro un n'est pas technique : c'est la priorisation. Un hôtelier ou un restaurateur gère son activité quotidienne en priorité. Mettre à jour une fiche sur une plateforme nationale est rarement perçu comme urgent − jusqu'au jour où un visiteur arrive avec une mauvaise information.

À cela s'ajoutent plusieurs facteurs aggravants. La fragmentation des plateformes d'abord : nos partenaires gèrent simultanément Google Business, Booking.com et l'imx.Platform. La charge de maintenance est réelle. L'absence de retour direct ensuite : ils ne voient pas concrètement l'impact d'une fiche incomplète sur leur visibilité ou leur fréquentation. Enfin, la disparité de maturité numérique : entre un grand hôtel avec un service marketing et un hébergement indépendant, le niveau d'aisance avec les outils digitaux varie considérablement.

La réponse à ce défi passe par deux leviers : simplifier au maximum l'interface de saisie, et rendre les bénéfices d'une fiche complète visibles et tangibles pour le partenaire. C'est notre mission continue.

6. Dans quelle mesure des données de mauvaise qualité impactent-elles concrètement l'expérience du visiteur, que ce soit sur le site, dans les applications ou auprès des offices de tourisme ?

Sandy Rischette : L'impact est direct et se mesure sur trois niveaux.

Sur les sites, l'app et les bornes digitales : un visiteur qui trouve des horaires erronés, une adresse incorrecte ou une photo non représentative perd confiance − et cette confiance ne se regagne pas facilement. Dans les offices de tourisme : les agents d'accueil utilisent ces données comme référence. Une information erronée ne reste pas confinée au digital ; elle se propage dans le conseil en face-à-face, et donc dans l'expérience réelle du visiteur sur le terrain.

Le risque le plus critique est cependant émergent : les systèmes IA. Google, ChatGPT, et demain notre propre assistant, indexent et répercutent nos données. Une erreur dans la base ne reste plus une erreur sur un canal − elle devient une erreur sur dix canaux simultanément, souvent sans qu'on puisse la corriger en temps réel.

Le coût réputationnel d'une mauvaise donnée augmente mécaniquement avec chaque nouveau système qui nous cite comme source.

7. Quels sont les prochains chantiers prioritaires de votre équipe en matière d'IA appliquée à la gestion des données touristiques ?

Sandy Rischette : Une fois les fondations de gouvernance posées − ce sur quoi nous travaillons activement en ce moment, nos priorités s'articulent autour de quatre chantiers.

La recherche sémantique : passer d'une recherche par mots-clés à une recherche par intention sur visitluxembourg.com et dans l'application Visit Luxembourg. L'objectif est qu'un utilisateur qui tape « que faire ce week-end avec des enfants sous la pluie » obtienne des résultats pertinents, et non une liste vide ou hors sujet.

La détection d'anomalies et le contrôle qualité automatisé : pour identifier proactivement les données obsolètes ou incohérentes dans l'imx.Platform.

L'assistant IA orienté visiteur : un assistant conversationnel multilingue capable de répondre à des questions concrètes de planification de voyage, nourri directement par notre base de données nationale, avec un go-live ciblé en 2027.

Enfin, les agents internes : des outils IA pour simplifier le travail quotidien des équipes LFT − gestion éditoriale, reporting, support à la saisie, vibe coding, etc.

8. Comment voyez-vous évoluer le rôle de la « data quality » dans une organisation comme Visit Luxembourg dans les 3 à 5 prochaines années, notamment face à la montée des assistants IA qui se nourrissent directement de vos données ?

Sandy Rischette : La data quality va passer d'un enjeu opérationnel à un actif stratégique.

Jusqu'ici, une donnée erronée sur notre site avait un impact limité : le visiteur pouvait vérifier sur Google, appeler l'office de tourisme ou consulter directement le site du partenaire. Il y avait des filets de sécurité. Demain, si un assistant IA lui répond que le musée est ouvert le lundi − parce qu'il a consommé notre donnée − il s'y rendra sans vérifier. La nature de la responsabilité de LFT comme source de référence change fondamentalement.

Nous anticipons trois évolutions majeures. La donnée structurée deviendra un facteur de visibilité : les LLM et agents IA privilégient les sources bien structurées, cohérentes et régulièrement mises à jour. Les DMO qui investissent maintenant dans la qualité de leur base seront mieux indexés et davantage cités ; ceux qui ne le font pas deviendront invisibles dans l'écosystème IA.

La gouvernance des données va se formaliser : qui a le droit de modifier quoi, avec quelle validation, selon quel processus. Ce ne sera plus une question de workflow interne, mais une exigence de conformité.

Enfin, le partenariat avec les prestataires touristiques devra évoluer : maintenir des données de qualité ne peut plus reposer uniquement sur la bonne volonté des partenaires. Il faudra des incitations claires, des outils simplifiés, et probablement des standards minimaux de complétude pour accéder à certains canaux de distribution.

Dans cinq ans, la question ne sera plus « nos données sont-elles à jour sur notre site ? », mais « nos données sont-elles fiables dans l'écosystème IA global ? » Ce sont deux problèmes très différents − et nous construisons dès maintenant les fondations pour y répondre.