Logo mariane Ministère de l'Economie, de l'industrie et de l'emploi
Logo telecom.gouv.fr
Recherche


Soutiens et financements
. Programmes nationaux
. Programmes communautaires
. Initiatives Technologiques Conjointes (ou "JTI")
. Programme Eurêka
. AAL
. Fonds francophone des inforoutes


Organisation du secteur
. Appels à concurrence
. Textes réglementaires
. Corégulation
. Dossiers sectoriels
. Normalisation
. Dispositifs fiscaux et soutien à l’innovation
. Europe et international
. Les manifestations


Entreprises et économie numérique
. Pôles de compétitivité TIC
. Tableaux de bords, guides et outils
. Dématérialisation des marchés publics
. Certificats référencés PRIS v1
. Certificats qualifiés
. Sécurité


Datathèque
. Guide PMI-diag
. La lettre de la DGCIS
. Audiovisuel
. Rapports et études
. Veille et mesure
. Archives


Acteurs
. Nos partenaires
. Qui sommes-nous ?
. Comment nous trouver

Accueil > Organisation du secteur > Dossiers sectoriels > Web > Web sémantique > Impacts sociétaux du Web sémantique

Impacts sociétaux du Web sémantique

Le Web sémantique est un Web « plus intelligent » où les documents sont compréhensibles par les machines et peuvent donc être traités automatiquement de manière beaucoup plus pertinente. Plus précisément, c’est une évolution progressive du Web portant à la fois sur la production du contenu et sur l’analyse de ce contenu :

  • dans la phase de production de contenu, c’est-à-dire avant même sa publication sur Internet, on adjoint aux documents des métadonnées qui permettent aux machines d’en saisir le sens. Par exemple dans le cas de contenu textuel, on ajoute au texte brut des balises donnant une représentation abstraite du sens du texte, indépendamment de la langue dans laquelle il est écrit. Il s’agit donc d’un thème de recherche assez théorique au carrefour de l’informatique fondamentale et de la linguistique. La diffusion des contenus produits en accord avec les principes du Web sémantique requiert une adaptation des systèmes de gestion de contenu sur le Web (les logiciels qui permettent d’organiser le contenu sur des sites Web) ;
  • dans la phase d’analyse des contenus, c’est-à-dire lorsque le contenu est lu, soit par un humain par le biais de son navigateur Internet, soit par une machine lors de l’indexation par les moteurs de recherche, des technologies sont mises en œuvre pour comprendre, a posteriori, le sens des documents. Ces technologies peuvent être purement automatiques (traitement d’images ou de sons, intelligence artificielle) ou demander, en plus, la contribution d’intelligence humaine.

Où en est-on aujourd’hui ? Dans le cas de la production de contenu, le Web sémantique n’est pas encore une réalité car il faut que tous les systèmes de gestion de contenu (les briques de base du Web, que sont les moteurs de wiki, de blog, etc.) soient rénovés pour présenter en plus du contenu, une représentation abstraite de son sens. Pourtant les efforts de standardisation sont nombreux et il existe des formats de données largement reconnus, comme RDF. En revanche, dans le cas de l’analyse des contenus, des solutions sont déjà largement déployées, notamment par les moteurs de recherche. Ce domaine fait l’objet de programmes de R&D conséquents, pour les moteurs de recherche bien sûr pour qui le sujet est central, mais aussi pour un certain nombre de fournisseurs de services pour qui l’analyse automatique des données du Web est un axe stratégique majeur (instituts de sondage, par exemple).

L’enjeu principal pour le Web est de passer d’un ensemble de documents à un ensemble de services interconnectés et communicants, avec pour résultats de nombreux services innovants et une expérience plus intégrée pour l’utilisateur.

D’un point de vue sociétal, le Web sémantique pourrait permettre de répondre à un certain nombre de défis posés par la diffusion des TIC auprès du grand public :

  • rendre plus accessible la recherche efficace sur Internet ; aujourd’hui il faut une grande pratique d’Internet pour pouvoir chercher des informations de manière efficace, ce qui fait qu’une grande partie des utilisateurs n’utilisent pas toutes les ressources du Web. Le Web sémantique en améliorant les outils de recherche pourrait contribuer à résorber la fracture numérique, notamment générationnelle ;
  • faciliter la diffusion multiculturelle des contenus du Web et de l’information : la sémantification du Web entraîne un immense bond en avant dans le domaine de la traduction automatique, favorisant l’accès à l’information de populations dont les langues sont sous-représentées sur le Web.

Le Web sémantique présente également un certain nombre de dangers :

  • en facilitant le traitement automatique à grande échelle des données du Web, il exacerbe les risques de dérives liés au respect de la vie privée et à la protection des données personnelles ;
  • la capacité de traitement à grande échelle des données du Web demande des infrastructures de serveurs très importantes (« data centers ») qui sont aujourd’hui aux mains de quelques acteurs privés non-français, ce qui pourrait poser un problème de barrière à l’entrée en termes d’infrastructures et de souveraineté nationale ;
  • enfin, le Web est encore un media nouveau qui a grandi par sédimentation successive de documents de générations différentes. Le Web sémantique, en juxtaposant aux documents anciens des documents de formats nouveaux pourrait poser des problèmes d’accessibilité et de pérennité des données de précédente génération.

La Dgcis mène déjà des actions d’aide à la compétitivité des entreprises dans le domaine du Web sémantique, par le biais de l’aide aux projets de R&D, notamment dans le cadre du pôle Cap Digital (axe stratégique « ingénierie des connaissances »). Les projets concernés portent sur le domaine de la production de contenu (Scribo) mais surtout sur celui de l’analyse de contenu (Infom@gic).

Le Web sémantique est un domaine de recherche pluridisciplinaire porteur de très nombreuses innovations pour les entreprises des TIC. Plus généralement, les nouvelles pratiques liées au Web sémantique vont changer le rapport des entreprises à l’information. Comment favoriser le développement en France et en Europe de services nouveaux porteurs de croissance, tout en assurant le respect des principes de protection de l’utilisateur ? Comment s’assurer que ces services seront sources d’une véritable création de valeur ? Quelles sont les principales barrières à l’entrée pour les acteurs français ?

 




Appels à projets

La neutralité de l’Internet : modalités techniques et enjeux économiques

Appel à projets ITEA2

Appel à projets CATRENE 2010

 
Accès à nos services

Soumettre un événement

Rechercher un partenariat



Accès réservés
Achpub
TIC & e-Santé
Comité PIIC
GTN-TIC
PCRDT
Comité IIE
29 octobre 2008   [ Dernière mise à jour : 16 mars 2009 ]
 
© Ministère de l'Économie, de l'industrie et de l'emploi - 2008


Ecrire au webmestre       Plan du site       Liens Utiles       Aide et mentions légales
Logo Agora   Logo W3C   Logo RSS        Logo Service Public   Logo Premier Ministre