wiki sémantique

MousseParisWikiSémantique #3

Après l'annulation de l'édition 2006 faute d'organisateurs ;-), le cru 2007 des fameuses MoussesParisWikiSémantique s'annonce comme un grand millésime.

Ambiance détendue et très informelle. Pas de vidéoprojecteur, pas de tableau blanc... seulement quelques bières et tout votre enthousiasme, ou votre curiosité. Thème non restrictif, la règle c'est qu'il n'y a pas de règle (principe essentiel des MoussesParis).

C'est surtout l'occasion de rencontrer dans la réalité nos connaissances numériques. Alors venez nombreux !

On peut s'inscrire (ou pas), sans obligation : ici ou .

Le wiki sémantique se cherche

Bin oui... le wiki sémantique c'est un peu mon dada... alors je suis quelques liens, j'effectue quelques test ça et là...

Et je voudrais présenter aujourd'hui deux outils particulièrement prégnants. Ils me paraissent en effet symptomatiques des différentes voies de recherches de la communauté informelle des wikis sémantiques.

OpenRecord

Le premier outil n'est pas un wiki sémantique (ça commence mal). OpenRecord est similaire à un wiki, mais avec des fonctionnalités de base de données (ma traduction). Chaque page (appelée enregistrement) :

  • peut être formée comme une page wiki (une titre et un texte associé)
  • peut décrire une chose à l'aide de plusieurs propriétés et valeurs correspondantes ; exemple : Le chêne (chose) a pour fruit (propriété) le gland (valeur)
  • peut agréger plusieurs objets et leurs propriétés sous formes de tableaux, de graphes, de feuilles de calculs, etc.

On voit ainsi vite, et l'outil ne s'en cache pas, sa parenté avec les wikis et le web sémantique : This OpenRecord design is inspired by wiki software and sites like Wikipedia, as well as Content Management Systems (CMSs) like Zope/Plone and eZ publish. The OpenRecord design also draws on ideas from outliners like Lotus Agenda and OmniOutliner, spreadsheets like Lotus Improv, and newer work like Chandler and RDF. OpenRecord pourrait encore se révéler de parenté proche d'outils comme Hypercard ou Idealist. (Tous ces outils inclassables relèvent de la "base de données semi-structurée", terme tellement vague que Wikipedia, le mentionnant pourtant, ne lui trouve aucun contenu. J'en reparlerai.)
Malgré sa jeunesse et une maturation assez lente, cet outil se révèle tout simplement bluffant :

  • aussi souple, simple et immédiat qu'un wiki
  • aussi riche qu'une feuille de calcul ou une base de données personnelle
  • et bénéficiant naturellement de tous les avantages du web

De mon point de vue, OpenRecord préfigure le wiki sémantique idéal :

  • masquant toute la tringlerie technologique : si RDF est un modèle simple, ses syntaxes et son vocabulaire sont tout bonnement absconses pour le grand public
  • offrant toutes les fonctionnalités permises par le web sémantique : réutilisation des objets, agrégations, requêtes complexes non ambigües, etc.

OntoWiki

Le second outil, cousin du premier, vit pourtant aux antipodes. OntoWiki, est un wiki sémantique bien affirmé. Pas un wiki sémantisé, non-non-non... un vrai wiki sémantique, un pur, un dur, Uber Geek Compliant. Disons plutôt qu'il représente le courant dur des wikis sémantiques, qui tire finalement sur l'éditeur d'ontologie wikifié. Pour être plus clair, ce genre d'outil propose grosso modo les mêmes fonctionnalités que son lointain cousin mais en rendant apparente toute la richesse et la complexité des normes du web sémantique. On obtient donc un outil :

  • plus riche qu'OpenRecord – avec la possibilité, par exemple, de spécifier la langue de chaque contenu textuel
  • tirant pleinement partie des apports du web sémantique (standardisation, interopérabilité, etc.)
  • mais, soyons clairs, inutilisable pour le grand public

(Je ne vais pas trop m'étendre sur cet outil et vous renvoie sur la demo (dont un screencast) et la présentation – il y a un très bon PDF qualité LaTeX (un vrai régal). Oui-oui-oui, je ne suis pas aussi pédago que notre ami Gauthier Poupeau... pas de zoulis photos, pas d'explications CM2 friendly, etc. Comprenez, j'ai déjà du mal à réaliser mon ambition de penser à voix haute...)

Une démarche médiane est-elle possible ?

Là j'hésite furieusement à développer : j'ai déjà tellement orienté mon discours que la ficelle est un peu grosse, non ? Et une fin en quenouille est toujours appréciée des connaisseurs. En bon wikiste, j'y reviendrait plus tard.

(Pour un wiki-native comme moi, ce qui est pénible avec ces blogs, c'est que l'on a toujours envie de finasser. Si j'avais le courage je publierai l'article en brouillon pour le compléter petit à petit (liens, photos, etc.). Et vous, comment faites vous pour vous en sortir ?)

Les wikis sémantisés : impasse ou nécessité ?

Est-il possible que cela soit les deux ?

Rappelons tout d'abord ce qu'est un wiki (que j'appelle) "sémantisé". Il s'agit fondamentalement d'un wiki classique auquel on a ajouté des fonctions d'analyse syntaxique (parser) permettant, à l'intérieur d'une page wiki, d'écrire des relations entre des objets du web sémantique. Mais encore ? Un bon exemple vaut toujours mieux que cent discours ; imaginons le contenu suivant d'un wiki classique :
le têton est une zone érectile
Dans un wiki sémantisé on pourrait écrire :
[l'objet "têton"] [a une relation de type : est] [avec l'objet "zone érectile"]
La description formelle de ce fait permet ensuite à des outils sémantiques de manipuler cette information :

  • par exemple tel moteur de recherche poura trouver toutes les zones érectiles
  • de même, tel moteur d'inférence permettra de déduire que le têton, puisqu'il est une zone érectile, est donc un organe vivant (ayant préalablement été informé que l'érectibilité ne s'accorde qu'aux organes vivants)

L'un des meilleurs représentant de ce type de wiki est Semantic MediaWiki, très bien présenté par Gautier Poupeau (alias Got).

Formidable !
Oui ! et c'est même une nécessité si l'on considère la richesse (supposée) des retours d'expérience permis grâce à ces wikis. Le web sémantique a besoin d'expérimentations concrètes qui montrent tout son intérêt. Et les wikis sémantisés offrent de fantastiques possibilités d'écriture collaborative de connaissance formelles.
Les wikis sémantisés sont donc peut-être une nécessité.

Pour autant, ces wikis posent, structurellement, des problèmes tels qu'ils pouraient rapidement réveler une impasse :

  • interface utilisateur niveau Geek+1 exemple [[is capital of::France]]
  • pas de réification possible simplement ; en d'autres termes
    • pas d'historisation possible des déclarations
    • pas de mention d'auteur des déclarations
    • pas de gestion de droits d'accès aux triplets

La raison de ces limites est structurelle, c'est-à-dire qu'elle est inhérente à la façon même dont sont conçus les wikis sémantisés : le concept de tels outils est la manipulation de pages et non, à l'instar des "vrais" (?) wikis sémantiques, des objets.

Les "vrais" (?) wikis sémantiques, eux, manipulant des objets, peuvent réaliser toutes les opérations possibles sur les déclarations inhérentes à des objets (versionnement, datation, mention d'auteur, droits d'accès, etc.).

Alors ? Impasse ou nécessité ?

(Comme j'adore finir en queue de poisson, j'expliquerai plus tard pourquoi ces derniers percent moins facilement que les premiers.)

Wiki sémantique : de quoi parle-t-on ?

[Message de service : cet article est publié dans la catégorie "brouillon" ; démarrage du sujet et point de départ vers des publications ultérieures. (Critiques bienveillantes appréciées.)]

Un wiki sémantique, des wikis sémantiques ? De quoi parle-t-on ?...

(Disons tout de suite que l'association de ces deux termes n'est peut-être pas très heureuse : termes obscurs, mal habillés, paressant tout droit sortis du laboratoire. Pourtant l'usage les consacre, chez les francophones comme chez les anglophones. Laissons ça de côté pour le moment.)

Mais encore ? J'avais proposé, sur CraoWiki en juin 2004, une première tentative de définition. Je la livre ici corrigée et augmentée.

Définition

L'objectif du web sémantique est de permettre un web à très forte valeur ajoutée dans le domaine du sens : un web peuplé de concepts plutôt que de textes. Un wiki sémantique est le prolongement au sens du principe majeur du wiki, ToutLeMondePeutEcrire ; ce que j'ai appelé en d'autres termes ToutLeMondePeutDécrire. Cela veut dire qu'avec un wiki sémantique on pourra créer une espèce de base de données où tous les objets sont liés entre eux par des propriétés, permettant ainsi des recherches complexes non ambigues.

Résumons-nous :

  • le web "classique" : un espace peuplé essentiellement de textes renvoyants les uns aux autres via des hyperliens "pauvres" (tel(s) mot(s) a un lien avec tel texte ; la nature du lien n'est pas explicitée)
  • le web sémantique : un espace peuplé d'objets ayant des relations formalisées entre eux : la nature du lien entre deux choses est explicitée
  • un outil de gestion de contenu "classique" (wiki, blog, CMS) permet d'organiser des textes les uns par rapport aux autres en fonction d'une logique sociale particulière : un carnet personnel (blog), une communauté de connaissance (wiki), etc.
  • un outil de gestion de contenu sémantique permet d'organiser des choses les unes par rapports aux autres, toujours en fonction d'une logique sociale donnée

Partant des usages plutôt que des besoins (nous y reviendrons plus tard), on peut trouver deux sortes de wikis sémantiques.

  • les wikis "sémantisés" : toujours fondés sur le mode page, mais permettant d'élaborer des relations complexes entre les pages. Cette voie est en apparence la plus simple mais elle révèle de nombreuses limites : comment puis-je décrire une page et non le sujet de la page ? etc.
  • les wikis "pleinement" sémantiques : on applique le principe ToutLeMondePeutEcrire à une base de connaissances
    décrivant des objets ; les informaticiens parleraient d'une "base de données objets". La notion de page n'est plus centrale ; une page n'étant plus que le résultat de l'agrégation de connaissances relatives à un objet (qui lui même peut recouvrer un groupe d'objet).

Les applications des wikis sémantiques

Elles sont immenses.

  • élaboration simple de bases de données distribuées complexes : par exemple : des généalogies, des réseaux de personnes, des communautés, des bases de connaissances thématiques semi-structurées, etc.
  • élaboration de micro applications spécialisées en combinant des greffons au wiki sémantique : par exemple : des blogues, des agendas, etc.
  • élaboration d'outils d'agrégation d'information, sur le principe de la centralisation en seul endroit (ou plutôt une seule interface) de données provenant de plusieurs canaux d'information : on pourra voir à ce titre ce qui est proposé par l'outil haystack : http://haystack.lcs.mit.edu/ ; mais on pourra également retrouver des services d'agrégation de données en ligne du type de netvibes.com ou webwag.com

Dans les faits, un wiki sémantique offrant des vues personnalisables en fonction des objets, constitue un fantastique outil de gestion de contenus distribués.
Les wikis sémantiques pourraient être la pierre angulaire, la killer app du web sémantique. Ils pourraient être à la base de l'Entreprise 2.0 (warning : concept fumeux mais bien pratique), où chaque groupe de travail produira des informations riches, standardisées et réutilisables par toute application web.

Développement et perspectives

[à suivre...]

Bref compte rendu de Bar Camp Paris 4

En bref, une grosse bouffée de rencontres et d'idées. Organisation parfaite, merci Mandriva. Je détaillerai plus tard, mais je retiens dans les grandes lignes :

  • l'intérêt suscité sur les wikis sémantiques ; j'en parle depuis 2003, sur CraoWiki et ailleurs, mais je sens maintenant un réel intérêt ; je vais tâcher de publier et d'organiser un peu mieux mes idées et mes expérimentations sur le sujet
  • l'intérêt également pour la Banque 2.0, farce initiée par l'infatigable Christophe Ducamp et moi-même, étonnant brain storming dont nous n'avons pas encore idée de ce qui en sortira
  • le principe vraiment innovant du BarCamp. 1. La diversité des participants m'a frappé : de nombreux geeks en herbe et confirmés bien sûr, mais aussi des banquiers, des investisseurs, des gens de marketing ou de la communication, des idéateurs de tous poils, etc. 2. La concentration de sujets connexes et des expertises est réellement efficace. -- Je gage de la réussite de ces rencontres ; il faudra regarder de près les projets qui en sortent

Bientôt les wikis sémantiques ?

Perdu. Ils ne sont pas encore sortis des labs mais l'idée, chère à mes yeux, commence à faire un peu de bruit. Je note deux signes intéressants.

  • Le concept se voit supporté par un ambassadeur prestigieux : Tim Berners Lee, le papa du web qui, dans un long entretien podcasté, explique "Les wikis sémantiques sont très intéressants. Ce sont des wikis où les gens peuvent ajouter des données et où ces données peuvent être apprêtées et tranchées et découpées en utilisant toutes sortes d'outils du web sémantique.[1]
  • Par ailleurs, un projet de wiki sémantique est inscrit au prochain BarCampParis : un mystérieux linuxpeadia.org [2] ; autant dire que je suis très excité ! (et que j'y serais !)

[1] Traduction approximative par mes soins... Citation originale pour les puristes : The semantic wikis are very interesting. These are wikis in which people can add data and then that data can then be surfaced and sliced and diced using all kinds of different semantic Web tools [...]".
[2] A l'heure où j'écris ces lignes le site n'est pas accessible.

Naissance de la communauté du wiki sémantique

Depuis quelques mois s'organise la communauté mondiale du wiki sémantique (peut-être une quarantaine de personne). Elle se matérialise par un groupe informel :

Le sujet prend de l'ampleur et possède maintenant un bon article d'introduction (sur Wikipédia, bien entendu...).

Restez à l'écoute, j'en reparlerai régulièrement.

Syndiquer le contenu