Darkoneko's Weblog

Yesterday, today, and no future / time waits for no one

Archive for 13 mars 2008

Wikipédia et les robots

Posted by DarkoNeko sur jeudi 13 mars 2008

Les robots : une Force Maléfique qui agit dans l’ombre, à l’insu du commun des mortels…

Quoi ? Des robots éditent Wikipédia ? Nous sommes envahis ! Ils sont parmi nous ! Appelez la police… l’armée… le gouvernement !!

… non

On appelle « robot » (ou « compte bot »), dans le jargon wikipédien, un compte utilisateur sur lequel tourne un programme qui réalise une tâche répétitive sur un grand nombre d’articles. Une sorte d’esclave qui allège la lourde charge des contributeurs humains.

Les éditions automatiques représentent, à l’heure actuelle, environ 1/5eme du total des éditions sur la Wikipédia francophone.

Les activités robot-esques peuvent être grosso-modo classées en trois types :

Scripts interwikis

il existe un code à rajouter en bas de page qui permet de relier les articles sur un même sujet dans ses différentes langues sur wikipedia. Ce code créé des liens dis « liens interwikis ». Voir la page d’aide sur les « liens interwikis » pour ceux qui ne connaissent pas le terme.

La mise à jour manuelle des liens interwiki entre les 200+ langues que comporte Wikipédia serait une tâche titanesque…imaginez un peu :

  • à chaque fois que vous créez un article
  • à chaque fois que vous supprimez un article (pour les admins)
  • à chaque fois que vous renommez un article

…qu’il faille ajouter/supprimer ou modifier un lien interwiki sur tous les autres wikipedia possédant un article sur le même sujet !

Au lieu de ça, il suffit d’ajouter un lien interwiki depuis/vers un autre wikipedia lors de la création de l’article pour « initialiser la pompe », et le robot se chargera automatiquement de le propager a l’ensemble des autres wikis.

Pour résumer le fonctionnement du script :

  • Parcourir la liste d’articles d’un wiki donné
  • pour chaque article, parcourir ses interwikis
  • Mettre à jour si des éléments ont été ajoutés, supprimés pour déplacés

Ce système n’est pas parfait, car il y a parfois des conflits : des cas ou plusieurs articles d’une langue pointent vers le même article sur un autre wiki. Ces cas doivent être résolus par une intervention humaine.

Note : le script le plus utilisé pour cette manipulation est interwiki.py, du framework Pywikipediabot

Scripts de remplacement de texte

Cette activité est la plus courante. Elle concerne par exemple :

  • le renommage de catégories (comme pour les liens interwikis, on ajoute un code en bas de page pour relier tous les articles partageant un thème
  • l’ajout, transformation ou suppression de modèles.
  • la correction de fautes d’orthographe courantes (ce point pose parfois problème dans la gestion d’exceptions à la règle)
  • le retrait de liens vers des images ou articles ayant été supprimés
  • Création automatique d’articles : notamment, la « base minimale » de la plupart des articles sur des communes françaises ont été créés automatiquement, à partir des données de l’INSEE.
  • etc.

Script à « réactions »

Les scripts de cette catégorie effectuent des actions en réponse à un évènement (ils y réagissent, d’où le nom)

Pour ce faire, ils « lisent » à intervalles réguliers les modifications récentes sur le site ou sur IRC

…exemples :

  • Combat contre le vandalisme. Le robot Salebot, grâce à une série d’algorithmes, détecte si une édition donnée est un vandalisme (blanchiment de sections de la page, ajouts d’insultes, etc) et révoque le cas échéant.
  • Archivage automatique des discussions après un certain temps de non activité
  • Aide aux débutants, par exemple
    • ajout automatique de signature à une message lorsqu’une personne oublie de le faire (existe uniquement sur la Wikipédia anglophone pour l’instant)
    • Laisser un message d’avertissement/aide à un contributeur lorsque, lors de la création d’un article, il ne lui met aucune catégorie ni lien interne. (Escalabot)
    • Souhaiter la bienvenue aux nouveaux, en postant un message d’aide sur leur page de discussion (Loveless)

Un problème avec les robots, c’est que tout comme l’édition des articles, à peu près n’importe qui peut en utiliser un, et les dommages peuvent rapidement être importants en cas d’erreur. De nombreux wikis ont donc rendu obligatoire l’obtention du statut de bot, déclaré et accepté par la communauté, pour l’utilisation de scripts, sous peine de blocage.

Il existe d’autres scripts, dits « d’aide à l’édition », qui automatisent des actions mais demandent eux une confirmation humaine  pour les effectuer. Par exemple : LiveRC, qui sert notamment au combat contre le vandalisme, et AutoWikiBrowser . Mais là encore, l’utilisation peut créer des dommages si l’utilisateur n’est pas suffisamment attentif.

Bref : les robots sont nos amis, ils faut les aimer aussi… mais de grâce, ne faites pas n’importe quoi avec :)

edit :

  • simplification de certaines explications obscures — merci Lilyu :)
  • ajout des robots d’archivage (merci Chico :)

Posted in les coulisses de Wikipédia | Tagué: , , , , , , | 3 Comments »

Les coulisses de wikipédia : intro

Posted by DarkoNeko sur jeudi 13 mars 2008

Wikipédia ne ressemble pas vraiment à ce que l’on peut voir dans les médias. Ce sont souvent les mêmes poncifs qui reviennent : « l’encyclopédie que tout le monde peut éditer »… chacun fait son petit article dans son coin (ou se bat contre un autre éditeur pour que l’article soit de la manière qu’il souhaite), le tout dans l’anarchie la plus totale.

La vérité est moins simple : il existe de nombreuses structures/éléments au sein de Wikipédia qui sont totalement inconnues du grand public. Le genre d’éléments qui existent dans l’ombre et participent à maintenir ce joyeux bordel à un niveau d’organisation acceptable.

Cet article se veux une simple introduction, je resterais donc dans les généralités ; certains éléments seront détaillés prochainement dans d’autres billets.

Voici quelques exemples :

  • le service de parrainage actif (SPA) : du fait de sa taille grandissante, Wikipédia deviens de plus en plus difficile à aborder pour un débutant. Ce groupe de personnes les accueille et tente de guider leurs premiers pas au sein de l’encyclopédie, leur expliquer leurs erreurs, etc.
  • les wikipompiers (WPP) sont spécialisé dans le désamorçage de conflits. Littéralement, il s’agit d’éteindre les débuts d’incendie entre contributeurs, lorsque le ton monte et que les esprits s’échauffent.
  • Wikipédia:Liste des articles non neutre (WP:LANN) recense les articles notablement non neutres de Wikipédia, et les (courageux)gestionnaires de la page tentent de trouver des solutions aux problèmes de ces articles.
  • Si la situation ne s’arrange pas malgré l’intervention des wikipompiers, le dernier recours est le Comité d’arbitrage (CAr). Le CAr est une structure officielle, dans le sens que ses membres, les arbitres, sont élus par la communauté ; on peut dire qu’il fait, en quelque sorte, office de tribunal. Les arbitrages du CAr peuvent aboutir, pour un ou plusieurs des plaignants, à une interdiction d’édition de certains articles ou un blocage en écriture
  • Wikipédia:Pages à supprimer (WP:PàS) est le centre de discussion concernant la suppression/conservation d’un article ou d’un ensemble d’articles. Bien que ne tournant pas trop mal, le système est loin d’être parfait (mais je détaillerais ça une autre fois).
  • Wikipédia:Demande de suppression immédiate (WP:SI) est là ou sont recensées les demandes de suppressions de pages qui, contrairement à celles listées sur WP:PàS, ne nécessitant pas particulièrement de discussion. Des administrateurs vérifient régulièrement cette page et procède aux suppressions (du moins lorsque la demande est justifiée)
  • le projet catégories vise faciliter l’accès aux articles en les classant dans différentes catégories.

etc, etc.

Il existe de très nombreuses autres choses, mais je m’arrêterais là pour cette fois ci. Gardez toutefois à l’esprit, comme le fait très justement remarquer Poulpy sur son blog, que la plupart de ces éléments sont « spontanés  » (même si certains, comme WP:PàS et le CAr, commencent à être profondément ancrés) et donc, susceptibles de disparaitre ou être modifiés profondément à tout moment ; tout comme de nouvelles strucutres/élements peuvent se créer à partir de rien.

Posted in les coulisses de Wikipédia | Tagué: , , | Leave a Comment »