Cette prise de décision a aboutit à la mise en place de l'archive wikiwix le 13 novembre 2008.
Le vote est clos. Les discussions sur l'application sont en en cours.
Cette prise de décision porte sur la mise en place d'un archiveur web dédié à Wikipédia. Il a de ce fait des points communs et des différences avec ses semblables Internet archive ou Google cache.
Dans le cadre du Projet:Correction des liens externes, internet archive est utilisé pour remplacer un lien mort par la version archivée de ce lien, ce qui le rend à nouveau accessible. Cela prend toute son importance lorsqu'il s'agit d'un lien servant de référence, un lien mort n'étant par définition plus vérifiable...
Cela doit par contre être fait à la main, et la quantité de lien à corriger (74'000 le 13 septembre 2008, en constante augmentation : voir le chiffre actuel) est bien trop importante pour les quelques membres que nous sommes. Internet archive se trouve aussi être insuffisant, car un grand nombre des pages ne sont pas archivées ou sont inaccessibles pour de multiples raisons. J'estime que environ un lien sur trois y est archivé.
Il y a donc besoin d'une archive spécifique à Wikipédia.
Fonctionnement de l'archivage
Le système de cache proposé ajoute un lien supplémentaire « cache » à tous les liens externes. Exemple de page en cache : (cache)
À propos de l'esthétique : Nous pouvons à tout moment changer l'esthétique du lien, cela (ainsi que le reste) sera dans le MediaWiki:Common.js. Une discussion à commencé ici.
Le lien original n'est pas altéré, le code wiki reste inchangé.
Si le lien externe est mort, le visiteur Wikipédien a donc la possibilité de consulter la page originale en cliquant sur le lien du cache. Cela évite donc d'avoir à faire une correction à la main.
La date de la mise en cache est celle de l'insertion du lien. En outre le cache n'est pas mis à jour, ce qui permet de disposer de la page telle qu'elle était au moment de son insertion sur Wikipedia. Cela peut être changé au besoin, selon les décisions de la communauté.
Pour tester le cache il suffit de rajouter la commande : loadJs('User:Pmartin/cache.js'); à votre monobook.js.
La société Linterweb, déjà liée à Wikipédia par ses travaux Kiwix et le moteur de recherche Wikiwix (Wikiwix), se propose de procurer bénévolement le cache en question.
Objections courantes
Questions les plus évidentes et leurs réponses :
N'est-il pas illégal d'héberger un système de cache ? → Le cabinet d'avocat de Linterweb pense que non, notamment du fait que de tels systèmes sont déjà en place ailleurs (Google, Internet Archive) et qu'il existe des possibilités techniques d'interdire la mise en cache.
N'est-il pas dangereux pour la Wikimedia Foundation d'être hébergeur ? → Seul Linterweb serait l'hébergeur, Wikipedia ne faisant que faire des liens vers les pages en cache.
N'est-il pas immoral de faire des liens vers un site dont on suppose qu'il pourrait violer le droit d'auteur ? → De nombreux liens de Wikipédia pointent déjà sur des sites dont certaines pages pourraient hypothétiquement violer le droit d'auteur. Aucune politique claire n'existe à ce sujet de la part de la Wikimedia Foundation, ni aucune définition non-ambigue de ce qu'est une violation du droit d'auteur acceptable ou non.
Linterweb fera-t-elle un bénéfice sur l'exploitation du cache ? → Difficile à dire avant que le système soit lancé, mais c'est possible, de la même manière que cette société commercialise WikipediaOnDVD ou propose un moteur de recherche en espérant en retirer quelque chose. Cependant, l'esprit des projets de la Wikimedia Foundation est d'encourager ces pratiques de redistribution (voir la licence GFDL, par exemple). De plus, Linterweb s'engage à mettre à disposition les données statistiques issues du cache (sous une licence à définir, néanmoins).
Le système peut-il pister les visiteurs des articles ? → Non, le système ne fait que rajouter un lien et ne modifie pas plus le code HTML de la page. Il peut néanmoins décompter les visiteurs des pages mises en cache.
Les liens externes supprimés continueront-ils d'être mis en cache ? → Non, une fois supprimé de Wikipédia, et après un délai de sécurité à définir (actuellement d'un jour), le lien externe est également supprimé du cache de façon automatique.
Internet archive propose déjà ce système et est très employé sur Wikipédia → Internet archive n'archive pas l'intégralité des liens utilisés sur Wikipédia, ni ne propose un archivage à la date d'insertion du lien. L'idée est d'avoir un cache spécifiquement adapté à Wikipédia.
Mise en œuvre
Deux moyens sont envisagés pour la mise en place de l'affichage des liens vers le cache : un script, ou l'utilisation de modèles.
Le script, exécuté sur la machine de l'utilisateur, parcourt la page et y ajoute le lien. Son exécution sur une page met actuellement 130 ms[1] à s'exécuter, et Guillaumito (d · c · b) fait de son mieux pour raccourcir encore ce temps. Maloq (d · c · b) trouve cela néanmoins trop lourd pour une application par défaut (proposition 2 et 3). Le cache de Guillaumito est prévu pour ne pas s'exécuter si le nombre de liens dans la page excède 50, tandis que celui de Pmartin (l'original) est limité à 250 liens. Cela date d'avant la PDD, il a été oublié de le mentionner. Voir la discussion
↑sur l'article Jacques Chirac (100 ko, 31 liens externes), avec un ordinateur moyen
Il est également possible de faire afficher le lien vers le cache depuis un des modèles de présentation de liens externes :
{{lien brisé}}, modèle conçu pour être apposé par un bot détectant un lien mort ;
Dans le cas de l'utilisation par un modèle, aucun script n'est exécuté sur la machine de l'utilisateur, qui ne subit aucun délai. Cependant, le lien vers le cache ne peut être apposé que sur les liens appelés par un modèle. L'intervention d'un bot remplaçant les liens (soit seulement les liens morts, soit l'ensemble des liens) est ainsi nécessaire à l'application du système.
Dans les deux cas, il est possible de définir une préférence utilisateur, permettant, respectivement, l'exécution ou la non-exécution du script, ou bien l'affiche ou le non-affichage du lien fourni par le modèle.
Certaines modalités pratiques peuvent être choisies plus tard en fonction des résultats de la mise en place initiale et des commentaires de la communauté. Selon les résultats de la mise en œuvre, cette fonctionnalité sera par la suite proposée aux autres langues de Wikipédia.
Choix
La prise de décision vise à décider la façon de mettre à disposition le système de cache sur la Wikipédia francophone.
Proposition 1
Le système n'est pas activé par défaut, les utilisateurs enregistrés peuvent cocher la case dans leurs préférences pour l'activer.
Si l'utilisateur n'a pas activé le gadget, un bouton dans la Boîte à Outils permet d'activer le script sur la page courante. Cela règle les problèmes d'accessibilités évoquées ci-dessous. Cela permet aussi un usage large du cache, et de ne l'activer que lorsque l'on en a besoin. Il est prévu de pouvoir déactiver le bouton via un script à ajouter dans son monobook, si certains le désirent.
Proposition 2
Seuls les utilisateurs enregistrés voient les liens « cache » par défaut, et peuvent les masquer, via une case à cocher dans les préférences, ou en ajoutant no_external_cache = true; à son monobook.
Proposition 3
Tous les visiteurs voient apparaître les liens « cache », avec la possibilité pour les utilisateurs enregistrés de les enlever, via une case à cocher dans les préférences, ou en ajoutant no_external_cache = true; à son monobook.
Cette dernière proposition permet de rendre les liens morts vérifiables pour tous, sans intervention manuelle. C'est l'option retenue par le Projet:Correction des liens externes.
Établissez la liste de vos préférences, en commençant par votre proposition préférée. Listez les trois choix. En cas d'égalité entre deux choix, ou d'indifférence, placez les choix au même niveau en les séparant par le symbole = .
Pour voter, ajouter une nouvelle ligne avec :
# A>B>C ~~~~
Remplacez les lettres par les numéros des choix.
Exemple en cas d'égalité ou d'indifférence : 1>2=3 ou 1=2>3 ou 1=2=3
Si les 3 choix ne sont pas listés, les choix non exprimés sont tous classés à égalité et derniers.
↑En cas d'égalité le gagnant est désigné par la méthode Schulze. Voir à ce sujet : [1].
1 > 2 > 3 : tant qu'on aura pas trouvé une solution pour alléger le temps d'exécution du script, je pense qu'il faut le proposer en option à ceux qui ont le matériel suffisant pour ne pas sentir de gène, et donc ne pas gener les autres. Maloqcauser20 septembre 2008 à 09:55 (CEST)[répondre]
3 et refus des autres propositions : les liens morts vers des sources internet représentent un vrai problème : voici la solution. Et il ne me semble pas juste de la limiter aux seuls utilisateurs enregistrés. Voter pour en exclure les "simples lecteurs" est discriminatoire : Wikipedia a enfin l'opportunité d'offrir à ses lecteurs un moyen d'accéder à des sources utilisées dans l'article, mais non consultable car périmées. La vérifiabilité est un principe de Wikipédia, et faciliter l'accès à la source lorsque c'est possible est aussi un de nos objectifs. Lilyu (Répondre) 20 septembre 2008 à 12:02 (CEST)[répondre]
3 > 2 > 1 L'argument du temps d'exécution est injustifié ne s'applique qu'au cas du script. D'une part, le test a été effectué sur une de nos plus grosses pages (100 ko de code source), le temps dans une page « normale » sera bien plus faible. D'autre part, comme écrit ci-dessus, il est possible d'utiliser des modèles, pour lequel le temps d'exécution est de zéro millisecondes, tout compris. Enfin, les personnes ayant un matériel ancien le savent déjà et désactivent le chargement des images ou du javascript. (Perso, j'utilise l'extention NoScript de Firefox et je n'autorise les scripts que quand c'est nécessaire.) — Jérôme20 septembre 2008 à 12:15 (CEST)[répondre]
3. Comme Lilyu, refus des deux autres propositions. Pas du tout convaincu par les arguments sur le temps d'exécution du script. Pour ce qui me concerne, je ne vois pas pourquoi on limiterait en quoi que ce soit l'accès à ces liens en cache, et surtout à qui que ce soit. Je teste ce script depuis des semaines, notamment avec des sites népalais (institutionnels ou non), hébergés dans un pays où les infrastructures téléphoniques présentent disons « quelques lacunes », et je trouve intéressant de pouvoir me référer à telle ou telle chose en cache au moment où j'en ai besoin. Hégésippe | ±Θ±20 septembre 2008 à 12:50 (CEST)[répondre]
3 > 2 = 1 Je ne vois pas de raisons de privés 99% des utilisateurs des lecteurs de cet outil qui leur permettrait d'accèder aux ressources utiles, et ce même si le site n'existe plus pour diverses raisons. Pour répondre aux arguments contrer, l'augmention du temps de chargement de 0,2s ne me semble pas rédibitoire. De plus, je ne vois pas comment les utilisateurs de Wikipedia pourraient "découvrir" que cet outil existe sans être eux-même rédacteurs. Il faudrait se souvenir que 99% des utilisateurs n'ont pas connaissance des pages Wikipedia: et qu'ils ne découvriront donc jamais l'existence de cet outil. schiste20 septembre 2008 à 17:21 (CEST)[répondre]
1 > 3 > 2 3 > 1 > 2 À condition sinequanone que les liens vers le cache soient faits via le modèles {{Lien web}}. Sinon je suis pour l'activation via la boîte à outils. J'estime que l'activation via un bouton dans la boîte à outils (accessible aussi aux IPs), permettant un accès dés que besoin, laissant la possibilité à chacun de corriger le lien en dur ensuite est suffisant. L'inclusion en dur via des modèles permet un joli plus. Pour des raisons d'accessibilité, le 3 vient ensuite. Ne voyant pas la raison pour laquelle on devrait refuser l'accès aux IPs, je mets la deuxième en dernier. Dodoïste[réveille-moi]20 septembre 2008 à 22:16 (CEST)[répondre]
3 > 2 > 1 ; en même temps je me pose une question de ressource du fait de l'accès au monobook, mais je ne connais pas bien le problème donc ce n'est pas à moi de me poser cette question. Progrès intéressant. Conserver quand même plus d'une journée les pages mises si elles ne sont plus référencées je pense. Astirmays (d) 21 septembre 2008 à 11:16 (CEST)[répondre]
3 effectivement le temps d'execution du script ne me semble pas rédhibitoire, et c'est un outil essentiellement utile au lecteur de Wikipedia pour leur permettre d'accéder au source des articles. C'est un travail qui s'inscrit donc pour la qualité de Wikipedia.Pmartin (d) 21 septembre 2008 à 13:35 (CEST)[répondre]
1 > 2 = 3 3>2=1 (changement de vote après discussion sur IRC), ce système s'avère bien d'après moi, mais je pense que ce système ne devrait être accessible qu'à ceux qui ont coché la case dans leurs préférences. --ELFIX (Discuter) 21 septembre 2008 à 19:53 (CEST)[répondre]
3 > 2 > 1 Le système est incroyablement intéressant du point de vue de la rédaction encyclopédique, il met en avant de manière pertinente le problème des sources et propose un moyen de palier plusieurs soucis réels. Il me parait indispensable que les visiteurs y aient accès, sinon ça sera complètement sous-exploité. Les considérations techniques (temps d'exécution, modèle ou pas, nom, etc.) sont tout à fait secondaires et gérables au fur et à mesure de l'utilisation de l'outil. nojhan→☸22 septembre 2008 à 11:57 (CEST)[répondre]
3 > 2 > 1 : il y a énormément plus de lecteurs que de contributeurs enregistrés, quand à ceux qui manipulent leur monobook ou vont dans la section gadget c'est une minorité. Si le système permet de retrouver des références et sources n'étant plus en ligne directement, qu'il serve au plus grand nombre. Guérin Nicolas23 septembre 2008 à 10:41 (CEST)[répondre]
3 > 2 > 1, mais je souligne que je ne place la solution 3 en tête que si cela passe par un modèle, et donc par un traitement côté serveur : hors de question de faire dépendre une fonctionnalité particulière de javascript. De plus, pour des raisons d'accessibilité, il faudra prévoir que les intitulés des liens soient différents (intitulé « cache » actuel + utilisation de l'attribut title, reprenant l'intitulé initial du lien caché + « (cache) » par exemple). Si cela n'est pas possible, mon choix serait complètement inversé (1 > 2 > 3) GillesC→m'écrire24 septembre 2008 à 10:17 (CEST)[répondre]
Il a été décidé en page de discussion que nous laisserions les détails de l'implémentation pour plus tard (ce que je comprends bien être problématique pour ton vote). Je t'invite à défendre ton point de vue en page de discussion et, éventuellement, de lancer un sondage ou un nouveau vote par la suite. — Jérôme24 septembre 2008 à 11:26 (CEST)[répondre]
J'ai l'impression que la proposition d'activation du script via la boîte à outils n'a pas été très remarquée. Aussi, et depuis peu, une option supplémentaire devient envisageable (en cumulant la gestion par bot, l'accès au cache via modèles, la boîte à outils et le gadget ), qui a de très nombreux avantages sur la proposition n°3. Je propose de prendre en compte ce premier vote comme le choix d'une utilisation soit restreinte soit large du cache.
Je propose donc qu'à la fin de ce vote, une seconde phase de discussion s'ouvre; dans laquelle nous discuteront des différentes options, des détails, des choix envisagés. Et de préparer une seconde prise de décision, cette fois décidant de la manière générale de gérer la correction des liens externes.Dodoïste[réveille-moi]24 septembre 2008 à 13:54 (CEST)[répondre]
3 > 2 > 1 : Système utile à tous et qui ne sera utilisé par les lecteurs que s'il est activé par défaut. Je préfèrerais un autres aspect des liens (+ discret), j'espère qu'elle sera décidée ensuite. --Ohkami [blabla]24 septembre 2008 à 10:55 (CEST)[répondre]
3 > 1 > 2 . Par contre il faudrait un truc bien plus discret : car là ca va exploser certains textes .... (même si j'aime pas les liens dans le texte, il en reste beaucoup). — DioTom[d-c]26 septembre 2008 à 14:33 (CEST)[répondre]
4 uniquement. Je définis 4 comme "pas de cache du tout". Raison : Le cabinet d'avocat de Linterweb défend les intérets de l'hébergeur du cache, qui peut se retrancher derrière la LCEN et la responsabilité limitée de l'hébergeur, donc il n'est pas a priori surprenant que ce cabinet ne voit pas de risque pour son client. Mais c'est le Wikipédien individuel qui introduit le lien externe qui risque fort d'être le lampiste qu'on punit en cas de problème de délit de presse ou de droit d'auteur. Voir sur Projet:Sources/Chez Manon/archive 7#Sourçage et site web qui ferme - demande de conseil un cas concrêt de site qui avait fermé et qu'il me paraissait imprudent de ressusciter. Teofilo◯29 septembre 2008 à 13:12 (CEST)[répondre]
3 > 2 > 1 - Il serait peut-être utile d'avoir un moyen de déconnecter le système pour une page donnée. Cela permettrait de régler des éventuels problèmes de temps d'exécution du script sur des pages contenant beaucoup de liens externes. ILJR (d) 1 octobre 2008 à 16:12 (CEST)[répondre]
En l'état actuel des choses, le script dispose d'une limite maximale en nombre de liens externes, au-delà de laquelle il refuse tout seul de s'exécuter. — Jérôme1 octobre 2008 à 17:48 (CEST)[répondre]
En l'état actuel des choses, c'est la partie qui récupère (et donc donne le nombre) de liens qui est la plus longue à exécuter. Cette limite ne résout pas tout sur ce probleme, loin de la. Maloqcauser4 octobre 2008 à 12:32 (CEST)[répondre]
1 > 2 > 3. Pourquoi faire confiance au système de cache d'un moteur de recherche quelconque, qui de toutes les façons sera de durée limitée? Ce qui n'est plus en ligne librement n'est plus validé par le site de référence concerné, point, y compris pour les liens nécessitant paiement. Et wikipédia n'a pas vocation à archiver le web par lui même. - Gonioul (d) 16 octobre 2008 à 00:49 (CEST)[répondre]
3 > 2 > 1 Si ça n'est pas la solution miracle contre les liens morts, elle fonctionne bel et bien et la lenteur d'éxécution ne me semble absolument pas rédhibitoire. Colindla19 octobre 2008 à 21:41 (CEST)[répondre]
La proposition n°3 est adoptée, sans surprises. Le résultat peut être vérifié via ce calculateur Condorcet.
15:3
14:3 > 2 > 1
8:1 > 2 > 3
1:2 > 1 > 3
3:3 > 2 = 1
3:3 > 1 > 2
1:3 > 1
1:4
1:1 > 2 , 3
1:1 = 2 > 3
1:1 > 3 > 2
1:1
1:2 > 3 > 1
Cela signifie que la communauté s'est prononcée pour une large utilisation du cache. Les détails de la mise en place, via un script ou via un modèle, l'apparence, ect. sont à discuter en page de discussion de cette PDD.
Ancien vote
ancien vote
La proposition retenue sera celle ayant obtenu le plus d'approbation et le moins d'objections.
== Proposition 1 ==
Le système n'est pas activé par défaut, les utilisateurs enregistrés peuvent cocher la case dans leurs préférences pour l'activer.
Si l'utilisateur n'a pas activé le gadget, un bouton dans la Boîte à Outils permet d'activer le script sur la page courante. Cela règle les problèmes d'accessibilités évoquées ci-dessous. Cela permet aussi un usage large du cache, et de ne l'activer que lorsque l'on en a besoin.
Le plus simple. Si possible, prévoir de masquer totalement le lien dans la boîte à outils (via un ajout dans le monobook css personnel).--Bapti✉16 septembre 2008 à 20:57 (CEST)[répondre]
Pour ceux qui n'ont pas suivi : il s'agit du temps d'exécution du script affichant les liens vers le cache. Dans un premier temps, Maloq a signalé qu'il trouvait le sript trop lourd, et il a été modifié en conséquence. Aujourd'hui Maloq vient de tester à nouveau le temps d'exécution et il constate que le temps reste inchangé : il faut donc retravailler cela. Voir la discussion. Dodoïste[réveille-moi]16 septembre 2008 à 00:26 (CEST)[répondre]
Tous les visiteurs voient apparaître les liens « cache », avec la possibilité pour les utilisateurs enregistrés de les enlever, via une case à cocher dans les préférences.
Cette dernière proposition permet de rendre les liens morts vérifiables pour tous, sans intervention manuelle. C'est l'option retenue par le Projet:Correction des liens externes.
Pour Cela est utile et nécessaire. Une remarque toute fois, sur la suppression du cache en cas de retrait momentané du lien sur WP : il suffirait donc qu'un POV pusheur supprime une ref, et quelques heures après, un contributeur de l'article restaure la ref => le cache est perdu => la ref n'est plus vérifiable => suppression de la ref => suppression du point sourcé. POV pusheur a gagné ? Lilyu (Répondre) 16 septembre 2008 à 12:34 (CEST)[répondre]
Je viens de préciser ci-dessus : il y a un délai d'attente réglable avant la supression. Actuellement il est d'un jour je crois, il suffit d'en discuter pour se mettre d'accord sur le délai à adopter Dodoïste[réveille-moi]16 septembre 2008 à 12:48 (CEST)[répondre]
Pour : cela fait plusieurs semaines que j'ai activé le script dans mon monobook.js, et n'ai constaté aucun changement notable (hormis, évidemment, le fait de pouvoir accéder à certains sites institutionnels népalais lorsqu'il sont inaccessibles – très souvent – en raison des déficiences du réseau télphonique dans ce pays encore peu favorisé). Je suis un inconditionnel de ce script. Évidemment, il faudra fournir à ceux des utilisateurs enregistrés qui ne souhaiteraient pas voir ces liens un moyen simple et commode de les désactiver, sans parler de la présence indispensable de classes pour permettre le réglage du rendu via la feuille de style personnelle. Hégésippe | ±Θ±17 septembre 2008 à 11:20 (CEST)[répondre]