bos@16: \chapter{Introduction} bos@16: \label{chap:intro} bos@16: romain@923: \section{A propros de la gestion source} romain@923: romain@923: La gestion de source est un processus permettant de gérer différentes romain@923: version de la même information. Dans sa forme la plus simple, c'est romain@923: quelquechose que tout le monde fait manuellement : quand vous modifiez romain@923: un fichier, vous le sauvegarder sous un nouveau nom contenant un numéro, romain@923: à chaque fois plus grand la précédente version. romain@923: romain@923: Ce genre de gestion de version manuel est cependant sujette facilement romain@923: à des erreurs, ainsi, depuis longtemps, des logiciels existent pour romain@923: adresser cette problématique. Les premiers outils de gestion de source romain@923: étaient destinés à aider un seul utilisateur, à automatiser la gestion romain@923: des versions d'un seulf fichier. Dans les dernières décades, cette cilble romain@923: a largement était agrandie, ils gèrent désormais de multiple fichiers, et romain@923: aident un grand nombre de personnes à travailler ensemble. Le outils les romain@923: plus modernes n'ont aucune difficultés à gérer plusieurs milliers de romain@923: personnes travaillant ensemble sur des projets regroupant plusieurs romain@923: centaines de milliers de fichiers. romain@923: romain@923: \subsection{Pourquoi utiliser un gestionnaire de source ?} romain@923: romain@923: Il y a de nombreuse raisons pour que vous ou votre équipe souhaitiez romain@923: utiliser un outil automatisant la gestion de version pour votre projet. bos@217: \begin{itemize} romain@923: \item L'outil se chargera de suivre l'évolution de votre projet, sans romain@923: que vous ayez à le faire. Pour chaque modification, vous aurez à votre romain@923: disposition un journal indiquant \emph{qui} a faient quoi, \emph{pourquoi} romain@923: ils l'ont fait, \emph{quand} ils l'ont fait, et \emph{ce} qu'ils ont romain@923: modifiés. romain@923: \item Quand vous travaillez avec d'autres personnes, les logiciels de romain@923: gestion de source facilite le travail collaboratif. Par exemple, quand romain@923: plusieurs personnes font, plus ou moins simultannéement, des modifications romain@923: incompatibles, le logiciel vous aidera à identifier et résoudre les conflits. romain@924: \item L'outil vous aidera à réparer vos erreurs. Si vous effectuez un changement romain@924: qui se révèlera être une erreur, vous pourrez revenir fiablement à une version romain@924: antérieur d'une fichier ou même d'un ensemble de fichier. En fait, un outil de romain@924: gestion de source \emph{vraiment} efficace vous permettra d'identifier à quel romain@924: moment le problème est apparu (voir la section~\ref{sec:undo:bisect} pour plus romain@924: de détails). romain@924: \item L'outil vous permettra aussi de travailler sur plusieurs versions différentes romain@924: de votre projet et à gérer l'écart entre chaque. bos@217: \end{itemize} romain@924: La plupart de ces raisons ont autant d'importances---du moins en théorie--- que romain@924: vous travailliez sur un projet pour vous, ou avec une centaine d'autres romain@924: personnes. romain@924: romain@924: Une question fondamental à propos des outils de gestion de source, qu'il s'agisse romain@924: du projet d'une personne ou d'une grande équipe, est quelles sont ses romain@924: \emph{avantages} par rapport à ses \emph{coût}. Un outil qui est difficile à romain@924: utiliser ou à comprendre exigera un effort d'adoption. romain@924: romain@924: Un projet de cinq milles personnnes s'effondrera très certainement de lui même romain@924: sans aucun processus et outil de gestion de source. Dans ce cas, le coût romain@924: d'utilisation d'un logiciel de gestion de source est dérisoire, puisque romain@924: \emph{sans}, l'échec est presque garanti. romain@924: romain@924: D'un autre coté, un ``rapide hack'' d'une personnne peut sembler un contexte romain@924: bien pauvre pour utiliser un outil de gestion de source, car, bien évidement romain@924: le coût d'utilisation dépasse le coût total du projet. N'est ce pas ? romain@924: romain@924: Mercurial supporte ces \emph{deux} échelles de travail. Vous pouvez apprendre romain@924: les bases en juste quelques minutes, et, grâce à sa performance, vous pouvez romain@924: l'utiliser avec facilité sur le plus petit des projets. Cette simplicité romain@924: signifie que vous n'avez pas de concepts obscures ou de séquence de commandes romain@924: défiant l'imagination, complètement décorrelé de \emph{ce que vous êtes romain@924: vraiment entrain de faire}. En même temps, ces mêmes performances et sa romain@924: nature ``peer-to-peer'' vous permet d'augmenter, sans difficulté, son romain@924: utilisation à de très grand projet. romain@924: romain@924: Aucun outil de gestion de source ne peut sauver un projet mal mené, mais un romain@924: bon outil peut faire une grande différence dans la fluidité avec lequel romain@924: vous pourrez travailler avec. romain@924: romain@924: \subsection{Les multiples noms de la gestion de source} romain@924: romain@924: La gestion de source est un domaine divers, tellement qu'il n'existe pas romain@924: une seul nom ou acronyme pour le désigner. Voilà quelqu'uns des noms ou romain@924: acronymes que vous rencontrerez le plus souvent: bos@217: \begin{itemize} romain@924: \item \textit{Revision control (RCS)} ; romain@924: \item Software configuration management (SCM), ou \textit{configuration management} ; romain@924: \item \textit{Source code management} ; romain@924: \item \textit{Source code control}, ou \textit{source control} ; romain@924: \item \textit{Version control (VCS)}. bos@217: \end{itemize} romain@924: romain@924: \notebox { romain@924: Note du traducteur : J'ai conservé la liste des noms en anglais pour des raisons de commodité (ils sont plus ``googelable''). J'ai choisi de conserver le terme ``gestion de sources'' comme traduction unique dans l'ensemble du document. romain@924: romain@924: En outre, j'ai opté pour conserver l'ensemble des opérations de Mercurial (commit, push, pull,...) en anglais, là aussi pour faciliter la lecture d'autres documents en anglais, et romain@924: aussi son utilisation. romain@924: } romain@924: romain@924: Certains personnes prétendent que ces termes ont en fait des sens romain@924: différents mais en pratique ils se recouvrent tellement qu'il n'y a pas romain@924: réellement de manière pertinente de les distinguer. romain@924: romain@924: \section{Une courte histoire de la gestion de source} romain@924: romain@924: Le plus célèbre des anciens outils de gestion de source est \textit{SCCS (Source romain@924: Code Control System)}, que Marc Rochkind conçu dans les laboratoire de recherche de Bell romain@924: (\textit{Bell Labs}), dans le début des années 70. \textit{SCCS} ne fonctionner que sur des fichiers individuels, et demandait à personne travaillant sur le projet d'avoir un accès à un répertoire de travail commun, sur un unique système. romain@924: Seulement une personne pouvait modifier un fichier au même moment, ce fonctionnement était assuré par l'utilisation de verrou (``lock''). Il était courant que des personnes ne vérouille romain@924: des fichiers, et plus tard, oublie de le dévérouiller; empêchant n'importe qui d'autre de romain@924: travailler sur ces fichiers sans l'aide de l'administrateur... romain@924: romain@924: Walter Tichy a développé une alternative libre à \textit{SCCS} au début des années 80, qu'il romain@924: nomma \textit{RSC (Revison Control System)}. Comme \textit{SCCS}, \textit{RCS} romain@924: demander aux développeurs de travailler sur le même répertoire partagé, et de vérouiller les romain@924: fichiers pour se prémunir de tout conflit issue de modifications concurrentes. romain@924: romain@924: Un peu plus tard dans les années 1980, Dick Grune utilisa \textit{RCS} comme une brique de base pour un ensemble de scripts \textit{shell} qu'il intitula cmt, avant de la renommer en \textit{CVS (Concurrent Versions System)}. La grande innovation de CVS était que les développeurs pouvaient travailler simultanéement and indépendament dans leur propre espace de travail. Ces espaces de travail privés assuraient que les développeurs ne se marche mutuellement sur les pieds, comme c'était souvent le cas avec RCS et SCCS. Chaque développeur disposait donc de sa copie de tout les fichiers du projet, et ils pouvaient donc librement les modifier. Ils devaient néanmoins effectuer la ``fusion'' (\textit{``merge''}) de leur fichiers, avant d'effectuer le ``commit'' de leur modification sur le dépôt central. bos@218: romain@926: Brian Berliner repris les scripts de Grune's et les réécris en~C, qu'il publia en 1989. Depuis, ce code a été modifié jusqu'à devenir la version moderne de CVS. CVS a acquis ainsi la capacité de fonctionner en réseau, le transformant son architecture en client/serveur. L'architecture de CVS est centralisée, seul le serveur a une copie de l'historique du projet. L'espace de travail client ne contient qu'une copie de la dernière version du projet, et quelques métadonnées pour indiquer où le serveur se trouve. CVS a été un grand succès, aujourd'hui c'est probablement l'outil de gestion de contrôle le plus utilisé au monde. romain@926: romain@926: Au début des années 1990, Sun Microsystmes développa un premier outil de gestion de source distribué, nommé TeamWare. Un espace de travail TeamWare contient une copie complète de l'historique du projet. TeamWare n'a pas de notion de dépot central. (CVS utilisé RCS pour le stockage de l'historique, TeamWare utilisé SCCS). romain@926: romain@926: Alors que les années 1990 avancé, les utilisateurs ont pris conscience d'un certain nombre de problème avec CVS. Il enregistrait simultanéement des modifications sur différents fichier individuellement, au lieu de les regrouper dans une seule opération cohérente et atomique. Il ne gère pas bien sa hiérarchie de fichier, il est donc assez aisé de créer le chaos en renommant les fichiers et les répertoires. Pire encore, son code source est difficile à lire et à maintenir, ce qui agrandit largement le ``niveau de souffrance'' associé à la réparation de ces problèmes d'architecture de manière prohibitive. romain@926: romain@926: romain@926: En 2001, Jim Blandy et Karl Fogel, deux développeurs qui avaient travaillé sur CVS, initialisèrent un projet pour le remplacer par un outil qui aurait une meilleur architecture et un code plus propre. Le résultat, Subversion, ne quitte pas le modèle centralisé et client/server de CVS, mais ajoute les opérations de ``commit'' atomique sur de multiples fichier, une meilleur gestion des espaces de noms, et d'autres fonctionnalités qui en font un meilleur outil que CVS. Depuis sa première publication, il est rapidement devenu très populaire. romain@926: romain@926: Plus ou moins de manière simultanné, Graydon Hoare a commencé sur l'ambitieux système de gestion distribué Monotone. Bien que Monotone corrige plusieurs défaut de CVS's tout en offrant une architecture ``peer-to-peer'', il va aussi plus loin que la plupart des outils de révision de manière assez innovante. Il utilise des ``hash'' cryptographique comme identifiant, et il a notion complète de ``confiance'' du code issues de différentes sources. romain@926: romain@926: Mercurial est né en 2005. Bien que très influencé par Monotone, Mercurial se concentre sur la facilité d'utilisation, les performances et la capacité à monter en charge pour de très grand projets. romain@926: romain@926: \section{Tendances de la gestion de source} romain@926: romain@926: Il y a eu une tendance évidente dans le développement et l'utilisation d'outil de gestion de source depuis les quatre dernière décades, au fur et à mesure que les utilisateurs se sont habitués à leur outils et se sont sentis contraint par leur limitations. romain@926: romain@926: La première génération commença simplement par gérer un fichier unique sur un ordinateur individuel. Cependant, même si ces outils présentè-rent une grande avancée par rapport à la gestion manuel des versions, leur modèle de vérouillage et leur utilisation limité à un seul ordinateur rendaient leur utilisation possible uniquement dans une très petite équipe. romain@926: romain@926: La seconde génération a assoupli ces contraintes en adoptant une architecture réseau et centralisé, permettant de gérer plusieurs projets entiers en même temps. Alors que les projets grandirent en taille, ils rencontrèrent de nouveau problèmes. Avec les clients discutant régulièrement avec le serveurs, la monte en charge devint un réellement problème sur les gros projets. Une connexion réseau peu fiable pouvant empêcher simplement les utilisateurs distant de discuter avec le serveur. Alors que les projets \textit{Open Source} commencèrent à mettre en place des accès en lecture seule disponible anonymement, les utilisateurs sans les privilèges de ``commit'' réalisèrent qu'ils ne pouvaient pas utiliser les outils pour collaboraient naturellement avec le projet, comme ils ne pouvaient pas non plus enregistrer leurs modifications. romain@926: romain@926: La génération actuelle des outils de gestion de source est ``peer-to-peer'' par nature. Tout ces systèmes ont abandonné la dépendance à un serveur central, et ont permis à leur utilisateur de distribué les données de leur gestion de source à qui en a besoin. La collaboration à travers Internet a transformée la contrainte technologique à une simple question de choix et de consencus. Les outils moderne peuvent maintenant fonctionner en mode déconnecté sans limite et de manière autonome, la connexion au réseau n'étant nécessaire que pour synchroniser les modifications avec les autres dépots. romain@926: romain@926: \section{Quelques avantages des gestionnaire de source distribué} romain@926: romain@926: Même si les gestionnaire de source distribué sont depuis plusieurs années romain@926: assez robuste et aussi utilisable que leur prédécésseurs, les utilisateurs romain@926: d'autres outils n'ont pas encore étaient sensibilisé. Les gestionnaires romain@926: de sources distribué se distingue particulièrement de leurs équivalents romain@926: centralisé de nombreuse manière. romain@926: romain@926: Pour un développeur individuel, ils restent beaucoup plus rapide que les romain@926: outils centralisés. Cela pour une raison simple: un outil centralisé doit romain@926: toujours discuter à travers le réseau pour la plupart des opérations, car romain@926: presque toutes les métadonnées sont stockées sur la seule copie du serveur romain@926: central. Un outil distribué stocke toute ses métadonnées localement. À tâche romain@926: égale, effectuer un échange avec le réseau ajoute un délai aux outils romain@926: centralisés. Ne sous estimez pas la valeur d'un outil rapide: vous allez romain@926: passer beaucoup de temps à interagir avec un logiciel de gestion de sources. romain@926: romain@926: Les outils distribué sont complètement indépendant des aléas de votre serveur, romain@926: encore une fois car ils répliquent les métadonnées à tellement d'endoit. Si romain@926: votre serveur central prend feu, vous avez intérêt à ce que les média de romain@926: sauvegarde soient fiable, et que votre dernier ``backup'' soit récent et romain@926: fonctionne sans problème. Avec un outil distribué, vous avez autant de romain@926: ``backup'' que de contributeurs. romain@926: romain@926: En outre, la fiabilité de votre réseau affectera beaucoup moins les romain@926: outils distribué. Vous ne pouvez même pas utiliser un outil centralisé romain@926: sans connexion réseau, à l'exception de quelques commandes, très limités. romain@926: Avec un outil distribué, si vous connexion réseau tombe pendant que vous romain@926: travaillez, vous pouvez ne même pas vous en rendre compte. La seule chose romain@926: que vous ne serez pas capable de faire sera de communiquer avec des dépôts romain@926: distants, opération somme toute assez rare par comparaison aux opérations romain@926: locales. Si vous avez une (TODO:far-flung???) équipe de collaborateurs, romain@926: ceci peut être significatif. romain@926: romain@926: \subsection{Avantages pour les projets \textit{Open Source}} romain@926: romain@926: Si vous prenez goût à un projet \textit{Open Source} et que vous romain@926: décidez de commencer à toucher à son code, et que le projet utilise romain@926: un gestionnaire de source distribué, vous êtes immédiatement un "pair" romain@926: avec les personnes formant le ``coeur'' du projet. Si ils publient romain@926: leurs dépôts, vous pouvez immédiatement copier leurs historiques de romain@926: projet, faire des modifications, enregistrer votre travail en utilisant romain@926: les même outils qu'eux. Par comparaison, avec un outil centralisé, vous romain@926: devez utiliser un logiciel en mode ``lecture seule'' à moins que romain@926: quelqu'un ne vous donne les privilèges de ``commit'' sur le serveur romain@926: central. Avant ça, vous ne serez pas capable d'enregistrer vos romain@926: modifications, et vos propres modifications risqueront de se romain@926: corrompre chaque fois que vous essayerez de mettre à jour à votre romain@926: espace de travail avec le serveur central. romain@926: romain@926: \subsubsection{Le non-problème du \textit{fork}} romain@926: romain@926: Il a été souvent suggeré que les gestionnaires de source distribués romain@926: posent un risque pour les projets \textit{Open Source} car ils romain@926: facilitent grandement la création de ``fork''\footnote{NdT:Création romain@926: d'une version alternative du logiciel}. %%% TODO: Link to Wikipedia romain@926: Un ``fork'' apparait quand il y des divergences d'opinion ou d'attitude romain@926: au sein d'un groupe de développeurs qui aboutit à la décision de ne romain@926: plus travail ensemble. Chacun parti s'empare d'une copie plus ou moins romain@926: complète du code source du projet et continue dans sa propre direction. romain@926: romain@926: Parfois ces différents partis décide de se réconcilier. Avec un romain@926: serveur central, l'aspect \emph{technique} de cette réconciliation romain@926: est un processus douloureux, et essentiellement manuel. Vous devez romain@926: décider quelle modification est ``la gagnante'', et replacer, par un romain@926: moyen ou un autre, les modifications de l'autre équipe dans l'arboresence romain@926: du projet. Ceci implique généralement la perte d'une partie l'historique romain@926: d'un des partie, ou même des deux. romain@926: romain@926: Ce que les outils distribués permettent à ce sujet est probablement romain@926: la \emph{meilleur} façon de développer un projet. Chaque modification romain@926: que vous effectué est potentiellement un ``fork''. La grande force de romain@926: cette approche est que les gestionnaire de source distribué doit être romain@926: vraiment très efficase pour \emph{fusionner}\footnote{NdT:j'ai choisi de romain@926: traduire ici \textit{merging} par ``fusionner'' pour des raisons de clarté} romain@926: des ``forks'', car les ``forks'', dans ce contexte, arrivent tout le romain@926: temps. romain@926: romain@926: Si chaque altération que n'importe qui effectue, à tout moment, est vu romain@926: comme un ``fork'' à fusionner, alors ce que le monde de l'\textit{Open romain@926: Source} voit comme un ``fork'' devient \emph{uniquement} une problématique romain@926: social. En fait, les outils de gestion de source distribué \emph{réduisent} romain@926: les chances de ``fork'': bos@220: \begin{itemize} romain@926: \item Ils éliminent la distinction social qu'imposent les outils centralisés romain@926: entre les membres du projets (ce qui ont accès au ``comit'') et ceux de l' romain@926: extérieur (ce qui ne l'ont pas). romain@926: \item Ils rendent plus facile la réconciliation après un ``fork'' social, car romain@926: tout ce qu'elle implique est juste une simple fusion. bos@220: \end{itemize} bos@220: romain@926: Certaines personnes font de la résistance envers les gestionnaires de source romain@926: distribués parce qu'ils veulent garder un contrôle ferme de leur projet, et romain@926: ils pensent que les outils centralisés leur fournissent ce contrôle. Néanmoins, romain@926: si c'est votre cas, sachez que si vous publier votre dépôt CVS ou Subversion romain@926: de manière publique, il existe une quantité d'outils disponibles pour récupérer romain@926: entièrement votre projet et son historique (quoique lentement) et le récréer romain@926: ailleurs, sans votre contrôle. En fait, votre contrôle sur votre projet est romain@926: illusoire, vous ne faites qu'interdire à vos collaborateurs de travailler romain@926: de manière fluide, en disposant d'un miroir ou d'un ``fork'' de votre romain@926: historique. romain@926: %%%TODO: Fussy, those last sentences are not really well translated: romain@926: %However, if you're of this belief, and you publish your CVS or Subversion romain@926: %repositories publically, there are plenty of tools available that can pull romain@926: %out your entire project's history (albeit slowly) and recreate it somewhere romain@926: %that you don't control. So while your control in this case is illusory, you are romain@926: %forgoing the ability to fluidly collaborate with whatever people feel romain@926: %compelled to mirror and fork your history. romain@926: romain@926: \subsection{Avantages pour les projets commerciaux} romain@926: romain@926: Beaucoup de projets commerciaux sont réalisé par des équipes éparpillées romain@926: à travers le globe. Les contributeurs qui sont loin du serveur central romain@926: devront subir des commandes lentes et même parfois peu fiable. Les romain@926: solutions propriétaires gestion de source, tentent de palier ce problème romain@926: avec des réplications de site distant qui sont à la fois coûteuses à mettre romain@926: en place et lourdes à administrer. A un système distribué ne souffre pas romain@926: de ce genre de problèmes. En outre, il est très aisé de mettre en place romain@926: plusieurs serveurs de références, disont un par site, de manière à ce qu'il romain@926: n'y est pas de communication redondante entre les dépôts, sur une connexion romain@926: longue distance souvent onéreuse. romain@926: romain@926: Les systèmes de gestion de source supportent généralement assez mal la romain@926: monté en charge. Ce n'est pas rare pour un gestionnaire de source centralisé romain@926: pourtant onéreux de s'effondrer sous la charge combinée de juste une douzaine romain@926: d'utilisateurs concurrents. Une fois encore, la réponse à cette problématique romain@926: est généralement encore la mise en place d'un ensemble complexe de serveurs romain@926: synchronisé par un mécanisme de réplication. Dans le cas d'un gestionnaire romain@926: de source distribué, la charge du serveur central--- si vous avez un--- est romain@926: plusieurs fois inférieur (car toutes les données sont déjà répliqués ailleurs), romain@926: un simple server, pas très cher, peut gérer les besoins d'une plus grande romain@926: équipe, et la réplication pour balancer la charge devient simplement le romain@926: travail d'un simple script. romain@926: romain@926: Si vous avez des employés sur le terrain, entrain de chercher à résoudre sur romain@926: le site d'un client, ils bénéficieront aussi d'un gestionnaire de source romain@926: distribués. Cet outil leur permettra de générer des versions personnalisées, romain@926: d'essayer différentes solutions, en les isolant aisément les une des autres, romain@926: et de recherche efficasement à travers l'historique des sources, la cause romain@926: des bugs ou des régression, tout ceci sans avoir besoin de la moindre romain@926: connexion au réseau de votre compagnie. romain@926: romain@926: \section{Pourquoi choisir Mercurial?} romain@926: romain@926: Mercurial a plusieurs caractéristiques qui en font un choix particulièrement romain@926: pertinent pour la gestion de source: bos@221: \begin{itemize} romain@926: \item Il est facile à apprendre et à utiliser ;It is easy to learn and use. romain@926: \item il est léger et performant ; romain@926: \item il monte facilement en charge ; romain@926: \item il est facile à personnaliser ; bos@221: \end{itemize} bos@221: romain@926: Si vous êtes déjà familier d'un outil de gestion de source, vous serez romain@926: capable de l'utiliser en moins de 5 minutes. Sinon, ça ne sera pas beaucoup romain@926: plus long\footnote{NdT: Pour appuyer le propos de l'auteur, je signale que romain@926: j'utilise Mercurial comme outil d'initiation à la gestion de contrôle dans romain@926: des travaux pratique à l'ESME Sudria (\url{http://www.esme.fr}) et que les romain@926: élèves le prennent en main sans difficulté majeur malgré l'approche distribuée.}. romain@926: Les commandes utilisées par Mercurial, comme ses fonctionnalités, sont romain@926: généralement uniformes et cohérentes, et vous pouvez donc ainsi garder en tête romain@926: simplement quelques règles générales, plutôt qu'un lot complexe d'exceptions. romain@926: romain@926: Sur un petit projet, vous pouvez commencer à travailler avec Mercurial en romain@926: quelques instants. Ajouter des modifications ou des branches, transférer romain@926: ces modifications (localement ou via le réseau), et les opérations romain@926: d'historique ou de statut sont aussi très rapide. Mercurial reste hors de romain@926: votre chemin grâce à sa simplicité d'utilisation et sa rapidité d'exécution. romain@926: romain@926: L'utilité de Mercurial ne se limite pas à des petits projets: il est romain@926: aussi utilisé par des projets ayant des centaines ou même des milliers romain@926: de contributeurs, avec plusieurs dizaines de milliers de fichiers, et des romain@926: centaines de méga de code source. romain@926: romain@926: Voici une liste non exhaustive des projets complexe ou critique utilisant romain@926: mercurial : romain@926: %TODO romain@926: % For both spanish and english version, add the following examples: romain@926: \begin{itemize} romain@926: \item Firefox ; romain@926: \item OpenSolaris ; romain@926: \item OpenJDK (utilisant en outre l'extension ``forest'' pour gérer romain@926: ses sous modules); romain@926: \end{itemize} romain@926: % TODO: Also add appropriate link. romain@926: romain@926: Si les fonctionnalités coeur de Mercurial ne sont pas suffisantes pour vous, romain@926: il est très aisé de construire dessus. Mercurial est adapté à l'utilisation romain@926: au sein de script, et son implémentation interne en python, propre et claire, romain@926: rend encore plus facile l'ajout de fonctionnalité sous forme d'extension. Il romain@926: en existe déjà un certains nombres de très populaires et très utiles, romain@926: dont le périmètre va de la recherche de bugs à l'amélioration des performances. bos@221: bos@221: \section{Mercurial compared with other tools} bos@221: bos@221: Before you read on, please understand that this section necessarily bos@221: reflects my own experiences, interests, and (dare I say it) biases. I bos@221: have used every one of the revision control tools listed below, in bos@221: most cases for several years at a time. bos@221: bos@280: bos@221: \subsection{Subversion} bos@221: bos@221: Subversion is a popular revision control tool, developed to replace bos@221: CVS. It has a centralised client/server architecture. bos@221: bos@221: Subversion and Mercurial have similarly named commands for performing bos@280: the same operations, so if you're familiar with one, it is easy to bos@280: learn to use the other. Both tools are portable to all popular bos@221: operating systems. bos@221: bos@315: Prior to version 1.5, Subversion had no useful support for merges. bos@315: At the time of writing, its merge tracking capability is new, and known to be bos@315: \href{http://svnbook.red-bean.com/nightly/en/svn.branchmerge.advanced.html#svn.branchmerge.advanced.finalword}{complicated bos@315: and buggy}. bos@256: bos@221: Mercurial has a substantial performance advantage over Subversion on bos@221: every revision control operation I have benchmarked. I have measured bos@221: its advantage as ranging from a factor of two to a factor of six when bos@221: compared with Subversion~1.4.3's \emph{ra\_local} file store, which is simon@313: the fastest access method available. In more realistic deployments bos@221: involving a network-based store, Subversion will be at a substantially bos@256: larger disadvantage. Because many Subversion commands must talk to bos@256: the server and Subversion does not have useful replication facilities, bos@280: server capacity and network bandwidth become bottlenecks for modestly bos@280: large projects. bos@280: bos@280: Additionally, Subversion incurs substantial storage overhead to avoid bos@280: network transactions for a few common operations, such as finding bos@280: modified files (\texttt{status}) and displaying modifications against bos@280: the current revision (\texttt{diff}). As a result, a Subversion bos@280: working copy is often the same size as, or larger than, a Mercurial bos@280: repository and working directory, even though the Mercurial repository bos@280: contains a complete history of the project. bos@280: bos@280: Subversion is widely supported by third party tools. Mercurial bos@280: currently lags considerably in this area. This gap is closing, bos@280: however, and indeed some of Mercurial's GUI tools now outshine their bos@280: Subversion equivalents. Like Mercurial, Subversion has an excellent bos@280: user manual. bos@280: bos@280: Because Subversion doesn't store revision history on the client, it is bos@280: well suited to managing projects that deal with lots of large, opaque bos@280: binary files. If you check in fifty revisions to an incompressible bos@280: 10MB file, Subversion's client-side space usage stays constant The bos@280: space used by any distributed SCM will grow rapidly in proportion to bos@280: the number of revisions, because the differences between each revision bos@280: are large. bos@280: bos@280: In addition, it's often difficult or, more usually, impossible to bos@280: merge different versions of a binary file. Subversion's ability to bos@280: let a user lock a file, so that they temporarily have the exclusive bos@280: right to commit changes to it, can be a significant advantage to a bos@280: project where binary files are widely used. bos@280: bos@280: Mercurial can import revision history from a Subversion repository. bos@280: It can also export revision history to a Subversion repository. This bos@280: makes it easy to ``test the waters'' and use Mercurial and Subversion bos@280: in parallel before deciding to switch. History conversion is bos@280: incremental, so you can perform an initial conversion, then small bos@280: additional conversions afterwards to bring in new changes. bos@280: bos@221: bos@221: \subsection{Git} bos@221: bos@221: Git is a distributed revision control tool that was developed for bos@221: managing the Linux kernel source tree. Like Mercurial, its early bos@221: design was somewhat influenced by Monotone. bos@221: bos@280: Git has a very large command set, with version~1.5.0 providing~139 bos@280: individual commands. It has something of a reputation for being bos@280: difficult to learn. Compared to Git, Mercurial has a strong focus on bos@280: simplicity. bos@280: bos@280: In terms of performance, Git is extremely fast. In several cases, it bos@280: is faster than Mercurial, at least on Linux, while Mercurial performs bos@280: better on other operations. However, on Windows, the performance and bos@280: general level of support that Git provides is, at the time of writing, bos@280: far behind that of Mercurial. bos@221: bos@221: While a Mercurial repository needs no maintenance, a Git repository bos@221: requires frequent manual ``repacks'' of its metadata. Without these, bos@221: performance degrades, while space usage grows rapidly. A server that bos@221: contains many Git repositories that are not rigorously and frequently bos@221: repacked will become heavily disk-bound during backups, and there have bos@221: been instances of daily backups taking far longer than~24 hours as a bos@221: result. A freshly packed Git repository is slightly smaller than a bos@221: Mercurial repository, but an unpacked repository is several orders of bos@221: magnitude larger. bos@221: bos@221: The core of Git is written in C. Many Git commands are implemented as bos@221: shell or Perl scripts, and the quality of these scripts varies widely. bos@280: I have encountered several instances where scripts charged along bos@221: blindly in the presence of errors that should have been fatal. bos@221: bos@280: Mercurial can import revision history from a Git repository. bos@280: bos@280: bos@221: \subsection{CVS} bos@221: bos@221: CVS is probably the most widely used revision control tool in the bos@280: world. Due to its age and internal untidiness, it has been only bos@280: lightly maintained for many years. bos@221: bos@221: It has a centralised client/server architecture. It does not group bos@221: related file changes into atomic commits, making it easy for people to bos@256: ``break the build'': one person can successfully commit part of a bos@256: change and then be blocked by the need for a merge, causing other bos@256: people to see only a portion of the work they intended to do. This bos@256: also affects how you work with project history. If you want to see bos@256: all of the modifications someone made as part of a task, you will need bos@256: to manually inspect the descriptions and timestamps of the changes bos@256: made to each file involved (if you even know what those files were). bos@256: bos@256: CVS has a muddled notion of tags and branches that I will not attempt bos@256: to even describe. It does not support renaming of files or bos@256: directories well, making it easy to corrupt a repository. It has bos@256: almost no internal consistency checking capabilities, so it is usually bos@256: not even possible to tell whether or how a repository is corrupt. I bos@256: would not recommend CVS for any project, existing or new. bos@221: bos@221: Mercurial can import CVS revision history. However, there are a few bos@221: caveats that apply; these are true of every other revision control bos@221: tool's CVS importer, too. Due to CVS's lack of atomic changes and bos@221: unversioned filesystem hierarchy, it is not possible to reconstruct bos@221: CVS history completely accurately; some guesswork is involved, and bos@221: renames will usually not show up. Because a lot of advanced CVS bos@221: administration has to be done by hand and is hence error-prone, it's bos@221: common for CVS importers to run into multiple problems with corrupted bos@221: repositories (completely bogus revision timestamps and files that have bos@221: remained locked for over a decade are just two of the less interesting bos@221: problems I can recall from personal experience). bos@221: bos@280: Mercurial can import revision history from a CVS repository. bos@280: bos@280: bos@221: \subsection{Commercial tools} bos@221: bos@221: Perforce has a centralised client/server architecture, with no bos@221: client-side caching of any data. Unlike modern revision control bos@221: tools, Perforce requires that a user run a command to inform the bos@221: server about every file they intend to edit. bos@221: bos@221: The performance of Perforce is quite good for small teams, but it bos@221: falls off rapidly as the number of users grows beyond a few dozen. bos@221: Modestly large Perforce installations require the deployment of bos@221: proxies to cope with the load their users generate. bos@16: bos@280: bos@280: \subsection{Choosing a revision control tool} bos@280: bos@280: With the exception of CVS, all of the tools listed above have unique bos@280: strengths that suit them to particular styles of work. There is no bos@280: single revision control tool that is best in all situations. bos@280: bos@280: As an example, Subversion is a good choice for working with frequently bos@280: edited binary files, due to its centralised nature and support for bos@318: file locking. bos@280: bos@280: I personally find Mercurial's properties of simplicity, performance, bos@280: and good merge support to be a compelling combination that has served bos@280: me well for several years. bos@280: bos@280: bos@280: \section{Switching from another tool to Mercurial} bos@280: bos@280: Mercurial is bundled with an extension named \hgext{convert}, which bos@280: can incrementally import revision history from several other revision bos@280: control tools. By ``incremental'', I mean that you can convert all of bos@280: a project's history to date in one go, then rerun the conversion later bos@280: to obtain new changes that happened after the initial conversion. bos@280: bos@280: The revision control tools supported by \hgext{convert} are as bos@280: follows: bos@280: \begin{itemize} bos@280: \item Subversion bos@280: \item CVS bos@280: \item Git bos@280: \item Darcs bos@280: \end{itemize} bos@280: bos@280: In addition, \hgext{convert} can export changes from Mercurial to bos@280: Subversion. This makes it possible to try Subversion and Mercurial in bos@280: parallel before committing to a switchover, without risking the loss bos@280: of any work. bos@280: bos@280: The \hgxcmd{conver}{convert} command is easy to use. Simply point it bos@280: at the path or URL of the source repository, optionally give it the bos@280: name of the destination repository, and it will start working. After bos@280: the initial conversion, just run the same command again to import new bos@280: changes. bos@280: bos@280: bos@16: %%% Local Variables: bos@16: %%% mode: latex bos@16: %%% TeX-master: "00book" bos@16: %%% End: