Les bases de données généalogiques. Des outils décisifs pour l’histoire des trajectoires migratoires transnationales

Depuis une vingtaine d’années, les recherches généalogiques ont connu un nouvel essor avec l’apparition de sites internet donnant accès à une grande quantité de documents d’archives en ligne. Ces sites proposent de gigantesques bases de données à l’usage des généalogistes. Or, ces dernières se révèlent particulièrement utiles dans le cadre de recherches historiques visant à reconstruire des parcours migratoires individuels et familiaux. En effet, parce qu’elles permettent de rapprocher des sources de nature différente à travers le monde en prenant comme fil conducteur des itinéraires biographiques, ces bases de données constituent un outil décisif pour la reconstitution de trajectoires transnationales. Elles permettent ainsi de dépasser le « nationalisme méthodologique » dénoncé par de nombreux auteurs qui remettent en question la pertinence des frontières de l’État-nation comme unité privilégiée d’analyse [1]Sur le nationalisme méthodologique, voir notamment Andreas Wimmer & Nina Glick Schiller, … Continue reading. Invitant à un décloisonnement du regard et donc des sources, l’histoire transnationale cherche à rendre visible les connexions et les circulations au-delà des frontières étatiques, l’historien devenant, pour reprendre la métaphore de Serge Gruzinski, un électricien qui réparerait les fils coupés par les histoires nationales [2]Serge Gruzinski, Les quatre parties du monde. Histoire d’une mondialisation, Paris, La … Continue reading. Dans cette perspective, l’usage de ces bases de données généalogiques est déterminant puisqu’elles ne se limitent pas à des entrées « nationales », comme la plupart des centres d’archives, mais rassemblent des documents provenant de pays différents.


Une grande diversité de sites pour un même objectif : faire l’histoire de sa famille

Il existe aujourd’hui de très nombreux sites de généalogie, parmi lesquels on peut citer les français Geneanet et Filae, l’israélien MyHeritage ou les américains Ancestry, FamilySearch et JewishGen. La liste n’est pas exhaustive mais donne une idée de la diversité de l’offre proposée. Certains sites sont gratuits, comme FamilySearch ou JewishGen tandis que d’autres requièrent un abonnement payant pour bénéficier pleinement de leurs fonctionnalités, tels Geneanet, Filae, MyHeritage ou encore Ancestry. S’ils reposent tous sur le même objectif de recherche généalogique, et offrent pour cela l’accès à des documents d’archives numérisés et indexés, ils diffèrent cependant dans la manière de constituer leurs fonds : certains misent en grande partie sur l’aspect collaboratif à travers les contributions de leurs membres, tandis que d’autres mettent l’accent sur les partenariats avec des centres d’archives publiques et privées. Il reste que tous associent, à des degrés divers, les deux modes de collecte de documents. Enfin, en dépit des critiques et des débats à ce sujet, certains de ces sites de généalogie connaissent un grand succès en proposant un service de recherche généalogique à partir d’analyses ADN [3]À titre d’exemple, en 2019, MyHeritage a réalisé 70 millions de dollars de chiffre … Continue reading. C’est le cas notamment d’Ancestry, de MyHeritage ou de Geneanet qui propose depuis février 2020 un service de « dépôt de fichiers ADN » sur son site [4]La pratique de « génétique récréative » est illégale en France, mais il est cependant … Continue reading.

 

Prenons l’exemple de Geneanet, base de données collaborative principalement alimentée par ses membres et qui concerne majoritairement la France. Le site est lancé en 1996 sous le nom de LPF, Liste des Patronymes de France. Il vise alors le partage d’arbres généalogiques et doit permettre de comparer et croiser des centaines de milliers de données pour mutualiser les recherches entre généalogistes amateurs. En 2006, le site enregistre plus de 300 000 visiteurs uniques et atteint le million en 2011. En 2019, il revendique quatre millions de visiteurs par mois et plus de six milliards d’individus répertoriés dans des arbres généalogiques, des actes numérisés, des cartes postales, des photos de famille ou des dépouillements d’état civil [5]Ce chiffre est à relativiser en raison des nombreux doublons. Il n’y a pas six milliards … Continue reading. Grâce à l’indexation des documents, la recherche se fait par mot-clé, par nom de famille ou localisation géographique.

Capture d’écran de Geneanet © droits réservés

Lancé la même année que Geneanet, Ancestry est à l’origine un projet de la communauté mormone aux États-Unis. Le site a progressivement conclu des accords avec des archives nationales et locales à travers le monde pour numériser et mettre en ligne une partie de leurs fonds. Il collabore notamment avec les Archives nationales des États-Unis ou encore du Royaume-Uni, mais aussi avec des associations locales. En 2008, par exemple, Ancestry a conclu un partenariat avec le Centre généalogique et héraldique de la Marne pour mettre en ligne l’index des relevés effectués par ses membres à partir de registres d’état civil conservés dans les archives départementales.

Capture d’écran du formulaire de recherche d’Ancestry © droits réservés

En novembre 2018, Ancestry revendique plus de 3 millions d’abonnés, 24 milliards de documents en ligne provenant de 80 pays différents et un chiffre d’affaire annuel d’un milliard de dollars. Comme sur les autres sites, les documents mis en ligne sont ceux mobilisés par les généalogistes, c’est-à-dire principalement des sources nominatives d’état civil, militaires ou d’immigration, qu’il s’agisse de listes de passagers de bateaux, de demandes de passeports, de dossiers de naturalisation, de recensements, de certificats de naissance, décès ou mariage, de registres de cimetières, d’annuaires professionnels ou de cartes de conscription des deux guerres mondiales.

Grâce à l’indexation de tous ces documents disséminés à travers le monde, la recherche par mot-clé permet de trouver des individus par nom de famille, prénom ou localisation géographique. Ancestry a l’avantage de proposer davantage de critères de recherche que ses concurrents et partenaires. En effet, il est possible de faire des recherches sans nom de famille par mot-clé libre : métier, nom de rue, nom de bateau, nationalité, identification « ethnique », religion, etc. Le site propose également de faire des recherches par « événement », qu’il s’agisse de naissance, mariage, décès, arrivée ou départ dans un port ou une ville. Il dispose également d’une fonctionnalité relativement efficace, proposant spontanément des individus ayant un lien de parenté avec la personne recherchée. Les résultats sont alors proposés sous deux formes : une simple liste des entrées ou un classement par catégorie, différenciant les documents d’état civil, des recensements, des documents liés à l’immigration et aux voyages ou encore des archives militaires. Enfin, ces résultats peuvent être filtrés par période et localisation géographique.

Capture d’écran d’une page de résultats d’Ancestry © droits réservés
Capture d’écran d’une page de JewishGen © droits réservés

Certains sites sont plus spécialisés, tel JewishGen, organisation à but non-lucratif fondée en 1987 et affiliée depuis 2003 au Museum of Jewish Heritage de New York. À sa création, le site se veut être une ressource internationale pour la généalogie juive. C’est d’abord une liste de diffusion par courriel et un forum en ligne avant de devenir un véritable site internet en 1995. En 2008, JewishGen conclut un partenariat avec Ancestry, lui permettant d’améliorer ses performances techniques et lui fournissant un revenu stable. En retour, Ancestry offre à ses abonnés un accès aux ressources généalogiques collectées par JewishGen qui reste, pour sa part, un outil gratuit. Le site fonctionne principalement grâce au bénévolat et rassemble plusieurs millions de documents provenant de plus de 850 fonds à travers le monde concernant spécifiquement des familles juives. Il est constitué de plusieurs bases de données séparées (à titre d’exemple, on peut citer The JewishGen Family Finder, The JewishGen Online Worldwide Burial Registry ou encore The JewishGen Holocaust Database) mais offre la possibilité d’effectuer une requête dans l’ensemble de ces ressources. Il est également possible de limiter sa recherche à un pays spécifique.


Limites et biais de ces outils

Tous ces sites proposent une offre extrêmement riche, dans laquelle le généalogiste, amateur comme confirmé, peut rapidement se retrouver submergé. Il faut tout d’abord noter que plusieurs ont conclu des accords entre eux et proposent donc une offre parfois redondante. Ainsi, Ancestry et FamilySearch ont annoncé leur partenariat en 2013 pour numériser et indexer plus d’un milliard de documents provenant du monde entier. Ces documents continuent d’être disponibles gratuitement sur FamilySearch mais sont également accessibles via l’abonnement d’Ancestry qui élargit ainsi son offre. La même année, MyHeritage permet à FamilySearch de bénéficier de ses avancées technologiques et augmente du même coup ses collections. En 2014, MyHeritage conclut un partenariat avec BillionGraves pour numériser et documenter les tombes et cimetières du monde entier. Ces quelques exemples soulignent la difficulté à circonscrire des fonds bien identifiés en fonction de leur provenance, comme un chercheur est habitué à le faire lorsqu’il fréquente des lieux d’archives physiques. Il importe alors d’accorder une importance accrue à la mention de la source du document que l’on trouve par le biais de ces sites.

Capture d’écran d’une page FamilySearch renvoyant sur le site de BillionGraves © droits réservés
 

Car en dépit de tous les avantages que ces outils présentent, ils comportent de nombreuses limites qu’il faut garder à l’esprit. Tout d’abord, ils sont conçus pour faire l’histoire de sa famille et sont donc orientés uniquement vers un certain type de sources traditionnellement utilisées par les généalogistes. Il serait donc erroné de penser que l’ensemble de ces bases de données se suffisent à elles-mêmes : elles offrent, comme toute source, une vision partielle de la réalité, liée ici à un prisme généalogique.

De plus, autre piège à éviter, la quantité de documents numérisés peut donner l’illusion d’une exhaustivité qui est loin d’être réelle. Certains documents sont mal indexés et donc « introuvables » par la recherche par mot-clé ; certains fonds ne sont pas numérisés dans leur totalité – et il est d’ailleurs difficile de savoir quelle est la logique de sélection des « lots » mis en ligne. Enfin, même s’ils prétendent offrir un panorama mondial, la plupart des sites restent centrés sur des zones géographiques spécifiques. Ancestry, par exemple, propose des documents provenant de plus de 80 pays différents mais les numérisations concernent principalement les États-Unis et certaines régions du monde demeurent de véritables angles morts, en particulier l’Asie et l’Afrique. Les logiques de numérisation restent guidées par des impératifs économiques, en témoignent les partenariats croissants avec des archives d’Amérique latine pour attirer la clientèle hispanique aux États-Unis.


Démarche et perspectives de recherche

Liste de passagers avec le nom d’Elka Peretz © Ancestry.com. New York, Passenger and Crew Lists (including Castle Garden and Ellis Island), 1820-1957 [database on-line]. Provo, UT, USA: Ancestry.com Operations, Inc., 2011

Ces sites offrent, malgré leurs biais, des ressources inestimables pour les généalogistes, mais aussi pour les historiens. Dans le cadre du projet Lubartworld, qui vise à reconstituer les parcours à travers le monde de familles originaires d’une même ville, il est ainsi possible de faire des recherches avec le mot-clé « Lubartów » et d’accéder à des documents extrêmement divers, tant par leur nature que par leur origine géographique. Prenons l’exemple d’Elka Peretz : elle apparaît dans les bases de données rassemblant les listes de passagers à destination de New York, les recensements des États-Unis, les dossiers de naturalisation américains et les fichiers de sécurité sociale américaine. En recoupant ces documents, on apprend ainsi qu’elle est née le 16 mai 1904 à Lubartów et qu’elle est arrivée le 29 août 1934 à New York en provenance du port de Gdynia sur la mer Baltique. Sa demande de naturalisation indique qu’elle est naturalisée américaine en 1937. Le recensement fédéral américain de 1940 révèle qu’elle vit alors dans un quartier du Bronx à New York.

 

Il est ensuite possible d’approfondir cette première recherche en s’appuyant sur les indices donnés par les documents collectés. Son dossier de naturalisation mentionne par exemple qu’elle a épousé Julius Peretz à Lubartów le 7 novembre 1933. Une recherche par nom de famille permet de le retrouver : né en 1894 à Lubartów, il arrive aux États-Unis en 1921 où il est naturalisé en 1927. Certains documents n’apparaissent en effet pas à travers la recherche avec le mot-clé « Lubartów ». Plusieurs raisons expliquent cela : soit une mauvaise orthographe du nom que les algorithmes de « soundex » ne parviennent pas à rapprocher par consonance [6]Un « soundex » est un algorithme phonétique d’indexation de noms par leur prononciation. Les … Continue reading ; soit une mauvaise indexation ou une absence d’indexation concernant le lieu de naissance ; soit l’absence de l’information dans le document original.

Formulaire de demande de naturalisation d’Elka Peretz © Ancestry.com. New York, U.S., State and Federal Naturalization Records, 1794-1943 [database on-line]. Provo, UT, USA: Ancestry.com Operations, Inc., 2013

En multipliant les recherches sur plusieurs bases de données et à l’aide des informations supplémentaires progressivement récoltées, le parcours de la famille Peretz entre Pologne et États-Unis apparaît en pointillé. Les ressources offertes par les sites de généalogie ne suffisent en effet pas à reconstituer pleinement les itinéraires familiaux mais elles constituent le point de départ le plus facile, grâce à l’indexation des documents et à la recherche par mot-clé, pour poursuivre ensuite ses investigations dans les centres d’archives nationales ou locales. La plupart des pays conservent par exemple les dossiers de naturalisation ou ceux liés à l’immigration. Certaines associations ou organisations sont également à l’origine d’importants fonds archivistiques, par exemple l’Organisation internationale pour les Réfugiés dont les dossiers sont conservés aux Archives nationales à Pierrefitte ou les archives de l’International Tracing Service (ITS) rassemblées à Bad Arolsen en Allemagne. Enfin les archives locales constituent une mine d’informations non-négligeable. Dans le cas des habitants originaires de Lubartów, il est ainsi possible de croiser les informations rassemblées grâce aux bases de données généalogiques avec celles contenues dans le registre de population réalisé en 1932 par la municipalité.

 


Pour conclure

Les possibilités offertes par les bases de données généalogiques sont vertigineuses mais, parce qu’il s’agit d’un outil conçu dans un but bien spécifique qui n’est pas nécessairement celui de la recherche historique, il importe de garder à l’esprit ses limites. Les informations qui en sont issues gagnent ainsi à être éclairées par d’autres sources : archives locales, nationales ou encore privées. Et c’est à travers leur croisement que l’on peut espérer restituer les fragments d’itinéraires familiaux dans toute leur complexité. Au-delà de la reconstitution des trajectoires migratoires partant de Lubartów et se déployant à travers le monde entier, l’utilisation de ces bases de données permet de déceler les logiques de mobilité des individus et des familles en étudiant leurs rythmes et leurs temporalités à toutes les échelles spatiales et temporelles, ainsi qu’en analysant l’élaboration et le fonctionnement des réseaux sociaux et économiques de la migration à travers la circulation d’informations, d’argent mais aussi d’individus qui agissent en éclaireurs et constituent par la suite des points d’appui dans la migration.

[+]