![word-cloud-names-resized](https://lubartworld.cnrs.fr/wp-content/uploads/2021/03/word-cloud-names-resized.png)
Avril 2021
Un article en ligne par les membres de l’équipe Anton Perdoncin & Pierre Mercklé
Aidelman, Ajdelman, Edelman, Ejdelman ; Morgenstern, Morgensztern, Morgiensztern ; Raizl, Rachel, Ruchla, Rajzla, Rechla ; Leibush, Lejbus, Lejbusz : ces quatre listes de patronymes et de prénoms ont la même consonance, mais ne sont pas orthographiés de manière identique. Comment est-il possible de détecter automatiquement la correspondance phonétique entre les variantes orthographiques des mêmes noms ?
Anton Perdoncin & Pierre Mercklé proposent une fonction sur R pour convertir les noms en codes Soundex, selon les règles de Daitch-Mokotoff.
La fonction est disponible dans un nouveau paquet R datatools (en cours de développement) qui peut être téléchargé sur GitHub : https://github.com/pmerckle/datatools.
Lire l’article en ligne en anglais.