Une fonction Soundex de Daitch-Mokotoff pour R

Avril 2021

Un article en ligne par les membres de l’équipe Anton Perdoncin & Pierre Mercklé

 

Aidelman, Ajdelman, Edelman, Ejdelman ; Morgenstern, Morgensztern, Morgiensztern ; Raizl, Rachel, Ruchla, Rajzla, Rechla ; Leibush, Lejbus, Lejbusz : ces quatre listes de patronymes et de prénoms ont la même consonance, mais ne sont pas orthographiés de manière identique. Comment est-il possible de détecter automatiquement la correspondance phonétique entre les variantes orthographiques des mêmes noms ?

Anton Perdoncin & Pierre Mercklé proposent une fonction sur R pour convertir les noms en codes Soundex, selon les règles de Daitch-Mokotoff.

La fonction est disponible dans un nouveau paquet R datatools (en cours de développement) qui peut être téléchargé sur GitHub : https://github.com/pmerckle/datatools.

Lire l’article en ligne en anglais.