Supprimer les doublons en ignorant majuscules et minuscules
Mis à jour : mai 2026
Les doublons ne sont pas toujours strictement identiques. Paris, PARIS et paris peuvent représenter la même valeur. Le mode sans casse permet de supprimer ces variantes sans modifier inutilement la ligne conservée.
Activez “Ignorer la casse” pour fusionner les variantes en majuscules et minuscules.
Dédupliquer sans casseCe que fait le mode sans casse
Quand l’option “Ignorer la casse” est activée, Flowfiles transforme une copie interne de chaque ligne en minuscules avant comparaison. Cette normalisation sert seulement à décider si une ligne est un doublon. La ligne conservée garde sa casse d’origine, ce qui évite de transformer votre sortie en texte entièrement minuscule.
Quand l’utiliser
- Emails : les variantes de casse ne doivent généralement pas créer plusieurs contacts.
- Domaines :
Example.cometexample.comdésignent le même domaine. - Mots clés SEO :
Audit SEOetaudit seociblent la même intention. - Tags CMS : les contributeurs créent souvent des variantes comme “Produit”, “produit” et “PRODUIT”.
- Villes, pays et noms de catégories issus de formulaires libres.
Dans ces contextes, la casse vient souvent d’une saisie humaine ou d’un export mal harmonisé. L’ignorer améliore la qualité de la liste sans demander de correction manuelle.
Quand ne pas l’utiliser
La casse peut avoir une signification technique. Sur certains systèmes, un chemin Linux comme /Data/File.txt n’est pas équivalent à /data/file.txt. Dans du code, des variables peuvent différer uniquement par majuscule. Dans des mots de passe ou tokens, la casse est évidemment essentielle.
Si vous nettoyez des données techniques, gardez le mode sensible à la casse par défaut et activez seulement “Supprimer espaces en début/fin”. Pour des données marketing ou éditoriales, le mode sans casse est souvent le bon choix.
Première ou dernière occurrence
Le choix de l’occurrence détermine quelle version visuelle survit. En gardant la première, vous conservez l’ordre historique de la liste. En gardant la dernière, vous pouvez privilégier une version plus récente et parfois mieux capitalisée. C’est utile après fusion de plusieurs exports, par exemple un ancien fichier en majuscules suivi d’un export CRM plus propre.
Pour les listes françaises, cette option aide aussi à harmoniser les noms propres et les libellés saisis à la main. Une base peut contenir Île-de-France, île-de-france et ÎLE-DE-FRANCE selon la source. Le mode sans casse évite de compter trois entrées, tandis que le choix première ou dernière occurrence vous laisse décider quelle écriture reste visible dans la liste finale.
Questions fréquentes
Le mode sans casse met-il tout en minuscules ?
Non. La conversion en minuscules sert uniquement à comparer. La sortie conserve la forme de l’occurrence gardée.
Faut-il combiner avec la suppression des espaces ?
Oui, souvent. Les espaces invisibles et les variantes de casse apparaissent fréquemment ensemble dans les exports.
Les accents sont-ils supportés ?
Oui, JavaScript gère les minuscules des caractères latins accentués courants.