Regex extraction d'un libellé importé
Publié : 26 novembre 2017, 16:02
Autre sujet:
Je récupère certaines opérations depuis les affichages dans mes divers comptes sur internet, certains n'ayant pas le statut de relevés pouvant être traités directement par iCompta.
Je récupère les informations dans un fichier csv que j'importe, mais le libellé(=nom pour icompta) est à la fois encombré et riche d'éléments que je souhaite soit éliminer, soit re-distribuer sur d'autres champs. Je bute actuellement sur la regex (ou les regex) qui me permettraient de traiter cette question.
En particulierJe souhaite rationaliser les noms, en en éliminant tout ce qui est variable, afin de pouvoir catégoriser les écritures correspondantes.En effet iCompta ne reconnaît les catégories que si les noms sont absolument identiques.
Je joins deux copies d'écran d'une "même" regex (la différence est entourée de rouge).
Dans le premier cas, seules les écritures comportant un montant "informatif" ( parfois le montant est répété dans le libellé ou est donné dans la monnaie de la transaction s'il s'agit d'opérations à l'étranger) sont traitées et de façon satisfaisante.
Dans le deuxième cas toutes les écritures sont traitées mais les montants ne sont pas exclus, donc les noms ne sont pas uniformisés.
Quelle devrait être ma regex ?
Détail du cas 1 où les valeurs de montant "parasites" sont bien identifiées
ps: j'utilise pour tester l'outil disponible sur https://regex101.com/
question: iCompta utilise quoi pour les regex ? PCRE, javascript, python ?
Je récupère certaines opérations depuis les affichages dans mes divers comptes sur internet, certains n'ayant pas le statut de relevés pouvant être traités directement par iCompta.
Je récupère les informations dans un fichier csv que j'importe, mais le libellé(=nom pour icompta) est à la fois encombré et riche d'éléments que je souhaite soit éliminer, soit re-distribuer sur d'autres champs. Je bute actuellement sur la regex (ou les regex) qui me permettraient de traiter cette question.
En particulierJe souhaite rationaliser les noms, en en éliminant tout ce qui est variable, afin de pouvoir catégoriser les écritures correspondantes.En effet iCompta ne reconnaît les catégories que si les noms sont absolument identiques.
Je joins deux copies d'écran d'une "même" regex (la différence est entourée de rouge).
Dans le premier cas, seules les écritures comportant un montant "informatif" ( parfois le montant est répété dans le libellé ou est donné dans la monnaie de la transaction s'il s'agit d'opérations à l'étranger) sont traitées et de façon satisfaisante.
Dans le deuxième cas toutes les écritures sont traitées mais les montants ne sont pas exclus, donc les noms ne sont pas uniformisés.
Quelle devrait être ma regex ?
Détail du cas 1 où les valeurs de montant "parasites" sont bien identifiées
ps: j'utilise pour tester l'outil disponible sur https://regex101.com/
question: iCompta utilise quoi pour les regex ? PCRE, javascript, python ?