Page 3 sur 6

Re: Export GEDCOM au format UTF8

MessagePosté: Jeu 27 Oct 2016 07:24
de ddalbiez
Jean Costet a écrit:Bonjour,
Compte-tenu des récentes interventions je crois utile de préciser un point sur ma manière de procéder.
Avant d'ouvrir le gedcom avec le bloc-note de windows j'opère deux modifications du fichier à la main.
Tout d'abord j'écris CHAR UTF-8 au lieu de Char ANSI dans le texte et ensuite je modifie l'extension du fichier de .ged en .txt (je ne suis pas certain que ce soit indispensable).
Après l'enregistrement de la codification en UTF-8 je rétablis bien sûr l'extension .ged.
Jean Costet

Merci, Jean, de cette clarification.

Re: Export GEDCOM au format UTF8

MessagePosté: Jeu 27 Oct 2016 09:12
de jlturbe
Comme Jean Costet, je procède de la même manière.
Je créé mon gedcom en ANSI
Ensuite j'utilise le logiciel notepad ++ au lieu du logiciel notepad de windows.
Ce logiciel permet en outre de pouvoir remplacer les tags que certains logiciels ne reconnaissent pas.
Pour en revenir au format UTF8
Je remplace "1 CHAR ANSI" par "1 CHAR UTF-8"
Je supprime aussi 10 lignes dans l’entête
3 ADDR 10, Chaussée Jules César
4 POST F-95527
4 CITY CERGY-PONTOISE
4 CTRY FRANCE
3 PHON (+33).1.34.39.12.12
3 _ADDR http://www.geneatique.com
2 FORM LINEAGE-LINKED
2 POST
2 CITY
1 _MAIL

et pour finir avec notepad ++
Menu édition /sélectionner tout (CTRL A)
Menu /Encodage /Convertir en UTF-8 sans BOM

Re: Export GEDCOM au format UTF8

MessagePosté: Jeu 27 Oct 2016 11:29
de ddalbiez
jlturbe a écrit:Comme Jean Costet, je procède de la même manière.
Je créé mon gedcom en ANSI
Ensuite j'utilise le logiciel notepad ++ au lieu du logiciel notepad de windows.
Ce logiciel permet en outre de pouvoir remplacer les tags que certains logiciels ne reconnaissent pas.
Pour en revenir au format UTF8
Je remplace "1 CHAR ANSI" par "1 CHAR UTF-8"
Je supprime aussi 10 lignes dans l’entête
3 ADDR 10, Chaussée Jules César
4 POST F-95527
4 CITY CERGY-PONTOISE
4 CTRY FRANCE
3 PHON (+33).1.34.39.12.12
3 _ADDR http://www.geneatique.com
2 FORM LINEAGE-LINKED
2 POST
2 CITY
1 _MAIL

et pour finir avec notepad ++
Menu édition /sélectionner tout (CTRL A)
Menu /Encodage /Convertir en UTF-8 sans BOM

Super! Merci. J'ai suivi la méthode (avec Editplus au lieu de Notepad++). Import nickel dans Webtrees.
Cordialement

Re: Export GEDCOM au format UTF8

MessagePosté: Jeu 27 Oct 2016 13:31
de predigny
jlturbe a écrit:...
et pour finir avec notepad ++
Menu édition /sélectionner tout (CTRL A)
Menu /Encodage /Convertir en UTF-8 sans BOM

Quand je fais cela avec Notepad++ (v7.1), tout le texte disparaît. Si je fais "Menu /Encodage /Encoder en UTF-8 sans BOM" certains caractères sont modifiés mais le texte reste en place.

Re: Export GEDCOM au format UTF8

MessagePosté: Jeu 27 Oct 2016 15:19
de jlturbe
predigny a écrit:
jlturbe a écrit:...
et pour finir avec notepad ++
Menu édition /sélectionner tout (CTRL A)
Menu /Encodage /Convertir en UTF-8 sans BOM

Quand je fais cela avec Notepad++ (v7.1), tout le texte disparaît. Si je fais "Menu /Encodage /Encoder en UTF-8 sans BOM" certains caractères sont modifiés mais le texte reste en place.

Le texte ne disparait pas chez moi en version Notepad++ (v7.1)
C'est Convertir en UTF-8 sans BOM au lieu de Encoder en UTF-8 sans BOM

Re: Export GEDCOM au format UTF8

MessagePosté: Jeu 27 Oct 2016 15:54
de predigny
jlturbe a écrit:...Le texte ne disparait pas chez moi en version Notepad++ (v7.1)...

Avec un petit fichier gedcom c'est OK mais avec le gedcom d'une généalogie de 90 000 personnes (1 200 000 lignes) ça ne fonctionne plus. Quelle est la limite de Notepad++ ?

Re: Export GEDCOM au format UTF8

MessagePosté: Jeu 27 Oct 2016 17:13
de pguibert
Bonsoir,
predigny a écrit:
jlturbe a écrit:...Le texte ne disparait pas chez moi en version Notepad++ (v7.1)...

Avec un petit fichier gedcom c'est OK mais avec le gedcom d'une généalogie de 90 000 personnes (1 200 000 lignes) ça ne fonctionne plus. Quelle est la limite de Notepad++ ?

Je viens de tester avec une base de 140006 personnes (2 419 967 lignes) et tout a très bien fonctionné.

Il semble qu'il faille chercher la cause ailleurs (capacité mémoire etc.).

Re: Export GEDCOM au format UTF8

MessagePosté: Jeu 27 Oct 2016 23:16
de ddalbiez
Le CDIP a passé la demande de l'export GEDCOM au format UTF-8 à l'èquipe de développement. Ça va peut-être bouger…

Re: Export GEDCOM au format UTF8

MessagePosté: Sam 29 Oct 2016 17:07
de ddalbiez
Une précision trouvée dans l'article Wikipedia sur la norme GEDCOM

"Un fichier GEDCOM est rédigé en texte seul, ASCII ou ANSEL, le jeu de caractères pouvant être UTF-8, ISO-8859-1, ISO-8859-15 ou UTF-16."

Re: Export GEDCOM au format UTF8

MessagePosté: Mer 14 Déc 2016 12:02
de ddalbiez
Le CDIP n'a pas inscrit dans la liste courante des développements l'export gedcom au format UTF-8. La raison officielle est que je suis le seul demandeur. Donc, si les uns ou les autres sont intéressés, manifestez-vous auprès du CDIP.
Merci