Export GEDCOM au format UTF8

Sur ce forum, toutes les questions relatives à l'utilisation du logiciel de généalogie Généatique peuvent être postées.

Modérateurs: predigny, LEFF, peyroutet47

Re: Export GEDCOM au format UTF8

Messagede ddalbiez » Mer 26 Oct 2016 14:49

predigny a écrit:Le modèle pour l'export gedcom vers Geneanet (geneanet.egc) utilise bien le format ANSI.
Je n'ai aucune idée de la complexité qu’entraînerait l'ajout du format UTF-8 pour l'export ; naïvement ça ne me semble pas être un bouleversement dans génération du gedcom ; mais on pourrait dire la même chose pour l'import et je ne comprends pas pourquoi certains logiciels n'acceptent que le UTF-8.

Comme expliqué précédemment, UTF-8 est universel: il est capable de coder beaucoup plus de caractères que l'ANSI ou sa variante ANSEL. Il peut donc être utilisé par un plus grand nombre de logiciels, dans toutes sortes de langues.
Dom
-------------------------------------------------
Desktop W10, Geneatique 2018 et 2019 (Prestige)
Laptop W10, Geneatique 2018 et 2019 (Prestige)
ddalbiez
 
Messages: 167
Inscription: Ven 5 Nov 2004 13:42
Localisation: Bangkok, Talence

Re: Export GEDCOM au format UTF8

Messagede Jean Costet » Mer 26 Oct 2016 19:04

Bonjour,
S'il s'agit d'export de gedcom vers Geneanet il faut savoir que Geneanet utilise nativement UTF-8 (sans BOM). Par ailleurs Geneanet ne lit pas tous les caractères ANSI ou plus exactement Windows-1252 pour donner le nom officiel de ce codage fabriqué par Microsoft. Œ et œ ne sont pas reconnus par Geneanet bien que Æ et æ le soient !

Mais la transformation en UTF-8 d'un gedcom codé en Windows-1252 (une sortie normale pour un gedcom fabriqué par Généatique sous Windows) est facile avec le bloc-note de Windows. Il faut toutefois disposer d'un lecteur hexadécimal (il y en a de gratuits) pour enlever les trois octets du BOM au début du fichier.

Jean Costet
Jean Costet
 
Messages: 122
Inscription: Jeu 4 Nov 2004 11:24
Localisation: Lyon (Rhône)

Re: Export GEDCOM au format UTF8

Messagede predigny » Mer 26 Oct 2016 19:27

Jean Costet a écrit:...Il faut toutefois disposer d'un lecteur hexadécimal (il y en a de gratuits) pour enlever les trois octets du BOM au début du fichier....

Où est le BOM dans ce fichier .ged ANSI généré par Généatique ?

HEX.jpg
HEX.jpg
pc: HP Pavilion a6641fr ; Vista édition Familiale Premium ; G2018
predigny
 
Messages: 19978
Inscription: Jeu 6 Déc 2007 16:42

Re: Export GEDCOM au format UTF8

Messagede Jean Costet » Mer 26 Oct 2016 20:37

Bonsoir M. Prédigny,
Je me suis sans doute exprimé de façon trop rapide.
Le gedcom que vous montrez est un gedcom codé en ANSI comme le précise d'ailleurs son tag CHAR. Les fichiers ANSI n'ont pas de BOM (en principe indication de l'ordre des octets quand un caractère est codé sur plus d'un octet).

Par contre les fichiers codés en UTF-8 par le bloc-note de Windows en ont un. J'aurais dû écrire :
"Après avoir passé le gedcom en ANSI à la moulinette du bloc-note de Windows vous obtiendrez un gedcom en UTF-8 avec BOM. IL faudra enlever ce BOM (les trois premiers caractères du fichier) avec un lecteur hexadécimal car Geneanet ne reconnaît que les fichiers UTF-8 sans BOM".

Je fais cela depuis plus de six ans, car j'ai dans ma généalogie envoyée à Geneanet un patronyme LEBŒUF qui est massacré si j'expédie le gedcom en ANSI que me fabrique Généatique. Pensant que Geneanet avait évolué j'ai fait un essai la semaine dernière, Œ n'est toujours pas reconnu. On peut bien sûr aller dans son site Geneanet et corriger l'erreur à la main, mais s'il y a plusieurs occurrences du patronyme on risque des oublis.

Jean Costet
Jean Costet
 
Messages: 122
Inscription: Jeu 4 Nov 2004 11:24
Localisation: Lyon (Rhône)

Re: Export GEDCOM au format UTF8

Messagede predigny » Mer 26 Oct 2016 21:29

Jean Costet a écrit:...J'aurais dû écrire :
"Après avoir passé le gedcom en ANSI à la moulinette du bloc-note de Windows vous obtiendrez un gedcom en UTF-8 avec BOM. IL faudra enlever ce BOM (les trois premiers caractères du fichier) avec un lecteur hexadécimal car Geneanet ne reconnaît que les fichiers UTF-8 sans BOM"....

Merci, je comprends mieux comme cela. C'est bon a savoir, mais je suis d'accord avec ddalbiez : le cdip devrait proposer ce codage qui semble assez simple à implémenter.
pc: HP Pavilion a6641fr ; Vista édition Familiale Premium ; G2018
predigny
 
Messages: 19978
Inscription: Jeu 6 Déc 2007 16:42

Re: Export GEDCOM au format UTF8

Messagede predigny » Mer 26 Oct 2016 21:39

J'ai fait la manip. avec Notepad.exe et supprimé les trois premiers octets (ef bb bf), mais on voit que le texte contient toujours la référence aux caractères ANSI ; est-ce normal ?

HEX-2.jpg
HEX-2.jpg
pc: HP Pavilion a6641fr ; Vista édition Familiale Premium ; G2018
predigny
 
Messages: 19978
Inscription: Jeu 6 Déc 2007 16:42

Re: Export GEDCOM au format UTF8

Messagede ddalbiez » Mer 26 Oct 2016 21:42

predigny a écrit:je ne comprends pas pourquoi certains logiciels n'acceptent que le UTF-8.

C'est un choix que font les développeurs entre un format universel capable de représenter tous les caractères vs un format obsolète limité. UTF-8 ne présente pas de variantes, alors qu'ANSI est adapté selon les besoins (par exemple ANSEL). ANSI, standard aléricain a été abandonné en 2013 au profit d'UTF-8 standard international de l'ISO.
Ceci dit, pas mal de logiciels même nouveau acceptent l'ANSI pour des raisons historiques. En général pas l'ANSEL.
Je vous rappelle que je vous ai fait un copié-collé de l'argumentaire UTF-8 vs ANSI. Plus haut dans le thread. Cet argumentaire est en anglais.
Dernière édition par ddalbiez le Mer 26 Oct 2016 21:51, édité 1 fois.
Dom
-------------------------------------------------
Desktop W10, Geneatique 2018 et 2019 (Prestige)
Laptop W10, Geneatique 2018 et 2019 (Prestige)
ddalbiez
 
Messages: 167
Inscription: Ven 5 Nov 2004 13:42
Localisation: Bangkok, Talence

Re: Export GEDCOM au format UTF8

Messagede predigny » Mer 26 Oct 2016 21:46

ddalbiez a écrit:
predigny a écrit:je ne comprends pas pourquoi certains logiciels n'acceptent que le UTF-8.

C'est un choix que font les développeurs entre un format universel capable de représenter tous les caractères vs un format obsolète limité.
Je vous ai fait un copier-coller de l'argumentaire UTF-8 vs ANSI. Plus haut dans le thread. Cet argumentaire est en anglais.

L'anglais technique ne me pose pas trop de problème, mais de toute façon je suis maintenant convaincu de l'intérêt du UFT-8 et convaincu aussi que le cdip doit vite faire quelque chose....
pc: HP Pavilion a6641fr ; Vista édition Familiale Premium ; G2018
predigny
 
Messages: 19978
Inscription: Jeu 6 Déc 2007 16:42

Re: Export GEDCOM au format UTF8

Messagede ddalbiez » Mer 26 Oct 2016 22:02

predigny a écrit:je suis maintenant convaincu de l'intérêt du UFT-8 et convaincu aussi que le cdip doit vite faire quelque chose....

Croisons les doigts. Je réclamais ce format dès décembre 2006!!!! Avec le succès que l'on sait.
Quand je pense que les inventeurs du format GEDCOM ont inclus l'export au format UTF-8 dans leur logiciel très "spartiate" PAF5 depuis plus de 10'ans!
Dom
-------------------------------------------------
Desktop W10, Geneatique 2018 et 2019 (Prestige)
Laptop W10, Geneatique 2018 et 2019 (Prestige)
ddalbiez
 
Messages: 167
Inscription: Ven 5 Nov 2004 13:42
Localisation: Bangkok, Talence

Re: Export GEDCOM au format UTF8

Messagede Jean Costet » Jeu 27 Oct 2016 07:17

Bonjour,
Compte-tenu des récentes interventions je crois utile de préciser un point sur ma manière de procéder.
Avant d'ouvrir le gedcom avec le bloc-note de windows j'opère deux modifications du fichier à la main.
Tout d'abord j'écris CHAR UTF-8 au lieu de Char ANSI dans le texte et ensuite je modifie l'extension du fichier de .ged en .txt (je ne suis pas certain que ce soit indispensable).
Après l'enregistrement de la codification en UTF-8 je rétablis bien sûr l'extension .ged.
Jean Costet
Jean Costet
 
Messages: 122
Inscription: Jeu 4 Nov 2004 11:24
Localisation: Lyon (Rhône)

PrécédenteSuivante

Retourner vers Forum Généatique 2019 - Logiciel de généalogie

 


  • Articles en relation
    Réponses
    Vus
    Dernier message

Qui est en ligne

Utilisateurs parcourant ce forum: Bing [Bot] et 20 invités