• Bienvenue sur la nouvelle version du forum Guide de généalogie,

    Si vous avez du mal à vous connecter, faites une demande de réinitialisation de mot de passe : Réinitialiser mon mot de passe
  • Découvrez la nouvelle section du forum : Réalisations dans Généatique. Montrez et partagez vos créations d'arbres dans Généatique !
    Et participez au concours !

Mauvais doublon (encore une fois!)

Membre actif
Ces fameux "Mauvais doublons. Groupe pas créé" me hantent depuis un bon bout de temps. J'ai essayé de les ignorer car en général ils ne créent pas de problème dans les "produits" (documents, listes..) et disparaissent lors d'une exportation en Gedcom. Mais ils restent là avec un majeur handicap : les personnes impliquées sont ignorées dans certaines fonctions internes comme la recherche de cas semblables lors de l'ajout de données. Donc quoi faire?

J'ai mis au point une petite technique qui permet d'en éliminer; il s'agit simplement de tuer l'enregistrement et de le recréer à neuf. Cela requiert naturellement la conservation des informations indispensables à la recréation (enregistrement des données personnelles, sur le(s) mariage(s) éventuel(s), les parents, ou une copie du fichier faite avant de commencer).

J'ai préféré une telle solution au cas par cas aux manipulations suggérées impliquant tout le fichier d'un coup, d'abord parce que je ne suis pas disposé à leur faire confiance, ensuite parce que ce type de manipulations sur des fichiers d'une certaine taille prennent un temps inacceptable (avec en plus tous les risques d'arrêt impromptu).

Mais elle ne résout pas tous les problèmes, dont un de taille :
----Comment détecter systématiquement de tels doublons?

Ensuite, ne sachant pas bien comment ils apparaissent (toutes les histoires d'implexes ne sont que chimères), il n'est pas possible de les éviter. Il y a bien longtemps G2014 créait des records erronés avec "ajout d'un enfant" (par ex. le premier créé ne se mettait pas dans l'ordre des naissances à l'ajout de frères/sœurs). Il fallait détruire et recréer. Je suis sûr qu'il y a ainsi des opérations créant des enregistrements avec de mauvais indices (par exemple lors de fusions) mais je n'en ai aucune preuve d'autre que le "méfiez-vous des fusions" que j'ai eu alors.

Finalement j'ai remarqué qu'il apparaît des enregistrements fantômes au nom de "XXX" impossibles à détruire et souvent associés à un mauvais doublon. Y-aurait-il une certaine parenté entre les deux types?
 
Comme vous ne montrez pas à quoi ressemblent ces doublons sur l'arbre, il sera difficile de dire d'où ils viennent. Les implexes sont peut-être des chimères mais ils produisent ce que certaines personnes considèrent (à tort) comme des doublons, mais il peut y avoir de vrais troubles de fonctionnement de Généatique qui créent des enregistrements "malades". Les XXX sont aussi des signes de dysfonctionnement et sans doute ils montrent que la base de données a besoin d'être nettoyée. On ne peut pas se passer de restructuration (option 2) de temps en temps. Parfois il faut aller jusqu'à une extraction totale vers un nouveau fichier (on peut dans ce cas récupérer les deux fichiers qui définissent les équivalences).
Ces opérations sont longues mais elles ne risquent rien si l'on a fait une sauvegarde ou une duplication de la généalogie.
Personnellement je fais une restructuration en moyenne tous les deux mois et une extraction totale tous les ans.
 
Je voulais être un bon joueur alors je m'y suis mis. Extraction de toutes les fiches de ma généalogie. Un quart d'heure pour m'annoncer 457 447 personnes; bizarre mais je confirme, et rien ne se passe au bout d'un autre 10 minutes. Abandon, et encore rien. Finalement, Task Manager pour tuer l'ensemble ce qui prit un bon 10 minutes. Je recommence, cette fois on annonce 473650 ce qui est plus correct et je confirme. Fichiers des lieux, des événements et finalement des personnes. À 22 139 personnes, arrêt des progrès; après une demi heure (je ne voulais pas perdre les 2 heures précédentes), abandon. 20 minutes plus tard encore aucune action. De retour au Task Manager pour libérer ma machine. Assez rapide cette fois-ci pour la fermeture.
Mais je n'ai toujours pas le nouveau ficher "extrait".
Ne me dites pas que c'est parce que je n'ai que G2016
 
Bonjour
J'ai le même problème. Généatique n'aime pas du tout les grosses généalogies. Plus le temps est long pour effectuer ses opérations plus on a de chance que cela n'aboutisse pas. Idem pour l'export sur geneatique.net.

ET tout cela ne concerne pas une version, c'est vrai pour toute les versions de Généatique, j'ai pris la G17 pensant qu'il y avait eu des modifications mais rien. et cela dur depuis des mois.
Faut-il continuer a s'acharner à faire confiance à un logiciel qui ne prends pas comme cela est indiqué partout un nombre de fiches ' ILLIMITE"
Je réfléchis sérieusement pour l'avenir je n'ai pas envie de perdre mon travail de plusieurs années.
Un utilisateur depuis un dizaine d'années fort mécontent
Serge
 
On manque d'expérience sur des bases aussi grosses. Déjà le temps d'une restructuration de ma base (~90000 personnes) dure pas loin d'une heure et il semble bien que le temps nécessaire augmente plus vite que la taille de la généalogie. Faut-il un pc avec beaucoup de mémoire pour réaliser ce genre d'opération ? en tout cas il vaut mieux avoir redémarré Windows et n'avoir aucun programme ouvert autre que Généatique et ... être très très patient. J'observe souvent des opérations où Généatique semble bloqué mais qui en faite se font sans aucun signe de vie ; si l'on est patient, l'opération se poursuit ; alors avec 470000 personnes, ça doit être pire. C'est à lancer le soir et voir le lendemain matin ce que ça a donné !
Il m'est arrivé une fois, d'avoir un vrai problème avec ma base et j'ai du passer par un export-import gedcom. Si on règle bien les options d'export, la perte de données est insignifiante et là aussi on peut réutiliser les fichiers des équivalences nom/prénom (en renommant les copies) ; Il est utile dans ce cas d'utiliser la généalogie comme modèle pour la structure de fichier des nouvelles généalogies, ainsi toutes rubriques seront reconnues lors de l'import gedcom. Vous devriez peut-être faire l'essai.
 
ssergent":19og33t7 a dit:
... Faut-il continuer a s'acharner à faire confiance à un logiciel qui ne prends pas comme cela est indiqué partout un nombre de fiches ' ILLIMITE"...
Deux choses :
- Un autre logiciel "grand-public" fait-il mieux ?
- Illimité suppose aussi un matériel illimité ; est-ce vraiment le cas avec nos pc ? Le point faible étant la mémoire on peut essayer d'augmenter la taille de la mémoire virtuelle.
Il faut admettre que lors des béta-tests par exemple, le nombre d'essais qui ont été faits avec de très grosses bases est très limité. Personnellement j'ai fait quelques essais avec une base de 450000 personnes (une base qui contenait N fois la même généalogie de ~60000 personnes, mais les tests sont alors tellement longs qu'ils sont forcément très limités en nombre.
 
Je ne cherche pas a savoir si un autre fait mieux, mais a avoir ce que l'on me dit sur la description du produit ,500, 1500 et illimité c'est tout

J'ai un matériel suffisamment performent avec 16 GO de mémoire. Donc le matos n'est pas en cause mais plutôt la conception même de GénéaTique. Je ne remets pas non plus en cause les bêtas-tests.

Effectuer les opérations de re structuration, d'export de la généalogie vers geneatique.net qui prends des heures sans rien toucher ( ni souris, ni clavier) pour ne pas aboutir cela est anormal.
Il y aura de plus en plus de grosses généalogie car maintenant que nous avons les AD en ligne les recherches son facilitées et nous travaillons dessus depuis maintenant plusieurs années pour ma part depuis quinze ans. De quoi enrichir ma base de donnée. Je n'ai pas envie de perdre tout ce travail.
Je veux donc un produit qui réponde a mes attentes sans demander non plus un usine à gaz.
Cdt Serge
 
Bonjour à tous et à leur doublon !

Avant toutes choses, quand vous constatez un comportement bizarre de votre base, il faut RESTRUCTURER. Le 2ème niveau semble résoudre bien des problèmes. Notamment ces XXX dont vous parlez.
Evidemment avec une telle base cela prend du temps, surtout si votre périphérique est un HDD, un SSD est absolument indispensable. Plus de 24H dans le 1er, 4 à 6 H dans le 2ème, ce n'est qu'une estimation.
Je restructure 1 à 2 fois par semaine, en tous cas à chaque fois qu'un fonctionnement semble curieux.

Je ne pense pas qu'il ai des générations spontanées de fiche en duplication d'une autre déjà existante; C'est bien ça un doublon ? Il y aurait donc DEUX fiches identiques ...

Pourquoi pensez-vous que ce sont des doublons ? Si dans un gedcom vous n'avez pas ce doublon, c'est qu'il n'existe pas.
Votre technique pour supprimer ce doublon est de supprimer une instance de celui-ci, ce qui suffit à supprimer les deux fiches en doublon. Curieux. C'est qu'il y a qu'une fiche !

Comment constatez-vous la présence de ce "vrai fantôme" ? Si c'est par le graphique, votre arbre à l'écran, ce n'est pas une preuve, c'est surement une double représentation d'une même fiche. Pour s'en convaincre modifier une des instances du doublons, le nom ou le prénom par ex., et constater cette même modification sur la deuxième instance.

S'il y a vraiment doublons, comment sont les liens avec les ascendants et descendants, Même parents ? Même enfants ?
Un exemple par copie d'écran serait bien.

Quant à la solution proposé par "Prédigny" de faire une copie de la base, c'est aussi une bonne solution, mais avec 400 à 500.000 records il faut un peu plus de 10 mn de patience. Je dirais une nuit, voire une journée entière.

A suivre ....
 
Bonjour,
Je ne réponds pas directement à votre question, à savoir la taille de la base et les réactions de Geneatique.
Mais j'ai fait une autre expérience avec un logiciel de montage vidéo : blocage, le programme ne répond plus, cela tourne mais en fait, "patine dans la choucroute".
Je suis allée voir un assembleur d'ordi et j'ai expliqué mon pb. Pas retenu les termes techniques, mais en gros j'ai compris que c'était un pb de mémoire "tampon" (je crois ...) saturée.
Il m'a assemblé un ordi, en fonction du cahier des charges que je nous avons construit ensemble. Pas plus cher qu'un ordi du commerce, et depuis je n'ai plus eu de pb sur ce sujet.
Si cela peut vous éclairer ...
 
Une autre chose qui peut ralentir, voir bloquer, un ordi qui par ailleurs fonctionne bien : l'antivirus.
Lorsque vous créez un nouveau fichier (sauvegarde ou extraction), si votre antivirus analyse toutes les données du nouveau fichier, vu le nombre de personnes, et si vous avez en plus pas mal d'illustrations, il se peut qu'il se "noie".

Mon antivirus prévoit une "zone d'exclusion" des programmes qu'il ne contrôle pas en sortie.
 
campagne27":yge6w3ln a dit:
Une autre chose qui peut ralentir, voir bloquer, un ordi qui par ailleurs fonctionne bien : l'antivirus.
Je ne pense pas, j'en suis même sûr, que l'antivirus analyse les fichiers de données générés en local par un exec. Encore moins un fichier image qui n'est pas un exécutable.
La lenteur d'une fonction d'un programme peut-être dû principalement :
- au programme lui-même
- au volume des données
- à la quantité et la qualité de la RAM
- à la rapidité du périf de stockage si la RAM déborde
- ...

Mais on s'éloigne des problèmes de doublons
 
ssergent":1mf1g7rd a dit:
Je ne cherche pas a savoir si un autre fait mieux, mais a avoir ce que l'on me dit sur la description du produit ,500, 1500 et illimité c'est tout

J'ai un matériel suffisamment performent avec 16 GO de mémoire. Donc le matos n'est pas en cause mais plutôt la conception même de GénéaTique. Je ne remets pas non plus en cause les bêtas-tests.

Effectuer les opérations de re structuration, d'export de la généalogie vers geneatique.net qui prends des heures sans rien toucher ( ni souris, ni clavier) pour ne pas aboutir cela est anormal.
Il y aura de plus en plus de grosses généalogie car maintenant que nous avons les AD en ligne les recherches son facilitées et nous travaillons dessus depuis maintenant plusieurs années pour ma part depuis quinze ans. De quoi enrichir ma base de donnée. Je n'ai pas envie de perdre tout ce travail.
Je veux donc un produit qui réponde a mes attentes sans demander non plus un usine à gaz.
Cdt Serge
Pragmatique.
Illimité veut dire "pas de limitation en nombre de fiches" et c'est tout.
Maintenant, dans la mesure ou G2017 ne semble pas basé sur un SGBD mais a une gestion propriétaire, il est clair que les performances en fonction du nombre de fiches devraient être mieux étudiées et le cas échéant améliorées.
Je n'atteins pas des quantités qui dégradent les perfs, je ne peux donc en juger mais je veux bien vous croire.
Par contre je constate qu'il est parfois nécessaire d'effectuer des restructurations voire réparations.
 
Pour répondre à une demande de "définition": je n'ai jamais observé de faux doublons dans un arbre ou un document par exemple. Ils ne sont détectés comme tels que si on veut faire la fusion de deux lignes dans un résultat de recherche de personnes; ces deux lignes sont totalement identiques, dates, nom, prénom, info sur le(s) mariages(s), conjoint(s), enfin tout ce qui peut y être affiché.

Mais attention, ces doubles lignes n'apparaissent que pour une recherche "générique" du genre "Tremblay P*"; alors je trouve 2 lignes pour un "Paul Émile". Si je recherche "Tremblay Paul" ce doublon n'apparaît pas. C'est cet aspect d’invisibilité relative qui est le plus dommageable au bon fonctionnement de Gxxxx car les opérations normales qui font appel à cette fonction de recherche, comme l'ajout de personnes, ne les voient pas.

Dans mon fichier principal, j'ai plus de 3950 items répondant à "Tremblay P*", les explorer visuellement page par page est hors de question, ou devient une affaire de simple chance sans aucune garantie d'exhaustivité.
 
Mille excuses pour une fausse affirmation: j'ai écrit que le doublon n'apparaissait pas dans une recherche "Tremblay Paul". C'était faux je ne l'y avais pas trouvé car je regardais au mauvais endroit : "Paul Émile" (le coupable!) se trouve dans la liste après "Paul Wilfrid" alors que "Émile" est bien après "Elzéar"; la correction relativement récente (G2016) de la position des lettres accentuées initiales dans les listes n'avait porté que sur le premier prénom. Confusion totale due à la flemme (ou à la trop courte vue) de la programmation.
Si mon exemple n'est pas bon pour prouver ma thèse d'invisibilité, il faudra que vous me preniez sur parole car j'en ai eu des cas.
 
C'est plus clair maintenant, ce ne sont pas des fiches en doublons, mais des lignes retournées en double par une recherche dans le cas où l'individu possède deux prénoms.

Par exemple vous avez une fiche TREMBAY Paul Emile
Si vous faites une recherche sur TREMBLAY *, ou "TREMBLAY" sans précision de prénoms, vous obtenez :
> TREMBLAY - Emile
> TREMBLAY Paul Emile
Cela permet d'afficher une liste alpha de tous les prénoms d'un même individu, ce n'est pas pour ça que la fiche est doublée, il n'y a pas de doublons.
Evidement si vous cherchez TREMBAY Paul, vous n'obtenez qu'1 seule ligne
> TREMBLAY Paul Emile

Si c'est cela qui gène vous pouvez décocher [Tous les prénoms] dans la colonne de droite "Infos. à afficher"

Si vous ajoutez un 3ème prénom par exemple :TREMBAY Paul Emile René, vous aurez :
> TREMBLAY - Emile
> TREMBLAY Paul Emile René
> TREMBLAY - René
Vous n'avez toujours qu'une seule personne

Tout ceci est un fonctionnement normal
J'espère tout est clair maintenant.
 
G2017 à tout de même eu (à encore ? ) un problème de lignes qui parfois s'affichent en double ; ce n'est pas systématique et ne présente qu'une gène visuelle. Je ne sais plus si ce problème a été fixé.
 
Ce n'est un problème de "tous les prénoms ou pas". Il y a deux lignes pour "Paul Émile Léopold".

Je ne suis pas aussi optimiste que la correspondante qui les voit mais ne les craint pas car elle ne se rend pas de l'erreur qu'ils recouvrent

En voici un autre exemple
 
Fichiers joints
  • doublon_abel.jpg
    doublon_abel.jpg
    25.3 KB · Affichages: 737
On avance.
Cette image jointe postée plus tôt nous aurait évité bien des mots.

Je vous propose de faire une généalogie avec une seule fiche !
Et de constater qu'il n'y a pas d'anomalie
Si c'est le cas c'est votre gros dossier généalogique qui comporte de problème.

Je vous propose donc une restructuration de votre dossier, vous ne dites pas si vous l'avez fait. C'est Indispensable pour continuer la discussion et la résolution du problème. Et même si c'est long.

Si dans la généalogie à une seule fiche ou dans celle posant problème (après cette restructuration); il y a toujours le problème, on peut penser que la version actuelle de Généatique possède un bug.
En ce cas je vous conseille de vous rapprocher du CDIP.

Donc vous restructurez :
Utilitaire/Réparer/Restructurer...avec le 2ème choix
Faites une sauvegarde auparavant de façon à répondre NON quand la restructuration vous le proposera.
Cela évite le temps d'attente de cette sauvegarde qui trompe notre attention pour choisir ce dit 2ème choix.

à suivre ....
 
Je n'avais pas compris le problème, mais je confirme les doublons dans les résultats de recherche.
Ma généalogie n'est pas très grosse (1382)
J'ai ensuite fait une restructuration.
Pareil.
Est ce que cela peut être du au fait qu'il y a deux patronymes ? ça n'a pas l'air.
Mais cela ne se produit pas sur toutes les recherches. J'ai essayé pas mal de combinaisons mais je n'ai pas encore trouvé le discriminant.
 
Fichiers joints
  • Capture.PNG
    Capture.PNG
    52.5 KB · Affichages: 712
Oui pour "jmambro"

Vous avez 2 patronymes séparés par un ";", c'est normal que les lignes soient doublées
et redoublées pour les 2 prénoms différents.
Vous, pas de problème...

Mais ce n'est pas le cas de "jakesp" où il n'y a qu'un seul patronyme !
 

gratuit

Retour
Haut