Lorand
Un petit site personnel tout simple pour essayer, partager et échanger.
La citation du jour
L’insomnie est la pire des choses : immanquablement vous êtes seul face à vos pensées.
ACTIVITE
-  ?
- web et informatique
- cyclotourisme
- généalogie
- lectures
- Collection
- bricolage
- citoyen
- marche
- Ecriture
- Photographie
- Wikipedia
Rubriques
Catégories
- ACTIVITE
- LOCALISATION
- THEME
- ORGANISME
- PERSONNE & FAMILLE
- DOCUMENTATION
- EX-METIERS
Mots-clés
Lorand

Site personnel de Roland Bouat. Pour les curieux : Lorand est un anagramme de Roland.

http://www.lorand.org

Accueil > Généalogie MaLiBeLe > Comment construire une liste de blogs de généalogie ?

Comment construire une liste de blogs de généalogie ?

Mots clés : lectures, généalogie, #généalogie

mercredi 5 octobre 2016, par Roland


Des échanges fusent sur twitter à propos de la construction d’une liste de blogs de généalogie pendant que je cherche à établir MA liste de blogs de généalogie ! j’apporte ma pierre au débat en me contenant d’exposer les problèmes que ’ai rencontrés.

Construire une liste de blogs de généalogie ? Pas si simple que ça. Surtout quand on a la prétention d’aller plus loin qu’un/e simple blogroll basique.
Note : Dans cet article, l’expression "blog(s) référencé(s)", généralement écrite en caractères gras, signifie "référencés dans la page Quelques blogs francophones de généalogie...".


 Qu’est-ce qu’un blog ?

voici ce qu’en ont dit les intervenants, Clément BECLE (@genbecle), Céline SOUEF (@CelSouef) et JeanMarc BOGROS (@Jimbogenealogie) de "Geneatech" lors de leur conférence à Gene@2016 :


• BLOG = WEB (Toile) + LOG (Journal) = WEBLOG = « BLOG »
• Une personne qui tient un blog = un blogueur
• Le monde des blogs = la blogosphère
• Pour la généalogie, on parle de « généablogueurs »

 Qu’est-ce qu’un blog de généalogie ?

C’est l’inventaire des blogs de généalogie qui amène cette question. Mais que répondre ? Voici les partis-pris de cette page :

  • Un site qui n’affiche qu’un (ou plusieurs) arbres en ligne n’est pas un blog de généalogie.
  • Une page ou un compte FaceBook ne sont des blogs de généalogie.
  • Un blog de généalogie doit comporter au moins trois articles présentant des "histoires d’ancêtres" ou des descriptions de recherches en généalogie. Ce peut aussi être les aides et/ou guides à la pratique généalogique. Donc, un blog présentant une ou deux pages sur un thème généalogique n’est pas un blog de généalogie.
  • Un blog d’histoire ou spécialisé sur une période, un évènement, un site patrimonial n’est pas un blog de généalogie.
  • Un blog non limité à la généalogie doit permettre d’accéder exclusivement aux articles consacrés à la généalogie (via rubrique, catégorie ou tag). ce sera ce lien qui sera retenu.
  • Un site exclusivement réservé aux archives, à leur classement, à leur indexation, à leur contenu n’est pas un blog de généalogie.
  • Un blog de professionnel ne sera considéré comme un blog de généalogie que si une rubrique (ou catégorie ou tag) est consacrée à la généalogie sans référence au métier (sans "clientélisme").
  • ...

 Il y a des blogs...

  • ... consacrés exclusivement à la généalogie. Pas de problème.
  • ... proches des activités généalogiques comme les blogs d’Histoire. Mais un blog de petites histoires de la vie est très proches des articles écrits par les généalogistes. Les derniers sont référencés mais pas les blogs d’Histoire.
  • ... avec une rubrique généalogique ou un tag généalogie pour regrouper les articles sur ce thème. Dans ce cas, la rubrique ou le tag sont notés avec une mention après le nom du blog.
  • ... non mis à jour depuis longtemps. Mais qu’est-ce que longtemps ? La date de la dernière mise à jour est indiquée et le blog référencé est classé dans le paragraphe des "blogs inactifs". (voir plus bas le paragraphe sur ce sujet).
  • ... morts. Ah, les liens morts ! La hantise des maîtres de toile (webmasters). Blogs non référencés évidemment. Mais un lien peut devenir mort ! ... ou simplement être mal orthographiés ! Il existe des outils plus ou moins gratuits, plus ou moins efficaces mais il faut les appeler. Rien ne vaut donc le test manuel mais que c’est long lorsqu’il il y a des centaines de liens !
  • ... qui déménagent en laissant l’ancien en l’état (à l’abandon). Lorsque l’identification est certaine, les deux blogs sont référencés, l’ancien et le nouveau. L’ancien est probablement déclaré inactif.
  • ... non publics (accès privés ou soumis à accréditation). Non référencé.
  • ... qui ’utilisent que Facebook. Non référencé.
  • ... qui utilisent une interface de style forum ou wiki.
  • ...

 Blogs abandonnés et blogs inactifs

Pour les repérer, un seul moyen : trouver la date de dernière publication. Il existe des outils en ligne ou installables. J’en utilise un, LinkChecker ; la vérification s’impose quand même surtout pour les liens classés "douteux".

 Se repérer sur la date

Quelle date utiliser pour suivre un blog ? Indiquer la date de la dernière visite ne donne aucune information pertinente et/ou utile. La date du dernier passage sur le site n’est pas enregistrée. Donc, la date de la dernière mise à jour du site, de la dernière publication est indiquée. Encore faut-il qu’elle existe et donc la trouver !

  • Elle est rarement affichée.
  • Les articles sont généralement affichés dans l’ordre anté-chronologique et heureusement avec la date de publication. Cette date est enregistrée comme date de mise à jour.
  • Malheureusement, quelquefois, la date n’est pas affichée, seulement l’heure. Astuce : Comme il s’agit généralement de "vrais blogs", un survol de cet horaire ou du titre donne l’année et le mois puisque, fréquemment dans les blogs, les articles sont archivés dans des dossiers [/ANNEE/MOIS]
  • Il existe quelques sites où aucune date de publication n’est affichée. L’auteur a oublié le lecteur (aucune considération et/ou prise en compte mais il peut aussi s’agir de la plateforme d’hébergement choisie, plutôt ancienne). Donc le blog est référencé parmi les blogs abandonnés.

Quelquefois (plutôt souvent d’ailleurs), le blog existe mais semble abandonné : depuis longtemps, il n’a pas été mis à jour. Mais qu’est-ce que longtemps ? Arbitrairement, il a été décidé que c’était... un an ! le blog est alors qualifié de "blog inactif". Tous les blogs inactifs devraient être référencés sous l’intertitre "Blogs inactifs" bien sûr.


 Quel nom de blog retenir ?

La difficulté vient de plusieurs axes :

  • le domaine est généralement symbolique et est repris en tête de la page d’accueil. Si c’est le même, pas de problème.
  • Si l’URL et le titre de la page d’accueil sont différents, systématiquement, le choix se porte sur le titre de la page d’accueil.
  • Quelquefois, il y a un sous-titre. Il est rajouté après le titre.
  • Il n’y a pas de titre ! (Si si, a existe !). C’est alors le titre de la page ’il a été défini et, à défaut l’URL elle-même.

 Ce qui serait utile...

Avec des "si"...

 balise dédiée

Si chaque site avait une balise spéciale "activité du site" (balise meta) qui se mettrait à jour toute seule sans l’intermédiaire du(des) maître(s) de toile, ce serait sans doute plus facile pour distinguer les sites actifs des inactifs... Mais il y a une forte probabilité pour que les échanges sur la durée à partir de laquelle le site serait considéré comme inactif... Par ailleurs, il semble qu’il existe des logiciels (ou des extensions de navigateurs) capables de surveiller la vie des sites...

Déjà, si tous les sites avaient un fil rss (ou atom ou...) accessible facilement... Rêve. Un simple agrégateur de contenus et nous aurions un journal très actif et automatique des publications généalogiques. Rêve toujours. Déjà que ceux qui en ont ne sont pas accessibles de la même manière (et ne parlons même pas des techniques différentes mises en œuvre) ! Note : L’abonnement aux nouveautés n’est pas du tout la même chose.

 Lien permanent

Un lien permanent [1] ou au moins un lien perenne [2] serait tout aussi utile. Mais, est-ce réalisable vers un site ? Sans doute que oui puisque la page d’accueil n’est qu’une page presque comme une autre...

 Les "sources" : comment trouver les blogs de généalogie ?

 Les moteurs de recherche

(Google bien sûr mais aussi Qwant, Duckcuckgo,

 [3]...) et le mot "généalogie" bien sûr. Mais ce sont des articles qui sont ainsi repérés (même pour Keyblog) : il faut alors remonter à la page d’accueil du site. Et puis, bien des liens sont sans intérêt (il suffit quelquefois d’utiliser le mot généalogie comme par exemple "généalogie des super-héros"...

 La liste de Jean-Louis Garret.

Fabuleuse liste avec quelques petits défauts. Cette liste comprend :

  • des blogs disparus,
  • des blogs cités deux fois,
  • des blogs d’histoire,
  • des blogs qui n’ont pas grand chose à voir avec la généalogie,
  • des blogs qui dorment,
  • des blogs vides (si si ca existe !) ou presque vide (un seul article),
  • des liens qui ne pointent pas vers la page d’accueil du site référencé,
  • des liens vers de simples articles à propos de la généalogie mais sans rubrique ou sans tag de regroupement,
  • des miniliens (pratiques mais peu signifiants, plusieurs sont périmés),
  • et, tout de même, des blogs consultables même si beaucoup ne sont plus mis à jour (quelquefois depuis très longtemps...).

Cette liste est tout de même très utile et a dû demander un sacré travail à Jean-Louis Garret. L’auteur a déposé un (C) de 2013 à 2018, il n’est donc pas possible de reproduire sa liste [4]. La liste a donc été copiée dans un tableur et "nettoyée" : suppression des logiciels, journaux avec blog ainsi que les groupes, forums et cercles (sauf si une "vraie rubrique généalogie" existe), suppression des doublons (gros boulot de contrôle)... ensuite, une visite un à un des 561 sites restants est en cours.

 Le challengeAZ

La liste établie pendant le challengeAZ (89 URL) . C’est une liste assez limitée quand on compare sa longueur à celle de Jean-Louis Garret.

 La liste de Clément Bécle

Elle a été établie lors de son enquête : "Étude sur l’audience des blogs de généalogie francophones en 2015 – Résultats.

" (85 URL) sont aussi utilisées. Elle aussi est relativement limitée.

 Les portraits de généablogueurs

Les portraits de généablogueurs de Sophie Boudarel dans la Gazette des Ancêtres.

 Le Geneafil

Cette veille généalogique collaborative en ligne est riche mais elle a le défaut de ne permettre d’accéder qu’aux sites actifs. Or, les sites abandonnés (mais toujours consultables en ligne) peuvent apporter des informations utiles et/ou intéressantes. De plus, depuis le lien, il faut remonter jusqu’à la page d’accueil même si c’est généralement très facile.


 Méthodologie (procédures)

Tenir à jour la Quelques blogs francophones de généalogie..., sera une gageure même si une révision annuelle seulement est envisagée à ce jour.

Partant d’un a priori complètement foireux [5], l’exploration du web part donc d’abord de la liste de Jean-Louis Garret (859 blogs répertoriés au 29/09/2016).

Tout compte fait, j’aurais dû commencer par les blogs des participants au #challengeAZ ou celle de Clément Bècle... Il y en a beaucoup moins et ils sont quasiment tous actifs.
  • Tout est répertorié dans une feuille de calcul afin de repérer rapidement les doublons et faire des tris simples. Voir ci-dessous le paragraphe dédié.
  • Seuls les blogs consacrés à la généalogie ou ayant une rubrique généalogie sont pris en compte. Les blogs mélangeant les articles généalogiques et les autres activités, sans possibilité de sélection automatique, sont négligés.
  • La date entre parenthèses après le lien vers le site est celle de la dernière mise à jour constatée lors de la dernière visite.
  • les lignes en italique repèrent les blogs qui n’ont pas été mis à jour depuis un an. Ils devraient être rangés dans la deuxième partie de chaque onglet sous le titre "Blogs inactifs (mon mis à jour depuis un an)". Ils comprennent aussi ceux qui ne font pas apparaître les dates de publication des articles (c’est un manque de respect envers le lecteur).
  • Les blogs qui disparaissent (erreur 404 ou redirection vers un autre site) sont simplement supprimés de cette liste au fur et à mesure de la découverte.

 Le tableau de recherche

C’est en fait une base de données avec une seule table dont voici les champs :

  • Lien d’origine : le lien vers le premier accès au site dans le cadre de cette recherche. Cela permet d’avoir des liens vers des articles et de disposer d’une liste en réserve (651 à l’écriture de ces lignes).
  • jlg : les sites répertoriés par Jean-Louis Garret
  • cb : les sites répertoriés par l’enquête de Clément Bècle
  • challAZ : les sites ayant participé au denier challengeAZ
  • titre : le titre retenu. C’est le nom affiché sur la page d’accueil du site qui est pris en compte par celui de l’URL. Il est suivi du sous-titre s’il y en a un. S’il n’y a pas de titre, c’est l’URL qui est prise en compte.
  • lien retenu : celui de la page d’accueil. Un bouton lié à une macro permet de l’extraire rapidement du titre lorsque l’URL est associée.
  • ancien lien : pour les sites ayant déménagé. L’un des deux sites doit afficher clairement le transfert.
  • date MAJ   : la date de mise à jour. Quelquefois absente mais surtout souvent pas si facile que a à trouver.
  • auteur : en réserve pour plus tard
  • @twitter : idem
  • Age : calcul automatique en jours pour définir l’inactivité
  • inactif ? : formule basée sur le champ précédent (âge > 365 jours)
  • mort ? : pour les sites disparus. Malheureusement pas pris en compte lors des 200 premières visites => toutes les informations étaient alors effacées.
  • commentaire : précision liée au champ précédent
  • blog ? : mention "non" lorsque le blog n’est pas retenu
  • pourquoi non retenu ? : tout est dans le titre.

Viennent ensuite quelques champs permettant l’écriture codée pour publication sur la page (site fonctionnant sous le CMS   Spip). Un simple copier/coller permet le transfert de la feuille de calcul vers la liste en ligne.

D’autres feuilles sont associées dans le classeur : elles contiennent les listes "sources" pour mémoire.


 Et les auteurs alors ?

Le choix a été fait, dès le départ, de ne pas citer le nom des auteurs simplement parce que, la plupart du temps, il est facile à trouver dès la page d’accueil. Il existe évidemment tout un ensemble de cas particuliers :

  • L’auteur utilise un pseudo et se cache derrière (pas trop fréquent)
  • L’auteur reste inconnu : pas de nom, pas de pseudo, pas de page (ou pas d’accès) d’informations légales.
  • L’auteur n’utilise que son prénom mais, en suivant les liens, (et les réseaux sociaux en particulier), il est assez facile de retrouver son nom
  • L’auteur n’utilise que ses abréviations.
  • ...

Peut-être, qu’un jour, les noms des auteurs seront rajoutés mais il n’est pas certain que ce soit indispensable.


 Maintenance, mise à jour...

Dorénavant, les blogs de généalogie (pas les sites des organisations) rencontrés au fil des lectures sur l’écran [6] viendront compléter la liste. Seuls les blogs qui racontent les recherches généalogiques, les trouvailles ou les histoires de famille sont répertoriés ici. Il est donc normal de ne pas trouver geneanet.org ou genealogie.com.


 Conclusion et perspectives

Répertorier les blogs de généalogie est très long. Les mettre à jour est tout aussi long. Et il faut sans cesse recommencer.Une vérification une fois par an est pour l’instant envisagé, ce serait déjà pas si mal. Des liens seront toutefois ajoutés lors de leurs découvertes et des mises à jour pourront être faites au fur et à mesure des lectures sur la toile. Le journal de lecture sera bien pratique.

Le résultat est consultable ici : Quelques blogs francophones de généalogie... mais la page reste en cours de construction.




Cet article sera complété au fur et à mesure de mon expérimentation (toujours en cours).
complété le 29/09/2016 - 30/09/2016 - 03/10/2016 - 05/10/2016 - 06/10/2016 MAJ mineure


[1Lien permanent : toujours identique même si l’URL change.

[2Lien pérenne : l’URL ne change pas à l’intérieur du site tant que le site existe (même s’il le site est inactif.

[3Keyblog découvert grâce à Sophie Boudarel, réagissant à cet article." class=’spip_out’ rel=’external’>Keyblog

[4Et telle n’est pas du tout mon intention.

[5Quel a priori ? Il y a longtemps que la page de Jean-Louis Garret est connue. Elle est digne de confiance. Mais, la mise à jour n’est pas facile.

[6Désolé pour les auteurs mais je ne lis pas tous les articles : seulement ceux dont la présentation me "parle" et ceux qui ont un titre qui m’intriguent. Pour savoir ce que je lis, voir Lectures quotidiennes 2016

Messages

  • Bonne analyse... Mais :

    Vous ne parlez pas des flux RSS !

    Pour ma part, je ne suis que les blogs qui possèdent un flux RSS dans le logiciel FEEDLY. Certes, tous les blogs n’ont pas un flux RSS...

    Je classe les blogs en actif, inactifs, peu actifs et enfin ceux qui se rapprochent de mes recherches généalogiques. Cela demande également un peu de temps pour faire le ménage régulièrement...

    • Bonsoir,

      j’ai sérieusement envisagé cette option mais cela disqualifiait trop de blogs. J’utilise un agrégateur (privé) mais la récupération des flux rss, atom... est compliqué entre ceux qui en ont, ceux qui n’en ont pas, ceux qui en ont un mais le cachent, ceux qui en ont un mais ne le savent même pas, ceux qui ne fonctionnent pas (ou mal)...
      Je n’y fais qu’allusion devant cette difficulté pour ne pas faire de discrimination (c’est à la mode).
      Restent à s’entendre sur les qualificatifs "actifs", "inactifs", "peu actifs"... Où sont les limites ? Quand un blog devient-il peu actif ? Quand devient-il inactif ? Pour ma part je ne retiens donc pas "peu actif" et j’ai mis la barrière à 365 jours sans publication. Choix arbitraire.

      Merci d’avoir pris le temps de commenter.

Un message, un commentaire ?

modération a priori

Ce forum est modéré a priori : votre contribution n’apparaîtra qu’après avoir été validée par un administrateur du site.

Qui êtes-vous ?
Votre message

Ce formulaire accepte les raccourcis SPIP [->url] {{gras}} {italique} <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

Dernières brèves
21 mars Mise à jour du CMS

Le site est passé sous Spip version 3.1.4. Voir https://blog.spip.net/Mise-a-jour-d...

22 décembre 2016 Forcer le rechargement à partir du cache dans Firefox

Si vous êtes prudent (et surtout si vous n’avez pas peur de faire une c...), passer la valeur du paramètre browser.cache.check_doc_frequency à 2 (...)

22 décembre 2016 Load from Cache

En faisant confiance à Denis Szalkowski (dans Deux hacks pour augmenter les performances de Firefox), j’ai installé l’extension Load from (...)

Généalogie MaLiBeLe