14/54 études qui en parlent 25.9% du corpus
1.72/10 moyenne sur le corpus 54 études (zéros inclus)
6.64/10 moyenne hors zéros sur 14 études

Définition

La longueur mesure le volume textuel d'une page (compte de mots). Shepard signale un signal mixte : « beaucoup d'études ont regardé comment la longueur du contenu corrélait avec les citations IA. Alors que la majorité trouvait que le contenu plus long performait mieux, les preuves étaient inconsistantes. Plusieurs chercheurs ont souligné que le contenu plus long réduisait aussi la probabilité que les moteurs IA récupèrent tout le contenu ».

14 études du corpus le couvrent (25,9 %). Shepard le classe au rang 17 sur 23 (score 6,7 / 10). Caveat explicite : le contenu trop long peut être incomplètement retrouvé par le pipeline de retrieval.

Comment l'auditer sur une page

  • Pas de cible de mots arbitraire : bannir les briefs « article de 2500 mots minimum ». Calibrer selon la richesse du sujet.
  • Comparer au top 10 Google sur la requête : établir la médiane et l'écart-type. Une page nettement plus courte ou plus longue que le top 10 mérite justification.
  • Densité informationnelle : ratio faits citables / mots. Une page courte dense bat une page longue diluée.
  • Limite haute : 3000-4000 mots : au-delà, la fenêtre de retrieval peut couper. Si le sujet le justifie, scinder en plusieurs feuilles d'un même hub thématique.
  • Signal mixte : ne pas en faire une obsession. Travailler la spécificité factuelle et la structure plutôt que le compte de mots.
Études qui le valident fortement (score ≥ 7) 8