Chunking
Le chunking désigne la manière dont les modèles de langage (LLM) découpent et ingèrent le contenu web par morceaux pour le traiter. Un contenu bien structuré en HTML sémantique facilite ce découpage et augmente les chances d'être cité par les IA.
Pour optimiser le chunking, il faut utiliser des balises HTML sémantiques correctes (H1, H2, H3, P, UL), éviter le JavaScript complexe qui masque le contenu aux crawlers IA, et privilégier le texte HTML pur. Chaque section doit traiter un sujet précis et être compréhensible de manière autonome.