Conseils pour une recherche optimale
Cette page a été traduite par PageTurner AI (bêta). Non approuvée officiellement par le projet. Vous avez trouvé une erreur ? Signaler un problème →
DocSearch fonctionne avec presque tous les sites web, mais nous avons constaté que certaines structures de site produisent des résultats plus pertinents ou un temps d'indexation plus rapide. Cette page présente des conseils pour tirer le meilleur parti de DocSearch.
Utiliser un sitemap.xml
Si vous fournissez un sitemap dans votre configuration, DocSearch l'utilisera pour accéder directement aux pages à indexer. Les pages sont toujours crawlées, ce qui signifie que nous extrayons tous les liens conformes.
Nous vous recommandons vivement d'ajouter un sitemap.xml à votre site si vous n'en avez pas déjà un. Cela accélérera l'indexation et vous donnera plus de contrôle sur les pages à inclure ou non dans l'index.
Les sitemaps sont également considérés comme une bonne pratique pour d'autres aspects, notamment le référencement (plus d'informations sur les sitemaps).
Structurer la hiérarchie de l'information
DocSearch fonctionne mieux avec une documentation structurée. La pertinence des résultats repose sur la hiérarchie structurelle du contenu. En termes simples, nous lisons les balises <h1> à <h6> de votre page pour déduire la hiérarchie de l'information. Cette hiérarchie apporte un contexte à vos enregistrements.
Une documentation commence par expliquer des concepts généraux avant d'aborder des spécificités. Cela se traduit dans votre balisage HTML par la hiérarchie des titres utilisés. Par exemple, les concepts sous un <h4> sont plus spécifiques que ceux sous un <h2> dans la même page. Plus une information apparaît tôt dans la page, plus son classement est élevé.
DocSearch utilise cette structure pour affiner la pertinence des résultats et permettre un éventuel filtrage. Les documentations suivant ce modèle obtiennent généralement de meilleurs résultats de recherche.
Déterminer la profondeur optimale de votre arborescence documentaire et segmenter votre contenu sont deux tâches complexes. Pour les grandes pages, nous recommandons 4 niveaux (de lvl0 à lvl3). Un minimum de trois niveaux distincts est conseillé.
Notez que vous pouvez utiliser des classes plutôt que des balises <hX> (ex. <span class="title-X"> ). Vous devrez alors mettre à jour la valeur selectors dans votre configuration.