Contenus externes

En tant que gestionnaire de bot Dydu , vous avez la possibilité de centraliser et organiser vos sources de contenu externe directement depuis une interface intuitive dans le BMS, afin de générer des réponses instantanées basées sur ces sources et ainsi améliorer la qualité des réponses fournies aux utilisateurs finaux.

Créer une collection

Via le menu de navigation du BMS, vous avez la possibilité d'accéder à la page de Contenus externes : Contenus > Contenus externes.

Vous arrivez donc sur la page Edition de collection où vous pouvez en initier une première.

En cliquant sur la modale de Vos collections, vous devez choisir le nom de la collection que vous souhaitez créer et ensuite appuyez sur créer.

Une page de votre collection s'affiche comme montré ci-dessous :

Alimenter la collection

Importer vos documents

Il est possible d'importer un plusieurs documents de type : PDF, Docx, PPTX, TXT

Renseigner des Sharepoint

  • Le reader Sharepoint Dydu permet l'indexation des pages et des fichiers.

  • Il faut suivre cette documentation.

Il faut enregistrer dans votre tenant une nouvelle application, qui a les droits de lecture.

Le tutorial ci-dessous explique la démarche : https://learn.microsoft.com/en-us/azure/healthcare-apis/register-application

Lorsque vous arrivez à l'étape "API permissions", les 2 permissions nécessaires sont : - Microsoft Graph --> Application Permissions --> Files.ReadAll (Grant Admin Consent) - Microsoft Graph --> Application Permissions --> Sites.Selected (Grant Admin Consent)

  • Positionner les autorisations Files.ReadAll, Sites.Selected pour l'appli Dydu.

  • Les éléments requis pour la configuration sont :

a. clientId

b. client Secret (la valeur)

c. tenant Id

d. id du site Sharepoint

Détails des étapes nécessaires sur comment récupérer les valeurs requises depuis Azure pour la configuration LLM Dydu:

Aller sur le portail Azure:

  1. Cliquer sur inscriptions d'applications

  1. Cliquer sur Nouvelle inscription

  1. Donner un nom et cliquer sur "S'inscrire"

  1. L'ID d'application est le client_id

  1. Cliquer sur Certificats & secrets. Puis dans l'onglet "Secrets client" cliquer sur Nouveau secret client

  1. Cliquer sur Certificats & secrets

  1. Copier la Valeur du secret générée (client_secret)

  1. Cliquer sur API autorisées. Puis cliquer sur Ajouter une autorisation.

  1. Cliquer sur Microsoft Graph

  1. Ensuite sur "Autorisations d'application". Puis ajouter les autorisations Sites.Selected et Files.Read.All

  1. Cliquer sur Accorder un consentement d'administrateur pour XXXX

  1. Pour trouver le tenant ID:

Aller sur le site : https://entra.microsoft.com/

Cliquer sur "Vue d'ensemble":

ID du client correspond au tenant ID.

  1. Pour trouver le Sharepoint ID:

Composer l'URL suivante: https://<tenant>.sharepoint.com/sites/<site-url>/_api/site/id

Dans le résultat obtenu se trouve le sharepoint ID :

<d:Id
  xmlns:d="http://schemas.microsoft.com/ado/2007/08/dataservices"  
  xmlns:m="http://schemas.microsoft.com/ado/2007/08/dataservices/metadata"  
  xmlns:georss="http://www.georss.org/georss"
  xmlns:gml="http://www.opengis.net/gml"  
  m:type="Edm.Guid">
67a90b63-3384-495d-9456-66141cf4ac28
</d:Id>

  • Fonctionnalités :

  1. Indexer les pages et/ou les fichiers de tout un site sharepoint :

  • RAG standard

  • Affichage de l'URL d'origine du Sharepoint dans le résultat fourni par le RAG

  1. Couplage avec authentification SAML possible :

  • Un utilisateur doit être authentifié via SAML

  • Nous récupérons ses groupes d'appartenance

  • Un filtrage sur les permissions des documents est possible : accès à un sous ensemble dépendant des droits d'accès

Ne sont pas indexés :

  • Fichiers "embarqués" dans les pages

  • Les vidéos, et certains autres types (excel, wmf, ...)

Actuellement, l'opération de récupération des documents et l'indexation prend du temps (plusieurs minutes), le rafraîchissement le plus fréquent est 1 fois par jour.

Renseigner Smart Tribune

Pour paramètrer une source Smart tribune, il suffit les informations suivantes :

  • Nom : URL de l'API Smart tribune à utiliser.

  • Clé API

  • Secret API

  • Liste des identifiants des bases de connaissances : correspond aux IDs des bases de connaissances à récupérer (Une même combinaison de clé API / Secret API peut donner accès à plusieurs bases de connaissances.)

Sur la base de ces informations, tous les documents présents dans les bases de connaissances désignées sont récupérés via le canal FAQ.

Renseigner des Site web

Types de Sites Web :

  • Domaine

  • Sitemap

  • Une ou plusieurs URLs spécifiques

Les informations sur l'ajout de votre source à votre collection s'affichent comme suit :

  • Nom : le nom de votre source que vous avez ajouté

  • Ajouté par : l'identifiant du gestionnaire du bot

  • Date de création : date à laquelle vous avez ajouté votre source

  • Statut : Statut de votre source

Il existe quatre statuts :

  1. "En attente d'action" : statut quand aucune action n'a été effectuée.

  2. "Terminé avec succès" : statut quand l'opération (indexation ou suggestion) est réussie.

  3. "Terminé avec erreurs" : statut quand l'opération (indexation ou suggestion) a été effectuée mais qu'il y'a des erreurs.

  4. "En cours de traitement" : statut quand l'opération est en cours.

  • Action : les actions que vous pouvez mener sur votre source ajouté > supprimer , modifier.

Suggestion et Indexation

  • Suggérer des connaissances à partir de la collection

  • Indexer le contenu de la collection

Détail des éléments de la collection avec le statut "Terminé avec erreurs"

Une fois l'indexation ou la suggestion effectuée , il est possible qu'on obtienne un statut "Terminé avec erreurs".

En cliquant sur le statut, un rapport est affiché avec les détails d'erreurs.

  • Détail des erreurs issues de Sites Web :

Dans le détail du rapport, un pourcentage de succès et d'erreurs est indiqué.

Une répartition des codes d'erreurs http est présenté.

Les erreurs peuvent être classées en différentes catégories, telles que celles liées côté serveur ou autres.

  • Détail des erreurs issues des Sharepoints :

Dans le détail du rapport, un pourcentage de succès et d'erreurs est également indiqué.

Le rapport fournit des détails complets sur toutes les pages qui n'ont pas pu être récupérées, ainsi que sur les dossiers concernés.

Il précise également, pour chaque dossier, les fichiers spécifiques qui n'ont pas pu être récupérés, permettant ainsi une identification claire des éléments manquants

Configuration de la collection

Configurer les paramètres d’indexation d’une collection permet d’adapter précisément le comportement du bot à vos besoins métier et à l’expérience utilisateur souhaitée. Chaque collection dispose d’une card dédiée où vous pouvez ajuster plusieurs options afin d’optimiser la pertinence, la longueur et le style des réponses générées, ainsi que la sélection des sources d’information.

  • La température définit le style des réponses fournies par le bot : plus la température est élevée, plus les réponses peuvent être créatives ; à l’inverse, une température basse privilégie des réponses strictement factuelles. Ce réglage est particulièrement utile pour s’assurer que le ton et le niveau de créativité du bot correspondent à votre contexte d’utilisation.

  • Le nombre de tokens de sortie correspond à la longueur des réponses générées. Vous pouvez choisir entre des réponses courtes, moyennes ou détaillées selon la complexité des sujets traités ou la préférence de vos utilisateurs. Ajuster ce paramètre aide à fournir des informations plus synthétiques ou au contraire plus approfondies.

  • Le score minimum requis pour les sources des réponses permet de filtrer les documents utilisés par le bot : seules les sources dont le score est supérieur ou égal à la valeur définie seront prises en compte dans la génération des réponses et dans l’affichage des sources citées. Ce réglage garantit que seules les sources jugées suffisamment pertinentes ou fiables sont utilisées pour construire la réponse.

  • Le prompt additionnel offre la possibilité d’ajouter un contexte spécifique ou une instruction particulière qui sera systématiquement prise en compte lors de la génération des réponses pour la collection concernée. Ce champ texte libre permet par exemple d’imposer un ton, de préciser une consigne métier, ou d’orienter le bot sur un sujet sensible.

Des variables dynamiques peuvent être utilisées dans le prompt additionnel de chaque collection. Par exemple, ${capture.user_name} est remplacé automatiquement par la valeur réelle récupérée pendant la conversation ou depuis un web service.

Si une variable n’est pas disponible, elle est ignorée ou remplacée par une chaîne vide. Cela permet de personnaliser les instructions envoyées au moteur RAG, pour des réponses adaptées au contexte de chaque utilisateur.

Afin que les variables de capture soient correctement remplacées dans le prompt, il faut les ajouter aux paramètres du Web service : Dydu_RAG. Voici un exemple avec la variable de capture user_name :

Bien configurer ces paramètres vous permet d’obtenir des réponses adaptées, fiables et pertinentes, tout en maîtrisant la façon dont le bot interagit avec vos utilisateurs pour chaque collection de données indexée.

Réindexation automatique

Vous pouvez configurer la fréquence de réindexation des collections selon quatre modes : aucune, quotidienne, hebdomadaire ou mensuelle.

  • Aucune : aucune réindexation n’est programmée, les données restent inchangées.

  • Quotidienne : la réindexation est effectuée automatiquement chaque jour, à minuit.

  • Hebdomadaire : la réindexation a lieu chaque lundi à minuit.

  • Mensuelle : la réindexation s’effectue le premier lundi de chaque mois, à minuit.

Le jour et l’heure de la réindexation sont prédéfinis et ne peuvent pas être modifiés. Cette configuration vous permet d’adapter la fréquence de mise à jour des données selon vos besoins, tout en gardant le fonctionnement simple et automatique.

Mis à jour

Ce contenu vous a-t-il été utile ?