Contenus externes

En tant que gestionnaire de bot Dydu , vous avez la possibilité de centraliser et organiser vos sources de contenu externe directement depuis une interface intuitive dans le BMS, afin de générer des réponses instantanées basées sur ces sources et ainsi améliorer la qualité des réponses fournies aux utilisateurs finaux.

Via le menu de navigation du BMS, vous avez la possibilité d'accéder à la page de Contenus externes : Contenus > Contenus externes.

Vous arrivez donc sur la page Edition de collection où vous pouvez en initier une première.

En cliquant sur la modale de Vos collections, vous devez choisir le nom de la collection que vous souhaitez créer et ensuite appuyez sur créer.

Une page de votre collection s'affiche comme montré ci-dessous :

Sur cette page , vous avez la possibilité de :

Importer vos documents

Il est possible d'importer un plusieurs documents de type : PDF, Docx, PPTX, TXT

Renseigner des Sharepoint

  • Le reader Sharepoint Dydu permet l'indexation des pages et des fichiers.

  • Il faut suivre cette documentation.

Il faut enregistrer dans votre tenant une nouvelle application, qui a les droits de lecture.

Le tutorial ci-dessous explique la démarche : https://learn.microsoft.com/en-us/azure/healthcare-apis/register-application

Lorsque vous arrivez à l'étape "API permissions", les 2 permissions nécessaires sont : - Microsoft Graph --> Application Permissions --> Files.ReadAll (Grant Admin Consent) - Microsoft Graph --> Application Permissions --> Sites.Selected (Grant Admin Consent)

  • Positionner les autorisations Files.ReadAll, Sites.Selected pour l'appli Dydu.

  • Les éléments requis pour la configuration sont :

a. clientId

b. client Secret (la valeur)

c. tenant Id

d. id du site Sharepoint

Détails des étapes nécessaires sur comment récupérer les valeurs requises depuis Azure pour la configuration LLM Dydu:

Aller sur le portail Azure:

  1. Cliquer sur inscriptions d'applications

  1. Cliquer sur Nouvelle inscription

  1. Donner un nom et cliquer sur "S'inscrire"

  1. L'ID d'application est le client_id

  1. Cliquer sur Certificats & secrets. Puis dans l'onglet "Secrets client" cliquer sur Nouveau secret client

  1. Cliquer sur Certificats & secrets

  1. Copier la Valeur du secret générée (client_secret)

  1. Cliquer sur API autorisées. Puis cliquer sur Ajouter une autorisation.

  1. Cliquer sur Microsoft Graph

  1. Ensuite sur "Autorisations d'application". Puis ajouter les autorisations Sites.Selected et Files.Read.All

  1. Cliquer sur Accorder un consentement d'administrateur pour XXXX

  1. Pour trouver le tenant ID:

Aller sur le site : https://entra.microsoft.com/

Cliquer sur "Vue d'ensemble":

ID du client correspond au tenant ID.

  1. Pour trouver le Sharepoint ID:

Composer l'URL suivante: https://<tenant>.sharepoint.com/sites/<site-url>/_api/site/id

Dans le résultat obtenu se trouve le sharepoint ID :

<d:Id
  xmlns:d="http://schemas.microsoft.com/ado/2007/08/dataservices"  
  xmlns:m="http://schemas.microsoft.com/ado/2007/08/dataservices/metadata"  
  xmlns:georss="http://www.georss.org/georss"
  xmlns:gml="http://www.opengis.net/gml"  
  m:type="Edm.Guid">
67a90b63-3384-495d-9456-66141cf4ac28
</d:Id>

  • Fonctionnalités :

  1. Indexer les pages et/ou les fichiers de tout un site sharepoint :

  • RAG standard

  • Affichage de l'URL d'origine du Sharepoint dans le résultat fourni par le RAG

  1. Couplage avec authentification SAML possible :

  • Un utilisateur doit être authentifié via SAML

  • Nous récupérons ses groupes d'appartenance

  • Un filtrage sur les permissions des documents est possible : accès à un sous ensemble dépendant des droits d'accès

Ne sont pas indexés :

  • Fichiers "embarqués" dans les pages

  • Les vidéos, et certains autres types (excel, wmf, ...)

Actuellement, l'opération de récupération des documents et l'indexation prend du temps (plusieurs minutes), le rafraîchissement le plus fréquent est 1 fois par jour.

Renseigner Smart Tribune

Pour paramètrer une source Smart tribune, il suffit les informations suivantes :

  • Nom : URL de l'API Smart tribune à utiliser.

  • Clé API

  • Secret API

  • Liste des identifiants des bases de connaissances : correspond aux IDs des bases de connaissances à récupérer (Une même combinaison de clé API / Secret API peut donner accès à plusieurs bases de connaissances.)

Sur la base de ces informations, tous les documents présents dans les bases de connaissances désignées sont récupérés via le canal FAQ.

Renseigner des Site web

Types de Sites Web :

  • Domaine

  • Sitemap

  • Une ou plusieurs URLs spécifiques

Les informations sur l'ajout de votre source à votre collection s'affichent comme suit :

  • Nom : le nom de votre source que vous avez ajouté

  • Ajouté par : l'identifiant du gestionnaire du bot

  • Date de création : date à laquelle vous avez ajouté votre source

  • Statut : Statut de votre source

Il existe quatre statuts :

  1. "En attente d'action" : statut quand aucune action n'a été effectuée.

  2. "Terminé avec succès" : statut quand l'opération (indexation ou suggestion) est réussie.

  3. "Terminé avec erreurs" : statut quand l'opération (indexation ou suggestion) a été effectuée mais qu'il y'a des erreurs.

  4. "En cours de traitement" : statut quand l'opération est en cours.

  • Action : les actions que vous pouvez mener sur votre source ajouté > supprimer , modifier.

Suggestion et Indexation

  • Suggérer des connaissances à partir de la collection

  • Indexer le contenu de la collection

Détail des éléments de la collection avec le statut "Terminé avec erreurs"

Une fois l'indexation ou la suggestion effectuée , il est possible qu'on obtienne un statut "Terminé avec erreurs".

En cliquant sur le statut, un rapport est affiché avec les détails d'erreurs.

  • Détail des erreurs issues de Sites Web :

Dans le détail du rapport, un pourcentage de succès et d'erreurs est indiqué.

Une répartition des codes d'erreurs http est présenté.

Les erreurs peuvent être classées en différentes catégories, telles que celles liées côté serveur ou autres.

  • Détail des erreurs issues des Sharepoints :

Dans le détail du rapport, un pourcentage de succès et d'erreurs est également indiqué.

Le rapport fournit des détails complets sur toutes les pages qui n'ont pas pu être récupérées, ainsi que sur les dossiers concernés.

Il précise également, pour chaque dossier, les fichiers spécifiques qui n'ont pas pu être récupérés, permettant ainsi une identification claire des éléments manquants

Dernière mise à jour

Cet article vous a-t-il été utile ?