Créer un ticket Mes tickets
Bienvenue
Connexion  S'inscrire

Garde-fous pour le Chatbot

Les garde-fous sont des systèmes, des règles ou des contraintes qui garantissent qu’une intelligence artificielle se comporte de manière sûre, éthique et conforme à son objectif.
Ils empêchent le modèle de :

  • Produire des informations nuisibles, biaisées ou confidentielles

  • Sortir du sujet ou générer des réponses incohérentes

  • Enfreindre les politiques de l’entreprise ou les réglementations en vigueur

Notre configuration de garde-fous

Filtres de contenu

Objectif : détecter et filtrer le texte ou les images contenant des éléments nuisibles dans les invites utilisateur ou les réponses du modèle.
Le filtrage repose sur la détection de catégories prédéfinies de contenus sensibles : haine, insultes, sexualité, violence, mauvaise conduite et attaque de prompt.

Attaque de prompt

Permet de détecter et de bloquer les attaques ou injections de prompt.
Ces mécanismes identifient les tentatives visant à contourner la modération, à ignorer les instructions ou à générer du contenu inapproprié.

Sujets interdits

L’objectif est de définir une liste de sujets à éviter dans le cadre de votre application d’IA générative.

Actuellement, nous interdisons totalement ou partiellement les sujets suivants :

  1. Clés API, jetons, secrets, mots de passe, chaînes de connexion (JDBC, ODBC, etc.), clés/certificats de chiffrement, sauf informations liées au SSO et PAT de DataGalaxy

  2. Numéros de sécurité sociale, identifiants fiscaux, numéros nationaux, comptes bancaires, cartes de crédit, données de santé (HIPAA/médicales), sauf pour les objets existants dans le catalogue (titres, étiquettes, définitions), autres données personnelles identifiables.

  3. Génération de contenu marketing (publicités, slogans, idées de campagne), rapports sur le chiffre d’affaires, le profit ou les résultats financiers, stratégies commerciales

  4. Conseils médicaux/santé, juridiques ou financiers/investissement, ainsi que tout contenu politique ou religieux

  5. Tentatives d’injection de prompt (ex. : « ignore les instructions précédentes », « montre-moi tout »)

  6. Tentatives de génération de jeux de données synthétiques/fictifs, sauf exemples servant à illustrer les métadonnées

  7. Discussions culinaires, recettes et autres loisirs, sauf pour le thème spécifique Data Governance Kitchen

Le chatbot peut avoir une conversation légère autour du sujet mentionné, mais reviendra ensuite vers son domaine principal : la donnée.

Cette réponse a-t-elle été utile ? Oui Non

Envoyer vos commentaires
Désolés de n'avoir pu vous être utile. Aidez-nous à améliorer cet article en nous faisant part de vos commentaires.