Garde-fous pour le Chatbot : DataGalaxy

Les garde-fous sont des systèmes, des règles ou des contraintes qui garantissent qu’une intelligence artificielle se comporte de manière sûre, éthique et conforme à son objectif.
Ils empêchent le modèle de :

Produire des informations nuisibles, biaisées ou confidentielles
Sortir du sujet ou générer des réponses incohérentes
Enfreindre les politiques de l’entreprise ou les réglementations en vigueur

Notre configuration de garde-fous

Filtres de contenu

Objectif : détecter et filtrer le texte ou les images contenant des éléments nuisibles dans les invites utilisateur ou les réponses du modèle.
Le filtrage repose sur la détection de catégories prédéfinies de contenus sensibles : haine, insultes, sexualité, violence, mauvaise conduite et attaque de prompt.

Attaque de prompt

Permet de détecter et de bloquer les attaques ou injections de prompt.
Ces mécanismes identifient les tentatives visant à contourner la modération, à ignorer les instructions ou à générer du contenu inapproprié.

Sujets interdits

L’objectif est de définir une liste de sujets à éviter dans le cadre de votre application d’IA générative.

Actuellement, nous interdisons totalement ou partiellement les sujets suivants :

Clés API, jetons, secrets, mots de passe, chaînes de connexion (JDBC, ODBC, etc.), clés/certificats de chiffrement, sauf informations liées au SSO et PAT de DataGalaxy
Numéros de sécurité sociale, identifiants fiscaux, numéros nationaux, comptes bancaires, cartes de crédit, données de santé (HIPAA/médicales), sauf pour les objets existants dans le catalogue (titres, étiquettes, définitions), autres données personnelles identifiables.
Génération de contenu marketing (publicités, slogans, idées de campagne), rapports sur le chiffre d’affaires, le profit ou les résultats financiers, stratégies commerciales
Conseils médicaux/santé, juridiques ou financiers/investissement, ainsi que tout contenu politique ou religieux
Tentatives d’injection de prompt (ex. : « ignore les instructions précédentes », « montre-moi tout »)
Tentatives de génération de jeux de données synthétiques/fictifs, sauf exemples servant à illustrer les métadonnées
Discussions culinaires, recettes et autres loisirs, sauf pour le thème spécifique Data Governance Kitchen

Le chatbot peut avoir une conversation légère autour du sujet mentionné, mais reviendra ensuite vers son domaine principal : la donnée.

French

Notre configuration de garde-fous

Filtres de contenu

Attaque de prompt

Sujets interdits

Table des matières

Articles en rapport