Typologie des risques IA
Grandes familles de risques
Les principaux travaux (AI Risk Repository, taxonomies MIT/IEEE, OWASP, MITRE ATLAS) identifient quatre grandes familles :
- Securite Risques techniques de securite (attaque, compromission).
- Surete / Abus Risques de surete et abus d'usage (detournement du modele).
- Donnees Risques de donnees (confidentialite, integrite, disponibilite).
- Systemiques Risques systemiques (dependance, concentration, effets de cascade).
Sources : AI Risk Repository (arxiv),
arxiv 2412.07780
Risques « classiques » etendus par l'IA
L'IA amplifie des risques deja connus en cybersecurite :
Vol de secrets via extraction de modele
Membership inference, inversion de donnees d'entrainement (training data extraction) permettent de retrouver des informations sensibles a partir du modele lui-meme.
Ref : arxiv 2510.02357
Supply chain IA
Dependance a des modeles tiers, a des API, a des jeux de donnees non maitrises. Un modele pre-entraine telecharge depuis un hub public peut contenir des backdoors.
Ref : arxiv 2504.00091
Deni de service cible
Adversarial traffic et surcout GPU sur les pipelines IA peuvent provoquer un deni de service cible.
Ref : arxiv 2506.04133
Risques specifiquement lies a l'IA
Integrite du modele
- Data poisoning — Pollution des donnees d'entrainement pour biaiser les predictions. [ref]
- Backdoors & trojans — Portes derobees dans les modeles importes depuis des sources tierces. [ref]
Attaques adversariales
- Exemples images/texte qui perturbent la prediction (vision par ordinateur, NLP). [IEEE]
- Attaques sur systemes federes (ex. imagerie medicale) pour manipuler des modeles distribues. [IEEE]
Prompt injection & attaques sur LLM
Vecteurs principaux : Contournement d'instructions, exfiltration de donnees, commande indirecte via prompt injection.
Le OWASP Top 10 for LLM documente en detail ces attaques.
Agents IA
Enchainement d'actions sur des systemes reels (RPA, outils API) et escalade d'impact. Un agent compromis peut executer des actions irreversibles sur des systemes de production.
Ref : Semantic Scholar
Deepfakes & contenus synthetiques
Impacts sur la fraude, la desinformation et la confiance dans les systemes. Les deepfakes audio et video permettent des attaques d'ingenierie sociale a grande echelle.
Ref : arxiv 2502.05324
Vue pipeline : Pensez au cycle complet collecte → entrainement → deploiement → monitoring et identifiez les risques a chaque etape.