Aller au contenu principal

Méthodologie

MÉTHODOLOGIE|PIPELINE DE DÉTECTION ET ALGORITHMES
PIPELINE DE DÉTECTION

Notre pipeline de détection surveille en temps réel les médias d’État, les médias partisans, les comptes de réseaux sociaux et les canaux Telegram. Chaque contenu passe par un processus d’analyse en plusieurs étapes :

1
Ingestion RSS (567 sources)->

567 sources surveillées en temps réel via RSS, API et scraping - médias d'État, relais partisans, canaux d'amplification.

2
Scoring de propagande et classification IA->

Scoring NLP des techniques de propagande, analyse de cadrage et pondération de crédibilité des sources.

3
Évaluation de la menace (1-5)->

Scoring de sévérité multi-facteurs : T1 (référence) à T5 (opération coordonnée inter-réseaux).

4
Détection de coordination inter-réseaux->

Analyse temporelle et sémantique pour détecter les poussées synchronisées à travers les médias d'État.

5
Recoupement fact-check

Croisement automatique avec les bases de fact-check vérifiées et les répertoires de démystification.

ALGORITHMES DE DÉTECTION
D3LTASIMILARITÉ

Similarité Jaccard > 0.5 entre différentes sources signale un contenu potentiellement coordonné. La coordination inter-réseaux (Russie + Chine poussant le même narratif) déclenche des alertes critiques.

BIGRAMVÉLOCITÉ

Analyse de bigrammes de mots-clés à travers 567 sources pour détecter les pics anormaux. Suspect lorsque publié d'abord par des médias d'État et amplifié simultanément par des réseaux de propagande.

GRAPHRÉSEAU

Analyse du graphe d'amplification source-à-source. Identifie les chaînes de relais (ex. CGTN -> RT) et quantifie les scores de propagation de 1 à 10.

SYNCTEMPOREL

Détection de synchronisation temporelle : articles publiés dans des fenêtres serrées à travers des réseaux non liés, suggérant des calendriers éditoriaux coordonnés.

RÉSEAUX ET OPÉRATIONS

Deux niveaux distincts

DisInfo Monitor classifie chaque source surveillée selon un réseau d'attribution, qui est une catégorie stable décrivant l'écosystème dont relève cette source : médias d'État russes, proxies russes en Afrique, médias chinois, MAGA américain, populistes radicaux européens, etc.

Une source appartient à un et un seul réseau. Cette classification est figée dans le temps, sauf décision éditoriale explicite.

Une opération d'influence est différente. Doppelganger, Storm-1516, Spamouflage, Pravda Network, Africa Corps sont des opérations spécifiques, c'est-à-dire des dispositifs documentés d'amplification coordonnée à un moment donné. Ces opérations utilisent des canaux qui font partie de réseaux plus larges. Doppelganger amplifie via le réseau fimi_ru_proxy mais le réseau fimi_ru_proxy ne se réduit pas à Doppelganger.

Une opération peut être attribuée à plusieurs réseaux quand elle est multi-acteurs. Une source peut servir plusieurs opérations différentes au cours de son existence.

DisInfo Monitor utilise donc :

le réseau d'attribution comme catégorie de base, stable et obligatoire
l'opération attribuée comme étiquette additionnelle, optionnelle et évolutive

Cette distinction permet de garder une grille d'analyse claire face à l'évolution rapide des dispositifs d'amplification.

NIVEAUX DE MENACE
T1RÉFÉRENCECouverture standard, aucune manipulation détectée.
T2BASLéger biais de cadrage ou affirmations non vérifiées.
T3ÉLEVÉTechniques de propagande claires, réseau unique.
T4FORTMessages coordonnés, amplification multi-sources.
T5CRITIQUEOpération coordonnée inter-réseaux, campagne de désinformation active.
LIMITES MÉTHODOLOGIQUES
Un signal indique un pattern de propagation - il ne constitue pas une preuve de coordination étatique.
Le scoring est algorithmique, pas éditorial. Les seuils sont documentés mais comportent des faux positifs.
La couverture est limitée aux sources intégrées au pipeline. L'absence d'une source ne garantit pas sa fiabilité.
Les analyses automatisées sont une aide à l'investigation, pas une conclusion.
DisInfo Monitor détecte des patterns de propagation, pas l'exactitude factuelle des contenus.
Les délais d'ingestion (polling toutes les 15-60 min) peuvent manquer des campagnes éphémères.