Emile F - FakenewsBrowser

De Design numérique
Révision datée du 14 mai 2019 à 13:35 par EmileFey (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
Aller à : navigation, rechercher

Introduire l'idée

Nous allons voir au travers de ce projet les bases du langage php ainsi que le fonctionnement d'une base de données mysql. Conçue pour classer des données auxquelles nous donnons nous même les valeurs souhaitées, l'intérêt de la base de données mysql se révèle lors ce qu'il faudra lui faire une requête. Au travers de la requête, nous le verrons, se manifeste tout l'intérêt de la BDD : manipuler et extrapoler les données choisies pour en dégager de nouvelles.

Source & Corpus

Choix de la source

Mon choix s'est porté sur le site Politifact qui recense les infos données par des politiques Américains et fait du fact-checking de manière sérieuse. Ils n'ont pas donné vraiment une forme de base donnée à leur site car on ne peut classer faits que par leur degré de véracité (allant de "true" à "pants on fire" (comprendre par là un "What The Fuck" moins familier).

Choix du corpus

Ci dessus l'intéressé

J'ai décidé de choisir comme corpus l'ensemble des faits énoncés par l'ami Donald Trump dont on trouvera la liste ici. Cet individu étant particulièrement connu pour ne pas prêter particulièrement attention à la véracité de ce qu'il énonce, on aura à coeur de répertorier ses frasques présidentielles au sein de cette base de donnée.

Définition des spécimens

Qu'est ce qu'un spécimen ?

Le spécimen c'est en gros l'unité de base des données que l'on va insérer dans la base de donnée, ici le spécimen est un fait énoncé par Trump, accompagné de son fact-checking par politifact.

le fact-checking résumé

lors ce que l'on clique sur cette fenêtre on accède à une page internet ou le fact-checking est détaillé, tout comme le sont les faits, ce qui nous permet de dresser la liste des valeurs qui définiront nos spécimens.

comment classer les spécimens ?

Nos spécimens seront encodés dans la base de donnée en fonction de ces variables :

  • l'url du fact-checking
  • la date ou le fait à été énoncé
  • les thèmes, à savoir :
    1. Chômage
    2. Wisconsin
    3. Environnement
    4. Énergie
    5. Pauvreté
    6. Ingérence Russe
    7. Politique

* Les moyens (par quel vecteur le fait est rendu public), à savoir :

    1. Un Discours
    2. Une réception
    3. Une Interview

* Le degré de mensonge (6 échelons de 'vrai' à 'WTF') * Les cibles du fait énoncé, à savoir :

    1. Le Parti Démocrate (USA)
    2. Les énergies vertes
    3. La Russie

Il serait pertinent d'ajouter que les valeurs numérotés qui définissent ces variables ont été déterminées arbitrairement en fonction des spécimens qui compose le corpus, ainsi, elles ne permettent de définir que les fact-checkings intégrés au corpus. Prétendre à incrémenter l'ensemble des fact-checkings à la base de données reviendrait à appréhender et encoder l'ensemble des thèmes/moyens/cibles surgissants des allégations de Trump. Ici on se contente d'une corpus composé de 7 fact-checkings.

Les spécimens choisis

Avec dans l'ordre :

  • l'url
  • le degré de fake
  • le(s) thème(s)
  • la date
  • le moyen
  • le(s) cible(s)


1- Sur le taux de chômage au Wisconsin

  • le lien url
  • Vrai
  • Chômage/Wisconsin
  • 27 Avril 2019
  • Discours
  • Pas de cible

2- Sur ses trophées pour l'environnement

  • le lien url
  • À moitié vrai
  • Environnement
  • 04 Avril 2019
  • Réception
  • Pas de cible

3- Sur l'énergie éolienne et le plan vert Démocrate

  • le lien url
  • Plutôt faux
  • Environnement/Énergie
  • 02 Mars 2019
  • Discours
  • Parti démocrate/Énergies vertes

4- Sur le taux de pauvreté du Wisconsin

  • le lien url
  • Faux
  • Pauvreté/Wisconsin
  • 27 Avril 2019
  • Discours
  • Pas de cible

5- Sur l'ingérence Russe dans les élections

  • le lien url
  • WTF
  • Ingérence Russe
  • 25 Avril 2019
  • Interview
  • Russie

6- Sur le bruit des éoliennes, cause de cancer (je déconne pas)

  • le lien url
  • WTF
  • Environnement/Énergie
  • 02 Avril 2019
  • Discours
  • Énergies vertes

7- Sur le contrôle politique du Wisconsin

  • le lien url
  • WTF
  • Environnement/Énergie
  • 28 Juin 2018
  • Discours
  • Parti Démocrate

Le Schema

à ce moment j'envisage encore des tables intermédiaires pour saisir plusieurs Thèmes/Cibles pour chaque spécimens ce qui me donnera du fil à retordre par la suite

Insertion des spécimens dans la BDD

voici la structure de la base donnée et les tables qui la composent

Une fois que les tables de la base de donnée ont été correctement définie et que chaque champs à été relié avec ses valeurs variables définies plus haut on peut commencer à insérer les spécimens dans la base donnée à l'aide de la touche "insert" depuis la table "fake news".

remplir ce tableau permet d'insérer un spécimen dans la base donnée

Faire une requête à la base de données

pour faire une requête à la base de donnée il faut rédiger un script .php dans lequel on spécifiera les infos que l'on cherche à mettre en tension à l'aide de commandes propres au langage .php :

  • SELECT

commande qui impose une sélection d'infos

  • FROM

indique ou chercher les infos

  • WHERE

Indique quelles infos chercher

  • AND

Ajoute une variable à la requête

Ainsi, "SELECT DEGRE FROM FAKENEWS WHERE DEGRE = '6' AND MOYEN FROM FAKENEWS WHERE MOYEN = '1'" cela revient à demander au script de chercher les spécimens ou le le degré de fake est de 6 (équivaut à WTF) et ou le moyen est de 1 (un discours).

les liens entre les fact-checkings

Voici les liens établis entre chaque variables pour les 7 fact-checking choisis :

Heptab.png


Cool ! mais à quoi ça sert ?

alors au delà de l'envie d'organiser les fakenews de Trump en proposant un outil allant plus loin que le site politifact (en mettant alors plus en perspectives les fact-checkings que ne le fait le site), je vois cette base de donnée comme un moyen de moquer l'actuel POTUS en le prenant à son propre jeu. En effet, le plus souvent, les fakenews de Trump viennent de l'interprétation très "personnelle" qu'il peut avoir des faits et des chiffres. L'idée serait donc d'utiliser la base de donnée et les formulaires de requête pour générer de nouvelles données, comme par exemple le mois ou Donald ment le plus, pour en tirer alors une vérité générale que l'on considérera comme allant de soi. En fait on produit nos propres fakenews !


Idée1.jpg


Voici une ébauche de ce à quoi pourrait ressembler une interprétation fictive d'une requête. Le format, au final, m'est encore inconnu. Je pense produire des graphiques en série sur ce principe et les rendre concrets en les faisant imprimer en affiche, en édition ou autre support imprimé. Proposer un recueil de ces fakenews à charge contre Trump.