TPB sex study
Projet
Scraping de The Pirate Bay section ebooks top 100, plus précisément tout contenue en lien avec des pratiques sexuelles, la pornographie, aide au relation (souvent hétéronormé), pour voir l'évolution au cours du temps des contenues les plus téléchargé dans le top 100 ainsi
Outils
Tout d'abord, le diagram des entitées relationelles est créer grâce à yEd graph editor
Utilise le framework Python de webcrawling Scrapy et MariaDB comme base de donnée relationnelle.
À travers PHPMyAdmin, la création des tables
Secondaire mais important, la mise en place de proxy vers tor avec Docker, Docker-compose comme contenaire, des scripts divers et Scrapy pour acceder à The Pirate Bay en échapant au bloquage DNS(Dynamique Name System) par les ISP(Internet Service Providers), le site permettant le téléchargement de contenue proteger par le droit d'auteur et le copyright et donc illégale.
La configuration est expliper ici: