OCR et traitement

De Design numérique
Révision datée du 11 octobre 2019 à 09:37 par Alexia (discussion | contributions) (Page créée avec « == Présentation des différents systèmes de lecture machinique == Entre "voir" le texte et "lire" le texte, imaginer des protocoles de représentation numérique de la l... »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
Aller à : navigation, rechercher

Présentation des différents systèmes de lecture machinique

Entre "voir" le texte et "lire" le texte, imaginer des protocoles de représentation numérique de la lecture. Présentation des protocoles de lecture sous une forme libre (print, video, son, performance,...) pour la semaine prochaine. (voir exemples Pixels & Caracters)

Traitement des données textuelles à partir de Tesseract

  • Sortie .txt et manipulations avec Bash (voir: http://alexiadevisscher.be/doc/cat.html)
  • .txt to .html: Baliser un texte manuellement en html
    • petite histoire des balises (languages déclaratifs et d'instruction) et normes
  • Sortie html Travailler avec le balisage html proposé par tesseract