Utilisateur:Claudia Auricchio

De Design numérique
Aller à : navigation, rechercher

Scan to OCR

Comment une machine peut-elle reconnaître du texte ?

1. Reconnaissance noir et blanc, où il y a quelque chose et où il n'y en a pas.
2. Reconnaissance noir et blanc, où il y a quelque chose et où il n'y en a pas.
3. Reconnaissance de l'horizontalité et de la verticalité.
4. Synthèse de l'image pour la compréhension de la grille.
5. Synthèse de l'image pour la compréhension de la grille.
6. Recherche des lignes de base ?



Conférence DiVersions

Une conférence sur l'archivage numérique, au cours de laquelle des travaux sur la classification de différents contenus (œuvres d'art, plantes...) ont été présentés.
Une question qui a émergé pendant la réunion était la suivante : nous essayons de rendre les programmes parfaits et plus intelligents, mais il y aura toujours quelque chose que la machine percevra mal, il serait donc intéressant de comprendre ce que vous pouvez faire avec l'erreur au lieu de l'endiguer.

Traiter des fichiers avec Tesseract

J'ai scanné une page contenant plusieurs éléments que j'ai trouvé intéressant d'observer comment ils pouvaient être compris par le programme, comme du texte disposé sur différentes colonnes, des annotations et des soulignements au stylo ou au crayon. Il est intéressant de noter que le programme a d'abord lu le numéro de page et l'en-tête (sur la même ligne horizontale), qu'il a poursuivi la lecture verticale de la colonne consacrée aux citations, qu'il a probablement transformé en caractères texte des signes au crayon au bas, puis a continué avec la lecture de la colonne consacrée au texte principal.

18

La via dell’artista

 

Dipingo non con la vista ma con la fede.
La fede ti dà la vista.

Amos FERGUSON

Perché mai dovremmo utilizzare tutti il
nostro potere creativo? Perché non vi è
nulla che reride le persone così
generose, gioiose, vivaci, audaci .e
compassionevoli, così indifferenti alla
guerra © all'accumulare oggetti e
denaro.

e
nà

BRENDA UELAND

 

li settimanali: non fatevi intimidire dalla mole di lavoro che sembra
comportare; molta parte è,.in realtà, gioco e vi impegnerà un po’ più
di un’ora al giorno. Quando insegno, suggerisco ai miei studenti di
procedere su base settimanale. Per esempio, se lavorate dal lunedì al
sabato, cominciate a leggere la prima settimana la domenica sera,
facendo gli esercizi subito dopo la lettura. Gli esercizi di ogni setti-
mana sono piuttosto importanti e cruciali e altrettanto lo sono le pa-
gine del mattino e gli appuntamenti con l'artista (maggiori dettagli
verranno dati nei prossimi capitoli). Probabilmente nel resto della
settimana non avrete tempo per tutti gli altri compiti: provate co-
munque a completarne la metà, sapendo che quelli restanti riman-
gono comunque validi per quando avrete tempo di riprenderli. Nel-
lo scegliere quale metà dei compiti fare, usate due criteri: scegliete
quelli che vi attirano maggiormente e quelli cui resistete più forte-
mente, destinando quelli che vi lasciano indifferenti a un altro mo-
mento. Ricordate che spesso ci opponiamo a ciò di cui abbiamo
maggior bisogno. SI
In tutto, impegnatevi a dedicare a questi compiti da sette a dieci
ore alla settimana (compresa la domenica), per un minimo di un’ora

al giorno o più, se volete.

‘ Questo modesto impegno può condurre a risultati sorprendenti
entro la fine delle dodici settimane del corso. Qualora gli strumenti
vengano usati per un periodo più lungo, possono cambiare il per-
corso di una vita.

“Nel lavorare con questo libro, ricordate che la via dell'artista è a
spirale: tornerete più volte a girare intorno ad alcuni dei problemi,
ra ogni volta a un livello differente. In una vita artistica, non vi è
nulla che somigli a un traguardo, perché frustrazioni e gratificazio-
ni esistono a tutti i livelli. Il nostro scopo, a questo punto, è trovare
la via, scoprire i punti d'appoggio e cominciare la scalata. Ben pre-
sto, i panorami creativi che vi si spalancheranno davanti vi incorag-
geranno.

Che cosa aspettarsi

Molti di noi vorrebbero essere più creativi e molti di noi avvertono
che lo potrebbero essere, se solo fossero in grado di stimolare la
creatività. I nostri sogni si sottraggono a noi, le nostre vite ci sem-

J'ai expérimenté un peu avec la commande cat, par exemple en remplaçant certaines lettres par des chiffres, par la commande suivante :

cat output.txt | tr i 1 | tr a 4 | tr o 0 | tr b 8 | tr s 5 | tr I 1 | tr A 4 | tr O 0 | tr B 8 | tr S 5

Voici le résultat:

18

L4 v14 dell’4rt15t4

 

D1p1ng0 n0n c0n l4 v15t4 m4 c0n l4 fede.
L4 fede t1 dà l4 v15t4.

4m05 FERGU50N

Perché m41 d0vremm0 ut1l1zz4re tutt1 1l
n05tr0 p0tere cre4t1v0? Perché n0n v1 è
null4 che rer1de le per50ne c05ì
gener05e, g10105e, v1v4c1, 4ud4c1 .e
c0mp45510nev0l1, c05ì 1nd1fferent1 4ll4
guerr4 © 4ll'4ccumul4re 0ggett1 e
den4r0.

e
nà

8REND4 UEL4ND

 

l1 5ett1m4n4l1: n0n f4tev1 1nt1m1d1re d4ll4 m0le d1 l4v0r0 che 5em8r4
c0mp0rt4re; m0lt4 p4rte è,.1n re4ltà, g10c0 e v1 1mpegnerà un p0’ p1ù
d1 un’0r4 4l g10rn0. Qu4nd0 1n5egn0, 5ugger15c0 41 m1e1 5tudent1 d1
pr0cedere 5u 845e 5ett1m4n4le. Per e5emp10, 5e l4v0r4te d4l lunedì 4l
5484t0, c0m1nc14te 4 leggere l4 pr1m4 5ett1m4n4 l4 d0men1c4 5er4,
f4cend0 gl1 e5erc1z1 5u81t0 d0p0 l4 lettur4. Gl1 e5erc1z1 d1 0gn1 5ett1-
m4n4 50n0 p1utt05t0 1mp0rt4nt1 e cruc14l1 e 4ltrett4nt0 l0 50n0 le p4-
g1ne del m4tt1n0 e gl1 4ppunt4ment1 c0n l'4rt15t4 (m4gg10r1 dett4gl1
verr4nn0 d4t1 ne1 pr0551m1 c4p1t0l1). Pr08481lmente nel re5t0 dell4
5ett1m4n4 n0n 4vrete temp0 per tutt1 gl1 4ltr1 c0mp1t1: pr0v4te c0-
munque 4 c0mplet4rne l4 metà, 54pend0 che quell1 re5t4nt1 r1m4n-
g0n0 c0munque v4l1d1 per qu4nd0 4vrete temp0 d1 r1prenderl1. Nel-
l0 5cegl1ere qu4le metà de1 c0mp1t1 f4re, u54te due cr1ter1: 5cegl1ete
quell1 che v1 4tt1r4n0 m4gg10rmente e quell1 cu1 re515tete p1ù f0rte-
mente, de5t1n4nd0 quell1 che v1 l45c14n0 1nd1fferent1 4 un 4ltr0 m0-
ment0. R1c0rd4te che 5pe550 c1 0pp0n14m0 4 c1ò d1 cu1 48814m0
m4gg10r 8150gn0. 51
1n tutt0, 1mpegn4tev1 4 ded1c4re 4 que5t1 c0mp1t1 d4 5ette 4 d1ec1
0re 4ll4 5ett1m4n4 (c0mpre54 l4 d0men1c4), per un m1n1m0 d1 un’0r4

4l g10rn0 0 p1ù, 5e v0lete.

‘ Que5t0 m0de5t0 1mpegn0 può c0ndurre 4 r15ult4t1 50rprendent1
entr0 l4 f1ne delle d0d1c1 5ett1m4ne del c0r50. Qu4l0r4 gl1 5trument1
veng4n0 u54t1 per un per10d0 p1ù lung0, p0550n0 c4m814re 1l per-
c0r50 d1 un4 v1t4.

“Nel l4v0r4re c0n que5t0 l18r0, r1c0rd4te che l4 v14 dell'4rt15t4 è 4
5p1r4le: t0rnerete p1ù v0lte 4 g1r4re 1nt0rn0 4d 4lcun1 de1 pr08lem1,
r4 0gn1 v0lt4 4 un l1vell0 d1fferente. 1n un4 v1t4 4rt15t1c4, n0n v1 è
null4 che 50m1gl1 4 un tr4gu4rd0, perché fru5tr4z10n1 e gr4t1f1c4z10-
n1 e515t0n0 4 tutt1 1 l1vell1. 1l n05tr0 5c0p0, 4 que5t0 punt0, è tr0v4re
l4 v14, 5c0pr1re 1 punt1 d'4pp0gg10 e c0m1nc14re l4 5c4l4t4. 8en pre-
5t0, 1 p4n0r4m1 cre4t1v1 che v1 51 5p4l4ncher4nn0 d4v4nt1 v1 1nc0r4g-
ger4nn0.

Che c054 45pett4r51

M0lt1 d1 n01 v0rre88er0 e55ere p1ù cre4t1v1 e m0lt1 d1 n01 4vvert0n0
che l0 p0tre88er0 e55ere, 5e 50l0 f055er0 1n gr4d0 d1 5t1m0l4re l4
cre4t1v1tà. 1 n05tr1 50gn1 51 50ttr4gg0n0 4 n01, le n05tre v1te c1 5em-

Balisage des pages : Print Party

Session balisage des fichiers textes sortis par Tesseract (en HTML). J'ai balisé en identifiant d'abord les éléments de la page (numéro de page, en-tête, citations, paragraphes, titre de paragraphe), puis j'ai analysé les informations manquantes ou incorrectes ("mauvaise_compréhension_maj_min", "caractère_mal_compris", "caractère_ajouté", "tiret_superflue", "tab_manquant"), notant également toute correction ("caractère_corrigé").

<!doctype html>

<html>
<head>
    
    <link rel="stylesheet" href="style.css">
</head>

<body author="Julia Cameron" lang="ita">

    <section class="page" data-type="page" data-pagenb="18">
        
        <header>La via dell'artista</header>
       
        <aside data-status="citation"> Dipingo non con la vista ma con la fede. La fede ti dà la vista.
            <span data-type="auteur_citation">A<span data-type="mauvaise_compréhension_maj_min">mos</span> FERGUSON</span>
        </aside>
        
        <aside data-status="citation">Perché mai dovremmo utilizzare tutti il
nostro potere creativo? Perché non vi è nulla che re<span data-type="caractère_mal_compris">ri</span><span datatype="caractère_corrigé">n</span>de le persone così generose, gioiose, vivaci, audaci <span data-type="caractère_ajouté">.</span>e compassionevoli, così indifferenti alla guerra <span datatype="caractère_mal_compris">©</span><span datatype="caractère_corrigé">e</span> all'accumulare oggetti e denaro.
        <span data-type="auteur_citation">BRENDA UELAND</span>
        </aside>

    <p data-status="chapitre"> li settimanali: non fatevi intimidire dalla mole di lavoro che sembra
comportare; molta parte è,<span data-type="caractère_ajouté">.</span><span datatype="caractère_corrigé"> </span>in realtà, gioco e vi impegnerà un po’ più di un’ora al giorno. Quando insegno, suggerisco ai miei studenti di procedere su base settimanale. Per esempio, se lavorate dal lunedì al sabato, cominciate a leggere la prima settimana la domenica sera, facendo gli esercizi subito dopo la lettura. Gli esercizi di ogni setti<span data-type="tiret_superflue">-</span>mana sono piuttosto importanti e cruciali e altrettanto lo sono le pa<span data-type="tiret_superflue">-</span>gine del mattino e gli appuntamenti con l'artista (maggiori dettagli verranno dati nei prossimi capitoli). Probabilmente nel resto della settimana non avrete tempo per tutti gli altri compiti: provate co<span data-type="tiret_superflue">-</span>munque a completarne la metà, sapendo che quelli restanti riman<span data-type="tiret_superflue">-</span>gono comunque validi per quando avrete tempo di riprenderli. Nel<span data-type="tiret_superflue">-</span>lo scegliere quale metà dei compiti fare, usate due criteri: scegliete quelli che vi attirano maggiormente e quelli cui resistete più forte<span data-type="tiret_superflue">-</span>mente, destinando quelli che vi lasciano indifferenti a un altro mo<span data-type="tiret_superflue">-</span> mento. Ricordate che spesso ci opponiamo a ciò di cui abbiamo maggior bisogno. <span data-type="caractère_ajouté">SI</span> 
<span data-type="tab_manquant">&nbsp;&nbsp;&nbsp;&nbsp;</span>In tutto, impegnatevi a dedicare a questi compiti da sette a dieci ore alla settimana (compresa la domenica), per un minimo di un’ora al giorno o più, se volete.
<span data-type="tab_manquant">&nbsp;&nbsp;&nbsp;&nbsp;</span><span data-type="caractère_ajouté"></span> Questo modesto impegno può condurre a risultati sorprendenti entro la fine delle dodici settimane del corso. Qualora gli strumenti
vengano usati per un periodo più lungo, possono cambiare il per<span data-type="tiret_superflue">-</span>corso di una vita.
<span data-type="tab_manquant">&nbsp;&nbsp;&nbsp;&nbsp;</span><span data-type="caractère_ajouté"></span>Nel lavorare con questo libro, ricordate che la via dell'artista è a spirale: tornerete più volte a girare intorno ad alcuni dei problemi, <span datatype="caractère_mal_compris">r</span><span data-type="caractère-corrigé">m</span>a ogni volta a un livello differente. In una vita artistica, non vi è nulla che somigli a un traguardo, perché frustrazioni e gratificazio<span data-type="tiret_superflue">-</span>ni esistono a tutti i livelli. Il nostro scopo, a questo punto, è trovare la via, scoprire i punti d'appoggio e cominciare la scalata. Ben pre<span data-type="tiret_superflue">-</span>sto, i panorami creativi che vi si spalancheranno davanti vi incorag<span data-type="tiret_superflue">-</span>geranno.
    </p>
        
<aside data-type="caractère_ajouté">e nà</aside>
        
    <h3>Che cosa aspettarsi</h3>
        
        <p>Molti di noi vorrebbero essere più creativi e molti di noi avvertono
che lo potrebbero essere, se solo fossero in grado di stimolare la
creatività. I nostri sogni si sottraggono a noi, le nostre vite ci sem-
        </p>
    
    </section>
    
    </body>

</html>