Reconeixement òptic de caractersLʼOCR:
introducció
• Es tracta dʼuna de les aplicacions més comunes dels escàners.
• OCR són les sigles dʼOptical Character Recognition, reconeixement òptic de caracters, o amb una descripció més senzilla: cóm fer per a ensenyar a llegir a lʼordinador.
• El que desitjariem en definitiva seria que lʼordinador sapiguès llegir com nosaltres.
• Doncs bé, això ho fa lʼOCR: és un programa que llegeix aquestes imatges digitals i busca conjunts de punts que sʼassemblin a lletres, a caracters.
• Depenén de la complexitat dʼaquest programa, entendrà més o menys tipus de lletres, arrivant en alguns casos a interpretar lʼescritura manual, mantenir el format original (columnes, fotos entre el text...) o a aplicar regles gramaticals per a augmentar la exactitud del procés de reconeixement.
• Perquè el programa pugui realitzar aquestes tasques amb una certa fiabilitat, sense confondre «t» amb «1»,
per exemple, la imatge que li proporcionem ha de complir unes certes característiques.
• Fonamentalment ha de tenir una gran resolució, uns 300 ppp per a textes amb tipus de lletra clars o 600 ppp si es tracta de tipus de lletra petits u originals de poca qualitat com els diaris.
• Per contra, podem estalviar en lʼaspecte del color: gairebé sempre serà suficient amb blanc i negre (1 bit de color), o com a màxim una escala de 256 grisos (8 bits).
• Per aquest motiu a alguns escàners de corró (molt apropiats per a aquest tipus de tasques) els hi manca suport per al color.
• Si pensem una mica en el procés de escanejat que hem descrit anteriorment, ens nʼadonarem de que a lʼescanejar un texte no sʼescanejen lletres, paraules i frases, sinó senzillament els punts que les formen, una mena de fotografia del texte.
• Evidentement, això pot ser útil per a arxivar textes, però seria desitjable que poguessim agafar totes aquestes referències tan interesants però tan feixugues i incorporar-les al nostre processador de texte no com una imatge, sinó com texte editable.
LʼOCR: optimització dels recursos
• En els últims anys la digitalització de la informació (textes, imatges, so, etc.) s’ha convertit en un punt d’interès per la societat.
• En el cas concret dels textes, existeixen i es generen contínuament grans quantitats d’informació escrita, tipogràfica o manuscrita en tot tipus de suport.
• En aquest context, poder automatitzar la introducció de caràcters evitant l’entrada per teclat, implica un important estalvi de recursos humans i un augment de la productivitat al mateix temps que es manté o fins i tot es millora la qualitat de molts serveis.
• Identifiquen automàticament símbols o caràcters, que pertanyen a un determinat alfabet, a partir d’una imatge per emmagatzemar-ho en forma de dades amb les que podrem interactuar amb un programa d’edició de text o similars.
LʼOCR: problemes en el reconeixement òptic de caracters
• El procés bàsic que es du a terme en el Reconeixement Òptic de Caràcters és convertir el text que apareix en una imatge en dades que podran ser editades i utilitzades com a tal per qualsevol programa o aplicació que les necessiti.
• Partint d’una imatge perfecta, es a dir, una imatge de dos nivells de gris, el reconeixement d’aquests caràcters es realitzara bàsicament comparant-los amb uns patrons o plantilles que contenen tots els possibles caràcters.
• Ara be, les imatges reals no són perfectes, per tant el Reconeixement Òptic Caràcters es troba amb diversos problemes:
•El dispositiu que obté la imatge pot introduir nivells de grisos en el fons que no pertanyen a la imatge original.
•La resolució d’aquest dispositius pot introduir soroll a la imatge, afectant als píxels que han de ser processats.
•La separació dels caràcters. Al no existir un espai fix entre ells, pot produir errors a la hora del reconeixement.
•La connexió de dos o mes caràcters per píxels comuns també pot produir errors.
Esquema bàsic dʼun algorisme de Reconeixement Òptic de Caràcters
• Tots els algorismes de Reconeixement Òptic de Caràcters tenen la finalitat de poder reconèixer un text d’una imatge qualsevol per poder-lo tractar posteriorment.
• Per tal de fer-ho es basen en 4 passos:
Binarització
• La major part d’algorismes d’OCR parteixen de la base d’una imatge binaria (dos colors) per tant és convenient convertir una imatge amb escala de grisos, o color, en una en blanc i negre, de tal manera que es preservin les propietats essencials de la imatge.
• Una forma de fer-ho es mitjançant l’histograma de la imatge on es mostra el nombre de píxels per cada nivell de gris que apareix a la imatge.
• Per binaritzar-la haurem de triar un llindar adequat, a partir del qual tots els píxels que no el superin es convertiran en negre i la resta en blanc.
• Mitjançant aquest procés obtenim una imatge en blanc i negre on queden clarament marcats els contorns dels caràcters i símbols que conté la imatge.
• A partir d’aquí podem aïllar les parts de la imatge que contenen text (més transicions entre blanc i negre).
Fragmentació o segmentació de la imatge
• Aquest és el procés més costós i necessari pel posterior reconeixement de caràcters.
• La segmentació d’una imatge implica la detecció mitjançant procediments d’etiquetat determinista o estocàstic, dels contorns o regions de la imatge, basant-se en la informació d’intensitat o informació espacial.
• Permet la descomposició d’un text en diferents entitats lògiques, que han de ser suficientment invariables, per ser independents del escriptor, i suficientment significatives pel seu reconeixement.
• No existeix un mètode genèric per du a terme aquesta segmentació de la imatge que sigui suficientment eficaç per l’anàlisi d’un text.
• Tot i això les tècniques més utilitzades són variacions dels mètodes basats en projeccions lineals.
• Una de les tècniques més clàssiques i simples per imatges de nivell de gris consisteix en la determinació dels modes o agrupaments (‘clusters’) a partir de l’histograma, de tal manera que permet una classificació o llindarització dels píxels en regions homogènies.
• Existeixen altres mètodes com per exemple:
– el detector de contorns de Sobel – l’operador de Kirsch – el detector de contorn de Marr-Hildert – el detector de contorns de Canny...
3. Simplificació de les components
• Un cop aïllades les components connexes de la imatge s’haurà d’aplicar un procés de simplificació per a cada una d’elles.
• Aquest procediment consisteix en anar esborrant successivament els punts dels contorns de cada component, de forma que es preservi la seva tipologia.
• L’eliminació dels punts ha de seguir un esquema d’escombrats successius per tal que la imatge continuï tenin les mateixes proporcions que l’original i aconseguir que no quedi deformada.
• S’ha de fer un escombrat en paral·lel, es a dir, assenyalar els píxels borrables per eliminar-los tots a la vegada.
• Aquest procés es du a terme per fer possible la classificació i reconeixement simplificant la forma de les components.
Comparació amb patrons
• En aquesta etapa es comparen els caràcters obtinguts anteriorment amb uns caràcters teòrics (patrons) emmagatzemats en una base de dades.
• El bon funcionament de l’OCR es basa en gran mesura en una bona definició d’aquesta etapa.
• Per dur a terme la comparació amb els diferents patrons existeixen diferents mètodes, un d’ells és el Métode de projecció, en el qual s’obtenen les projeccions verticals i horitzontals del caràcter a reconèixer i es comparen amb l’alfabet de caràcters possibles fins a trobar la màxima correspondència.
• Existeixen altres mètodes com per exemple:
– Mètodes geomètrics o estadístics – Mètodes estructurals – Mètodes Neuro-mimètics – Mètodes Markovians
– Mètodes de Zadeh.
LʼOCR: aplicacions
• Des de l’aparició dels algorismes de Reconeixement Òptic de Caràcters han sigut molts els àmbits que han introduït aquests processos per augmentar el rendiment dels seus i serveis i d’altres que es basen completament en aquestes tecnologies.
• A continuació es mostren tres de les moltes aplicacions més destacades que utilitzen l’OCR.
Reconeixement de textes manuscrits
• Tot i les dificultats que podem trobar a l’hora de reconèixer un text tipografiat no es poden comparar amb les que apareixen a l’hora de reconèixer un text manuscrit.
• El reconeixement d’un text manuscrit continua sent un desafiament.
• Tot i que el text es compon bàsicament de caràcters individuals, la majoria d’algorismes OCR no aconsegueixen bons resultats ja que la segmentació de text continu és un procediment complexe.
• Tot i això es pot arribar a comprendre una frase quan l’hem acabat de llegir.
• Això implica una operació dels nivells morfològic, lèxic i sintàctic que s’aconsegueix mitjançant el reconeixement de la parla continua.
• Per aconseguir aquesta metodologia s’utilitzen algorismes robustos que no utilitzen segmentació prèvia ja que s’obté automàticament amb la descodificació.
Reconeixement de matrícules
• Una de les aplicacions més clares en les que es pot trobar l’OCR és el reconeixement de matrícules utilitzat en els radars.
• Aquests han de ser capaços de localitzar la matrícula d’un vehicle amb condicions d’il·luminació, perspectiva i entorn variables.
• En l’etapa de segmentació es busquen textures similars a la de una matrícula i s’aïlla l’àrea rectangular que la forma.
• Finalment, s’aplica un procés de classificació múltiple sobre el conjunt de píxels pertanyents a la matrícula proporcionant una cadena de caràcters que s’ha d’ajustar a un model conegut, el format de les matrícules.
• Si apareix algun error, es corregit.
Indexació en bases de dades
• Amb el gran augment d’informació publicada que ha tingut lloc en els últims anys cada vegada són més els mètodes que s’utilitzen per organitzar tot aquest material emmagatzemat en bases de dades.
• Un d’aquests continguts són les imatges.
• Una de les formes més corrents de buscar imatges és a partir de les metadades introduïdes manualment pels usuaris.
• Actualment han aparegut cercadors que proporcionen la possibilitat de buscar imatges mitjançant el text que apareix en elles, com el cercador DIRS (Document Image Retrieval System): mitjançant un algorisme de Reconeixement Òptic de Caràcters extreu el text que apareix en les imatges i l’utilitza com a metadada que podrà ser utilitzada en les cerques.
• Aquesta tecnologia proporciona una nova possibilitat en les cerques d’imatges i demostra que l’OCR encara pot donar molt de si.
Fases del procés de tractament de textes
-idea
-Redactor
-Transcripció a paper digital
-Correcció
-Correcció d'estil
-Fotocomposició/autoedició/maquetació
-Pdf baixa resolució
-Correcció ortogràfica
-Corrección de maquetació
-Pdf alta recolució
-Filmación fotolits /planxes
-Impressió
a) Composició manual
b) Metall fos
c) Fotocomposició
d) Tipografia digital / autoedició
Originals de textes
-manuscrits
-parlats
-analògics (mecanografiats)
-impressos (diaris, revistes)
-digitals (formats digitals)
MANUSCRITS:
Són originals escrits a mà, no són molts usuals en la actualitat i moltes empreses els rebutjen ateses les dificultats i els costos que implica el canvi de format.
Tot i això alguns autors ,fonamentalment del camp de la literatura, tenen el "mal" costum d'entregar els seus originals en aquest format.
PARLATS:
Una altra opció més estranya que la anterior.
En aquest cas, el texte es presenta en format audio, be sigui analògic o digital i a l'empresa de preimpressió s'ha de fer la conversió de format a mesura que s'escolta.
Per les mateixes raoin que en les de tipus manuscrit, auqests originals poden ser motius de rebuigs a la seva recepció.
MECANOGRAFIATS
En desús. en quest cas, l'original es presenta mecanografiat.
Presentació habitual d'originals de text fins fa pocs anys ; en la actualitat s'ha vist re relegat per la irrupció de la informàtica i les seves múltiples avantatges.
Amb tot, encara hi ha autors aferrats a aquesta forma de treball, però cada cop són menys.
El canvi de format no presenta grans problemes, però si pèrdues de temps i per això encariment de procés.
IMPRESOS
Aquells originals que ja han estat impresos en una anterior ocasió però dels que no es disposa de còpia digital.
Aquest és el cas habitual en obres de domini públic o en obres publicades en altres països de la mateixa area llingüística.
DIGITALITZATS
Aquells originals elaborats amb un equip informàtic.
Ofereixen múltiples avantatges sobre la resta d'originals i en la actualitat són els preferits doncs, en general, estalvien costos.
Els problemes amb aquests originals venen dels arxius de fonts utilitzades i dels formats.
Es fan necessàries unes bones epecificacions en la recepció d'aquest tipus d'originals.
Els originals digitalitzats es poden presentar amb un grau diferent d'acabat:
-Orignals digitalitzats sense composar
-Originals digitalitzats mig composats
-Originals digitalitzats composats
Originals digitalitzats sense composar
En aquest cas l'autor s'ha limitat a picar el text sense fer distincions entre els diferents rangs que regeixen la composició.
El que pretèn l'autor és que les seves idees flueixin lliurement sense veure's frendes per accions que en tot cas faran millor els professionals.
Originals digitalitzats mig composats
L'autor entrega el text digtal establint una proposta de composició pero sense que sigui la proposta final.
Són idees exposades per l'autor amb ajuda de la tecnologia informàtica i que necessita tractament posterior.
Originals digitalitzats composats
-En aquest cas l'original ha estat ja tractat convenientment per l'autor i presentar totes les característiques que ha de presentar un cop imprès.
-L'autor, que ha tenir coneixements de composició, entèn que la seva obra no és només el contingut sino la forma en que aquest es presenta.
-Estalvia molta feïna en la fase de preimpressió, sempre que el treball estigui ben realitzat.
PREPARACIÓ D'ORIGINALS
Esprecificacions d'entrega d'originals no digitalitzats
Les seves especificacions són un conjunt de normes bàsiques qe serveixen de guia a l'autor per a entregar el seu treball amb unes mínimes garanties i que permet a l'empresa partir d'una base sólida per al seu posterios tractament.
L'ús ha propiciat una unificació d'aquestes normes, de tal manera que moltes d'elles són comunes per a totes les empreses del sector.
Malgrat parlar d'originals i que en la empresa es realitzarà còpia del treball, es molt recomanable, semrpe que sigui posible, que l'autor entregui còpia de l'original i mai l'original, quedant aquest en mans de l'autor i guarit de posibles incidències.
A) especificacions d'entrega d'originals manuscrits
Presentar-los escrits per una sola cara.
És fonamental presentar una escritura neta, sense ratlles ni esmenes, amb amplis marges i generosa interlínia, fàcilmet entenedor per treballador encarregat de la digitalització.
Utilitzar papers blancs o d'un coloe clar que afavoreixi el contrast amb la tinta empleada que en tot cas haurà de ser negra o d'un color fosc.
Presentar cada una de les pàgines nmerades sobre tot s l'original presenta el fulls solts.
Si l'autor vol assenyalar alguna correcció en aquest original ha de fer-ho amb un altre color de tinta.
Parlats:
Presentar-los en un sistema d'arxiu normalitzat (analògic: cita, k7, digital: mp3, flv...)Reproduible en els equips normals de reproducció.
Dicció clara i audible, fàcilment entenedora pel treballador encarregat de la digitalització.
Exposició continuada de les idees, sense dubtes, acotacions o salts.
Originals mecanografiats.
Han d'estar escrits per una sola cara.
Fer servir un format de paper estàndar.
El blanc dels marges ha de ser ampli, i han de ser més grans els marges de cap i peu.
El blanc de la interlínia també ha de ser generós(a doble espai).
Mecanografiats
-ha d'aparèixer el número de pàgina al cap i marginat a la dreta.
-Ha d'aplicar-se una sangria d'un tabulador a la primera línia de cada paràgraf.
-El text es presentarà sense justificar, marginat a l'esquerra.
L'autor si ha d'incloure coreccions a l'original.
Dificultaria la digitalització mitjançant OCR.
L'original ha de presentar-se sense ratlles ni esmenes i amb els grafismes ben contrastats per a facilitar la digitalització.
Originals impressos
Ha d'exsistir un bon contrast entre el color del text i el fons,sense traspàs de inta ni transparències que entorpeixin la digitalització.
Determinades fonts poden donar problemes en la digitalització; ha de fer-se una prova prèvia abans d'establir les condicions del treball, ja queés posible que hagi que digitalitzar els text manualment.
Ha de comprobar-se que l'original s'adapti a l'escànner, que el llibre s'obri completament i que el format sigui més petit que l'àrea d'escannejat.
Especificacions d'entrega d'originals digitalitzats
Especificacions són un conjunt de normes bàsiques que serveixen de guia a l'autor per a entregar el seu treball amb unes mínimes garanties i que permet a l'empresa partir d'una base sólida per al posterior tractament.
L'ús ha propiciat una unificació d'aquestes normes, de tal manera que moltes d'elles só comunes per a totes les empreses implicades.
-Si els textes van sagnats....
-En negreta, en cursiva...
Especificacions relatives a aplicacions i formats
Junt amb els arxius digitals, s'ha d'entregar SEMPRE:
Una còpia impressa escrita per una sola cara amb:
-el número de pàgina de l'última versió entregada
-el llistat d'arxius amb l'extensió corresponent.
-l'aplicació o aplicacions amb que s'han creat .
-la seva versió
-i l'entorn operatiu.
Les aplicacions han de ser les més comúnment acceptades:
Editors de textes per defecte dels sistemes operatius:
Simple text,Text edit.
Editors de textos professionals: Word, WordPerfect.
Per a la utilitazació d'aplicacions de maquetacio (QuarkXPress, Pagemaker, Ventira ùblisher, Indesign) l'autor ha de consultar prèviament amb el preimpressor.
És recomenable que cada part de la fina es guardi com arxiu independent..
Ha de tenir-se en compte que perquè els arxius es disposin en ordre, han de numerar-se aquests amb zeros en les desenes (i en les centenes si el treball així ho requereis).
Especificacions relatives al text
Fer servir una configuració de oàgina estàndar.
El blanc dels marges ha de ser ampli (almenys dos centímetres), i han de ser més grans els marges de cap i peu.
El blanc de l'interlínia també ha de ser ampli (doble espai).
Ha d'aparèixer el número de pàgina al cap i marginat a la dreta.
Són preferibles originals sense composar, a no ser que l'autor vulgui composar-lo , tingui els coneixements adequats i ho hagi consultat prèviament amb l'empresa de preimpressió.
El text es presentarà aliniat a l'esquerra, sense justificar i sense partició de paraules.
No s'ha de forçar el canvi de línia ni el canvi de pàgina.
Fer servir un sol tipus de lletra, el més estàndar posible, un sol cos i un sol estil.
Les notes s'han d'incloure en el lloc que aniran ubicades, separades del text generl per guions llargs.
Els quadres i taules s'han de compondre en document a part i adjuntar-los com arxius independents.
S'ha d'aplicar un sagnat d'un tabulador a la primera línia de cada paràgraf.
Els paràgrafs no s¡han de separar entre sí per línies en blanc.
Perifèrics d'entrada
Els equips informàtics han d'estar conectats a escànners i disposar d'almenys una aplicació de reconeixement òptic de caràcter (OCR), que permeti la digitalització dels originals mecanografiats o d'aquells originals que estan impressos però del que no es disposa de l'auxiu digital.
A més, han de disposar de connexió externa i interna per mitjà de xarxes de comunicació i serveis de correu electrònic per a la recepció i enviament d'originals digitalitzats.
Un fax por complementar l'enviament dels originals a través de les xarxes telemàtiques.
En cas de que l'empresa accepti originals parlats, haurà de disposar d'equips de reproducció d'audio.
Ordinadors
Dos entorns principals:
Compatibles IBM(PC) y Macintosh (Mac)
Els dos entorns són necesaris en l'actualitat en una empresa de preimpressió i també en el procés de recepció d'originals, atès que el arxius digitals poden provindre dels dos entorns.
Em la actualitat són compatibles i, per això ,és posible compartir arxius entre ells; tot i que això pot ser font de problemes, pel que és aconsellable tratar-los en l'entorn corresponent.
FONTS
La informació sobre les descripcions de fonts es recullen en petits arxius que s'emmagatzemen en el sistema operatiu de l'ordinador (tot els ordinadors incorporen una selecció per defecte de les principals fonts)i que es poden adquirir o llogar externament.
APLICACIONS
Les aplicacions d'edició bàsica de cada sistema operatiu són suficients per a preparar originals digitals i els formats en que permeten guardar els documents són els més usuals.
Entre aquests programes trobem Word Pad (PC Windows) i simple Text o Text edit (Mac OSX).
Les aplicacions d'edició profesional es troben disponibles en els dos entorns (destaquen Microsoft Word y Word Perfect).
FORMATS OBERTS
ASCII
(American Standar Code for Information Interchange)
no conté informació de tipografia o disseny
RTF
(Rich Text Formats)
conté informació de tipografia o disseny molt bàsica.
FORMATS ESPECÍFICS
Processadors de textes (el de InDesign, per exemple)
+contenen tota la informació de tipografia o disseny
+permeten exportar en EPS poscript.
Formats digitals d'arxius de text
Tipografia
Poscript
Truetype
OpenType
Digitalització d'originals
Un cop s'ha rebut l'original.
s'ha comprovat que compleix les especificacions d'entrega que és adequat en relació amb les pautes marcades a l'ordre de treball.
S'ha fet una còpia de treball S'ha recollit l'operativa d'aquest procés en les fitxes corresponents...
Es procedeix a la digitalització de la còpia de l'original, ajustant aquesta al format o format especificats i en el tempsprevist.
Procediment General:
1) s'encèn l'equip i es comprova que és l'adequat per a la realització del treball per la realització del treball.
2) Que te instal·lades i operatives les aplicacions que van utilitzar-se i les fonts necessàries.
3) Que l'entorn de treball es el mes adequat per treballar (llum, soroll...)
4) Es posa la còpia de l'original convenientment en un atril o element auxiliar que permeti la correcta visió.
5)En el cas d'originals d'audio es fa necessari un equip de reproducció i auriculars que pugui reproduir en bones condicions la còpia de l'original.
6) S'obre l'aplicació.
7) Es genera un document de treball asignat a l'arxiu resultant un nom convenient tenint en compte les especificacions recollides en l'ordre de treball.
Digitalització dels originalsOriginals no digitals
Manuscrits:
Es fa necessaària una lectura atenta per a evitr errors d'interpretació.
Atesa la peculariatat deel format de presentació és recomanable que el teclista que està digitalitzant tingui la posibilitat d'accedir directament a l'autor.
Millor fins i tot, si es posible, ha de ser el propi autor qui a modus d'escoltador llegeixi l'original perquè el teclista teclegi el text amb més garanties.
Parlats:
En aquest cas es fa necessària una audició atenta.
Igual que en el cas anterior es recomanable l'accés directe del teclista amb l'autor.
Aquesta modalitat d'original fa necessari "picar" el text primer sense realitzar la interpretació de l'original.
Originals en format digital:
En la recepció de l'original ja s'ha determinat prèviament n el procés de recepció d'originals si el format en que es representa l'original és compatible amb els equips disponibles a l'empresa i si es requereix conversió de format.
Originals digitalitzats sense composar
En aquest cas es canvia el format si procedeix, tenint en compte les especificacions generals i s'imprimeixen una còpia sobre la que realitzar el marcat.
Originals digitalitzats mig composats
En aquest cas s'aprofita el format si procedeix, tenint en compte les especiificacaions.
Esrabliment del paràmetres tipogràfics
Consisteix en determinar i marcar sobre la còpia de treball o millor en una fitxa d'especificacions tipogràfiques la forma en que han de disposar-se els textes i altres elements complementaris (quadres, taules) de l'obra, de tal manera que aquesta senyalització serveixi de referència per conformar el text en las següents fases.
Aquest procés es realitza un cop que 'sha digitalitzat l'original i s'han obtingut còpies impresses dek treball sense compaginar.
Prèviament o al mateix temps que se estableixen els paràmetres tipogràfics, es realitza la correcció de gelerades, on s'introdueixen lles modificacions que s'estimen oportunes en relació amb els continguts, l'estil i els inevitables errors gramaticals i ortogràfics que es troben en aquestes fases inicials.
Generalment aquestes especificacions han d'aparèixer en un lloc visible i lògic.
Així les especificacions generals es presentaran a la primera pàgina de la còpia de treball en el cap, sent també eficaç la presentació en el full annex al treball ben unit a ell.
1. TEXTE GENERAL
És aquell que predomina en el text, exposa les idees principals i, per tant, és el cos de l'obra.
La seva aracterística principal es la llegibilitat.
Ha de facilitar la lectura perquè al lector aquesta li sigui inteligible, en la mesura que sigui possible, atès el tema tractat.
Aquest condicionant ha de prevaldre sobre altres atès que el fi últim les la consecució del plaer intelecttual del lector.
2. TEXTE INDICATIUS
Són aquells que apareixen en la pàgina i associats o no al text general i que tenen una funció clarament informativa.
ex: títols, subt´ítols i folis.
Atesa la seva funció, s'han de destacar de la resta de text pero no en excés; es tracta de proporcionar informació sense estridències, evitant les distraccions del lector que ha d'estar centrat en el text general.
3. TEXTES SECUNDARIS
És quell que apareix en l'obra sense ser el text general, complementant l'exposició desenvolupada al text general.
Són textes secundaqris: les notes, cites, índexs, peus d'il·lustracions, quadres i taules.
Els pròlegs, introduccions, epílogs i textes similars poden ser tractats secundaris o com a part del text general i, per tant, s'haurà d'indicar convenientment.
Especificacions de marcat dels textes secundaris
Es marcara en la la fitxa d'especificacions tipografiques i en la seva ubicació correcta.
Calibrat de l'original
Consisteix en calcular el nombre de caràcters d'un original.
Tal dada, a més de les especificacions del disseny de l'obra (caixa de composició, disposició dels bancs, pàgines en blanc...) permetrà calcular el nombre de pàgines que tindrè l'obre d'un modus molt aproximat.
Tenim totes les dades en qualsevol programa d'editor de textes.
1.PROCEDIMENTS DE CALIBRAT CONVENCIONAL
original mecanografiat
Un cop l'original s'ha presentat e la forma adient i s'han realitzat les còpies es procedeix al càlcul.
Segons quin métode s'utilitzi es necessitarà o no un tipòmetre o liniòmetre o, en la seva manaça un regle corrent i un llapis.
Primer mètode
Es delimiten les diferents parts en que es divideix l'obra i a les que s'han d'aplicar els càlculs: pròlegs, introduccions, prefacis, capítols, epílogs, bibliografies, índexs...
b) Els càlculs es realitzen sobre cadascuna d'aquestes parts diferenciades i tenint present que s'ha de descomptar l'espai que ocupen.
c) Un cop establertes les parts, s'analitzen una a una comptant els caràcters i els espais...
Original imprès
L'original imprés normalment s'ha de composat amb caràcters d'espaiat proporcional i els blancs entre caràcters, entre lletres i paraules varien per a aconseguir el jstificat amb el que notablement es presenten.
A més presenten taules, quadres i il·lustracions, tot integrat en la caixa de composició.
Procediment:
Es delimiten les diferents parts en que es divideix l'obra i a las que s'han d'aplicar els càlculs: pròlegs, introduccions , prefacis, llibres, capítols, epílogs...
Descomptes
D'ilustracions, quadres o taules
Per a descomptar les dimensions d'un gravat o quadre s'han de calcular les línies que aquest ocupa i els blancs preceptius.
S'ha de tenir en compte que les pàgines d'arrancada, aquelles pàgines amb les que s'inicia una part de l'obra, normalment són pàgines curtes, presentant un blanc de cortesia que ocupa vàries lìnies.
El mateix succeeix amb les pàgines finals de les parts; en aquest cas el blanc te la dificultat de què ajusti el text a tota la pàgina sense forzar-lo.
Procediment:
Es realitzara una pàgina plena de mostres amb les especificacions donades per a l'obra.
La comunicació segons Berelson--> transmissió d'informació, idees, emocions, habilitats… a través de símbols, paraules, imatges.
Amb la comunicació volem donar a conèixer a uns altres les nostres:
• Emocions
-Sentiment
-Formes e pensar
-Situació en la que estem
Principis:
• comunicació gestual: gestos o símbols fets amb el mateix cos.
Apareix la plasmació de senyals, símbols, signatures usades en al comunicació oral en parets o pedres.
Tot això per necessitat. Ho fan amb recursos gràfics a mà: un pal, una pedra…

Més endavant
-Lent refinament de les demandes i necessitats: el món està explicat per la MÀGIA ( hi ha una força que fa que les coses passen)
Una mica mes endavant :
Art Rupestre ( primers signes d'escriptura) ESCRIPTURA
Paraules: imiten sons de la naturalesa, expressions d'aquesta.
Llenguatges: a partir del sons que acompanyaven els gestos fets per comunicar-se També es establiment de codis consensuats per poder completar el procés comunicatiu:
Emissor- Canal-Codi-Missatge-Receptor
Alfabet:
Agrupació de símbols amb un ordre determinat utilitzat en el llenguatge escrit que serveix com sistema de comunicació.
Podem classificar els tipus d'escriptura en dos grans apartats : -escriptura conceptual
• escriptura lingüística.
Conceptual:
*A través d'icones o representacions gràfiques expressa idees o paraules.
Exemple: pictograma( representació icona que pot ser realista o bé una idealització.”jeroglífic egipci…”)
*escriptura cuneïforme: Aquesta escriptura deforma progressivament els pictogrames inicials amb una mena de punxó ( en llatí cuneus “tascó, cuny”) ex: Sumeri.
Ideograma: elements gràfics que representa paraules.
Generalment, abans era un pictograma. Ex: escriptura xinesa…
Escriptura Lingüística:
a través de signes expressa son.
Sil·làbica --> cada signe representa un grup fonètic (síl·laba) ex: lineal B (grec micènic) sil·labari hitita o Xipriota.
Escriptura alfabètica: cada signe representa un fonema.
ORIGEN DE L'ESCRIPTURA:
neix independentment a diverses civilitzacions, probablement a partir de pictogrames.
Té com a primer us la comptabilitat.
Els testimoniatges mes antics son les tauletes mesopotàmiques (Uruk, 3300 ac)
Mesopotàmia escriptura sumèria
A partir del 3300 aC, a Sumer s'escriuen tauletes d'argila amb un sistema semipictografic (20.000 ideogrames) que cap al 2500 aC esdevé escriptura cuneïforme.
• la llengua sumèria, poc coneguda, és de tipus aglutinant( ni indoeuropea ni semítica)
• Orientació de l'escriptura per columnes.( d'esquerra a dreta i de dalt a baix.)
Orient mitjà i Àsia menor
adaptaran la tècnica cuneïforme els pobles de l'orient mitjà i l'Àsia menor: acadis, elemites, assiris, babilònics, hurrites, hitites.
Cap al 500 aC els perses emprenen un nou sistema cuneïforme de tipus sil·làbic.
Egipte: Sistema jeroglific
des del 3000 aC FINS AL 4000 dC, a egipte s'empra el sistema jeroglific (6000 pictogrames) a partir del cual es desenvolupen dues escriptures cursives:
• Demòtica--> al 650 aC mes simplificada i per a usos administratius i econòmics (24 signes monoconsonàntics i 80 biconsonàntics)
-hieratica-->o sagrada, gairebé tan antiga com la jeroglífica, reservada des de l'aparició de la demòtica a la religio.
La seva orientació de l'escriptura era de dreta a esquerra i d'esquera a dreta.(bustrofedó)
Xina; Escriptura logogràfica
E ls primers caràcters de l'escrptura xinesa (4500 signes) ja apareixen a la dinastia Shang (1400 aC).Des de ña reforma de la dinastia Qin (s. III aC) dins al s XX, quan hi ha una darrera simplificació i s'introdueixen l'àlfabet llatí (anys 1950), els caracters xinesos augmenten fins a 50.000, 1500 dels quals són apresos a l'escola bàsica.
-L'origen pictografic d'alguns signes és evident, peró l'escrptura xinesa ha esdevingut sobretot semànticafonètica (logogrames)
Japó
-A patir dels hanzi o caràcters xinesos, els japonesos comencen a adaptar (sV de) poc sistemàticament i amb valor fonètic, els seus kanji (5000 signes dels quals s'aprenen uns 1800 a l'escola)
-fins al segle IX no es desenvolupen els dos sil·labaris principals:
• el katakana o kana (47 signes derivats del k'ai-shu
o escriptura xinesa, que ajuden a pronunciar els kanji).
• per a l'escriptura corrent, el hiragana ( més de 300 signes, derivats del ts'ao-shu o cursiva xinesa). Actualmennt, al Japó s'empra una escirptura mixta i sovint complicada, amb kanji i kana.
AMÈRICA CENTRAL
els sistemes d'escriptura més complets d'Amèrica precolombina( els indis americans feien pictogrames i els inques, “quipus” o nusos) són:
L'asteca (mexic central)
el maia (mexic meridional, guatemala, hondures, el salvador) tots dos sistemes combinen elements fonografics i logogràfics.
Els primers testimoniatges d'escriptura centreamericans són del 600 aC.
CRETA:
• a creta s'empra una escriptura jeroglifica 81900-1700a C) que evolciona cap a dues cursives:
• lineal A (fins 1450 a C) : 80signes , encara no desxifrada, correspondria a la llengua minoica ( no indoeururopea)
• Lineal B dins a 1200 a C: 88 signes, derivada de la lineal A correspon ja a una llengua grega
Totes les dues son sil·làbiques, tot i que fan servir logogrames, s'escriuen sobre tauletes d'argila i el sey ús principal és la comptabilitat.
Escriptures alfabètiques
-Les primeres escriptures alfabètiques registren llengües semítiques: a) evolucionen a partir dels jeroglifics egipcis, com les:
• nscripcions protosinaítiques (31 signes)
• protopalestines ( a àrtir del 1500 aC
b) o bé evolucionen de l'escripture cuneïforme, com els 30 siges de l'lfabet d'Ugarit. (Siria 1500- 1200 aC)
Alfabet fenici
• L'alifat fenici també registra una llengua semítica.
• inscripcions més atigues: daten del 1200 aC (sacrcòfag del rei Ahiram de Biblos), peró ñes doferemcies són insignificants respece a l'alfabet establert cap al 100 aC a Biblos: 22 signes consonàntics, orientats de dreta a esquerra
origen: les ancles culturals i comercials de Fenicia amb Egipte, així com l'estructura semítica comuna de les seves llengües, van permetre que l'alfabet fenici fos adaptat probablement de l'escriptura egípcia.
(La paraula “alfabet” curiosament prove dels signes aleph i beth.)
Derivacions de l'alfabet fenici
• Després del seu establiment, l'escrptura fenicia es va difondre pel Mediterrani, per l'Orient Pr`òxim i Mitja i va arribar fins a l'India, de manera que presenta les seguents subdivisions:
Branca fenicia
Branca palestina
Branca aramea
Arab meridional(d'on deriva l'escriptura etiòpica, 500 aC) (alfabet arameu foto)FOTOOOO
Alfabet Grec
L'origen semític de l''alabet grec és indubtable.La primera inscripcio coneguda és del segle VIIIa C però hi ha especialistes que avancen l'adopcio cap al 100 aC.
El préstec s'hauria fet a diversos llocs del món grec i evoluciona amb el temps. Aixi:
• en grec arcaic el nombre de lletres es variable i l'orientacio té la forma de bustrofredó.
-En grec clàssic, en canvi, trobem un alfabet (oriental de milet o jónic) amb 24 lletres i una orientació esquerra /dreta.
• Innovacions pròpies del grec:
l'anotació de vocals i l'afegiment d'algunes consonants inexsistents en les llengües semítiques.
Derivacions de l'alfabet grec:
L'alfabet grec participarà en el procés de formacióo de diverses escriptures: A L'EPOCA ANTIGA:
llengúes no hel·leniques d'Àsia menor (cari, lici, lidi) les escriptures italiques (etrusc)
el copte (egipci i nubi)
A L'EPOCA MEDIEVAL:
el gotic.
L'esclau (ciríl·lic)
(foto cirilic)FOTOOO
Alfabet llatí
• L'alfabet latí és una mes de les nombross escriptures locals que els etruscs i els italics prenen, més o menys directament, d'alfabet grecs occidentals En el cas de Roma es tracta probablement d¡una adaptació etrusca de l'escriptura d'Eubea.
Els primers testimonis llatins date del segle VI aC.
L'alfabet classic s.I aC el constitueixen definitivament 23 lletres, amb orientació inicial bustrofédica i posteriorment ss. VI-IV aC d'esquerra a dreta.
FOTOO ALFABET LLATI
Alfabet arameu
-els arameus són un poble semític establert a Síria, on esdevenir mercenaris i comerciants.
-'l'escriptura aramea adopta de la fenícia (segle X aC) va ser oficial durant mes d'un mileni a diversos imperis (babilònic tardà, assiri,persa) i la seva llengua es també biblica
té 22 consonants i orientació dreta/Esquerra
Alfabet hébreu
te dues formes
• (la mes antiga deriva de l'escriptura fenicia (S. IX aC) i ha quedat reduída a l'ús religios
• la mes moderna, derivada de l'alfabet arameu segle III aC) s'anomena hebreu quadrat i es emprada actualment a israel: 22 consonants.
Orientació dreta/esquerra
Alilfat àrab
els àrabs es constitueixen com a poble entre els segles IX- VII a C però no tenen un regne fins al segle IaC (nabateus)
• l'escriptura ara dériva probablement de l'alfabet arameu-nabateu (500 aC) que evolucionarà cap als dos tipus principals del període islàmic (segle VII):
té 28 consonants signes vocalics i orientació dreta/esquerra ha estad un alfabet adoptat a Àsia, Àfrica i Europa per pobles no semítics (persa, afganès, malasi, bantús).
INDIA:
exsisteix una escriptura protoíndica 2500 ae, corresponent a la cibilitzacio de Harappa i Mohejandaro (vall de l'indo)
Té uns 250 signes sensé desxifrar encara.
Les escrptures modernes driven de l'alfabet arameu: kharosti i brahmi.
(foto alfabet )
Alfabets Eslaus
el primer alfabeto eslau va a ser una creació original de Ciril·li, com a eina per a l'evangelització dels pobles eslaus ( segle IX)
Aquest alfabet són els 40 signes glagolitics.
Peró es mes récent l'alfabet ciril·lic (s. X) que te 43 signes que deriven de lletres greges glagolitiques i d'altres signes.
• A partir del 1050 els pobles eslaus han de triar entre l'alfabet ciril·lic i el llatí.
Abans d'arribar als 30 signes actuals, l'alfabet rus es va simplificar dos cops.
FOTOOO
Escriptura Germànica
• El futhark o alfabet rünic es una creació pròpia dels pobles germànics, amb aportacions de l'alfabet llatí.
• tenia entre 16 i 24 signes amb forma lineal, orientats de manera variable (drena, esquerra, capgirats).
L'estapa mes rica es la de les runas escandinaves ( segase VIII-XI)
FOTOO RUNES ESCANDINAVES
Caràcters rúnics:
• associats a qüestions màgiques i místiques
• les rune transmeten un missatge secret
-cada signe té la seva qualitat
• els “mestres de les runes” gaudeixen de prestigi (saben gravar-les)
Alfabet ibèric
a partir del segles Iv-V aC es van fer servir a la península ibèrica diversos alfabets: -el fenici
-el grec joins
• l'escriptura tartesso-iberica, emprava un sistema mixt, sil·làbic i alfabètic de 27 signes.
Les inscriptures ibèriques actualment es poden llegir, malgrat que no coneixem totalment el significat dels mots ni l'origen de la llengua ibèrica.
(FOTOO ESCRIPTURA IBERICA)
amb el pas dels segles no han deixat d'apareixer nous alfabets, codis de signes i sistemes d'expressió escrits o visuals:
-la taquigrafia
-el telègraf
-l'escriptura per a cecs (Braille)
-l'IPA o Alfabet fonètic internacional
El llenguatge de concordança mundial, l'Esperanto (llengua auxiliar planificada)
• el codi de signes pr a sords
els senyals de trànsit etc..
Els elements amb els quals produïm o fixem l'escriptura també han evolucionat radicalment:
• la impremta
-la màquina d'escriure
• o el processador electrònic de texto
TIPOGRAFIA DIGITAL
CREACIÓ DIGITAL
-Professional: fundicions digital
-Autor: Aplicació especialitzada
Aplicacions de creació tipografica
tipografia digital
fonts bitmap : -> (herencia matrius fotocomposició) inicis
fonts vetorials: -> (arquitectura genünament)actualment
fonts vectorials
forme definides mitjançant linies i corves
*impressió ondependen de la resolució de dispositivo de sortida
*Representació en pantalla mitjançant la tècnica antialiasing
-a extenció ATM
-Sistema operatiu
Tipografia digital
-Postcrip 1 (PS1)
-true type (TT)
-multiple master (MM)
-open type
Postcrip 1
definides per corbes Bézier
*postcripo 1 (PS1) -> primera recnologiam de font vectorial-> no portable completament-> versions diferents per MAC i Win
*composada per dos fitxar :
1- fitxer vectorial->
1-maleta de fitxer bitmap
-fitxer vectorial
.fonts de pantalla
· a-Mac -> maleta de fonts amb dos o menys
·b-win -> sense maleta
MAC:
-fonts de pantalla -> bitmap
(implementa les dades metriques = amplada de caràcters i parells de kcm
-fonts d'impressió -> sense extenció
(En tipus professional , adobe. AGFA..)
WINDOWS:
-fonts d'impressió -> pfb
(definició del contomeig de la font per impresora
FONTS DE PANTALLA
·joc de caràcters bitmap
-ampliació -> fonts escalonada
·diferents sèries per fonts
·vinculació fonts de pantalla amb otline font
True Type (TTf9 -> definides per 'splins'
-desenvolupament d'Apple (finals 80c)
-portable complement
-composada per fitxer únic (vectorial)
-extenció suit o it
PS1 E TT
PS1
.rasteritzar óptim -> mateix LDP (ps)
-aceptada per tots dispositius - ps
TT
-major versalitat multiplanaforma
-fixer únic
-rastaritzar més lent -conversió a PS
-no aceptada per tots els dispositius Ps
MULTIPLE MASTER
desenvolupament de Ps1 realitzar per adobe
Actualment abandonada per Adobe pel desenvolupamet d'OTF
-Basar en unicode -> doble byte(65.000) cada font adoptada forma diferents sense distorsio
*Open type
basat en Unicode -> doble byte (65.000 caràcters)
-conjunt de caràcters expandit i opcions tipografiques avançada
arxiu unic -> fonts autocontanida
Versilitat de recursos
-versateles reals (no modificaciones deformades per aplicació)
-Xifres clàssiques desalineades
-fracions i ordinals
-lligadures(especialment importan per a les fonts cal·ligrafiques)
-caràcter no llatins
Historia de la tipografia
1-Roma segle Idc
les maiúscules
segle primer
-Els romans tenien un alfabet a l'actual encada que faltant-hi les lletres 1.wi v
-Diferents tipus d'escriptura amb les variants i estil tipografics fonamentals
Imperi roma :influencia indiciva en el desemvolupament del alfabet ocidental donanat-li una adequada difució
*Abundants restes demostren la difució de l'escriptura a roma
a)lletres de bronzze encuvades(inscrutades en inscripcions tallades en la pedra
Son lletres incises en pedra
b)avisos en les rondes i carrers, pintats amb pinzel
c)ja es desenyaven les composicions d'una manera jerarquia
*Els estils tipografics fonamentals que resgristava la societat romana erem:
-Quadrara
-Maiúscules quadrades romanas, originalment cisellades en pedre
-Auge entre segona meitat segle I o segleIII
-En codis de luxes aguantara fins al segle VI
-Mateixa amplada i alçada
-Totes les lletres deriven de formes quadradas
Rústica
-Versions menys i mes rapides en la seva excussió de les majúscules quaadradees
-es una escriptura de majuscules mes adaptada a l'escriptura amb una sobre suport
Cursiva
-Diverses modalitat d'inclinació de les majuscules
-es tracta d'una escriptura menys forma d'ejecútacio mes rapido
*D'entre les grans aportacions dels romas a la tipografia , destacad especialment l'establiment d0un canon
d'escriptura molt perfilat
-La columna trajana
-els caracters mostren un petit per a compesar l'eixaplament optic a la part central dels tres verticals i establir una base imaginaria linia
Les minuscules
amb la decadebcua de l'imperi roma que tenen lloc dos fets derivas
a)un vens
.utilitzacio de nous soport: el pergami
.Peparats en fines lames plegades i equadernades en codes, son un esbos del moderns metodes d'enquadernacio
-amb els l'us de noves eines, con la ploma d'au que per la se fexibili†at i lleugersa va subtituit en molts casos
b) una consequencia
.a tenir millor material i eines ,l'escriptra es va desemvolupar
-per la rapides de l'escriptura ,
els tipus de lletra uncial
desenvolupat pels romans en el segle IV ,després a ser mol usada en escrit critians fins al segle VII
-Totes les lletres tenien una altura fixa
-totes les lletres eres agulosas excepte L' A, D,L,H i M
tipus de lletre semiuncial
mes tard es va elaborar un altre estil mes proper a a caixa baixa actual ,que eres les lletres semiuncial
eren un intent de formatilitat els estils cursius de l'escriptura quotidiana que s'estaven modificant a l'agilitat-se l'escriptura
minuscules carolíngia
despres de la decadencia i la caiguda de l'imperi roma, l'emperador cartologame, en un intent de reflotar la cultura occidental va encarregar a aleuino de York,que desenvolupes una minuscula foma per a usar-se con lletre de llibre en tot occiden
lletra gotica
segle x monestir de st gall, s'experimentava amb nou tipus de lletra comprimida i anglesa qe era mes rapida d'escriure i apofitava millor el paper, factors aquests que resultaven de gran ajuda e nun momnt en el qual la demana d'escrit s'havia incremental
El paper
Cap a l'any 100 entra a europa a traves de Siclica i el musulmans establets a espanaya un invent ja vell e orient
-Lentament el secre de la fabricacion de paper va anar conrrent per euroa per segle XII es fabricava e Xatsbis (valencia)i fabrico va ignagurar el primer moli paper d'italia any1276dC
* Aquest estil va sofrir algunes variacions durant els segle XIII i XIV
-Tenen procesius: elstil amb traços de lletre perpendiculars de linia a l'escriptori
-Textos quadrats: amb peus rombies creuant la linia de l'escriptura.
Littera Basada: estil cursiva angulos.La lletra gotica
Cap comentari:
Publica un comentari a l'entrada