Blog del grup de recerca Tradumàtica

Blog del grup de recerca Tradumàtica sobre tecnologies de la traducció

Archive for gener, 2014

gen. 28 2014

Bona diada de la protecció de dades!

Posted in General |

Avui, 28 de gener, se celebra el dia de la protecció de dades, una jornada internacional de conscienciació dels usuaris, especialment en els camps dels joves i de les xarxes socials.

I no hi ha millor manera de celebrar el dia internacional de la protecció de dades que compartint lliurament la pròpia intimitat amb uns amics en un bar o una cafeteria, les xarxes socials més genuïnes, al voltant d’una xocolata calenta amanida amb rialles, per exemple.

En aquesta mena de converses, apareixen sovint comentaris relacionats amb la pròpia experiència quant a violacions de la intimitat que diàriament vivim gràcies als nostres aparells tecnològics. És possible, per exemple, que el nostre navegador per GPS hagi après quins són els nostres trajectes més habituals. O que en visitar un determinat lloc web ens sorprengui el fet que ja apareixen algunes de les nostres dades. O que el gestor de correu electrònic ens enviï anuncis de productes estranyament relacionats amb els nostres correus electrònics.

Realment, els usuaris bàsics sovint no tenim prou coneixement per saber per mitjà de quins mecanismes algunes de les nostres dades queden emmagatzemades. Potser en alguns casos les nostres dades ni tan sols han sortit del nostre ordinador, i per tant no hi hauria d’haver cap motiu de preocupació. També és possible que fins i tot molts cops trobem útil que les nostres dades quedin enregistrades. I òbviament ho pot ser: és còmode que en algunes ocasions ens estalviem accions perquè el nostre dispositiu (ordinador, mòbil o tauleta) les recorda. La tecnologia, no ho perdem de vista, ens ha de fer la vida més fàcil.

Ara bé, com a usuaris, som conscients de quins llocs webs registren dades nostres? El tema és dens, complicat, i fa mandra pensar-hi. Al capdavall, no acabem d’entendre-hi gran cosa, en aquestes coses, i pensem que algú altre s’encarregarà d’avisar-nos si hi ha alguna cosa que fem malament. I afortunadament, això és exactament així.

Normalment, aquesta gent pertany a la comunitat del programari lliure, que és la que sol estar més conscienciada pel que fa a la privacitat de l’usuari. És per això que sobta tant que molts usuaris es llancin feliçment a regalar la pròpia intimitat a les grans empreses d’Internet en pro d’unes suposades prestacions o d’una aparença més atractiva. Només alguns exemples.

Mozilla Firefox, el navegador lliure, va ser el primer navegador que va incloure la funció DNT (Do Not Track, ‘no em segueixis’), que informa als llocs web que visitem que l’usuari no vol que es registrin les seves dades.

Funció DNT en Firefox.

Funció DNT en Firefox.

Òbviament, ni Mozilla ni ningú no té cap mecanisme per assegurar que aquesta voluntat es respecta, per la qual cosa la funció té un valor únicament informatiu. Després la pilota és al terrat dels llocs web visitats, que han de decidir si respecten la decisió de l’usuari. Posteriorment, altres navegadors han incorporat aquesta funció.

Una altra bona iniciativa de la comunitat de Mozilla és Lightbeam, un complement de Firefox, també en aquest cas purament informatiu, que mostra de manera gràfica i en temps real quins llocs web estan registrant dades nostres. Feu la prova: la instal·lació és senzillíssima en Firefox i podreu veure clarament com a mesura que naveguem cada cop més apareixen llocs web que no hem visitat i que aprofiten que passàvem per allà prop per recollir alguna dada.

lightbeam

Una captura de pantalla de Lightbeam mentre s’escriu aquesta entrada. Sorprèn que ben bé al centre hi hagi una G ben grossa?

Tal com explica Gary Kovacs, desenvolupador a Mozilla, en aquesta xerrada TED de sis minuts i escaig (Tracking the trackers, subtítols en diverses llengües)  la qüestió és especialment preocupant quan implica els usuaris més vulnerables, com ara els infants, i deixa una sensació d’impotència difícil de fer casar amb els interessos de la majoria d’usuaris. Visiteu una de les pàgines que Mozilla dedica a informar a l’usuari què fa per protegir-ne la intimitat (en anglès).

I encara un altre exemple interessant. Alguns dels productes que més fem servir dia rere dia són especialistes en connectar serveis, de manera que, posem per cas, el fet de visualitzar un vídeo que ens envien dins d’un correu fa que el nostre perfil de seguida el mostri com a vídeo preferit. D’aquesta manera es crea una xarxa en què les dades de l’usuari es poden triangular per conèixe’n el perfil general. La majoria de productes, però, són gratuïts. Què hi guanyen, doncs, aquestes empreses?

En canvi, per sort, hi ha serveis que més o menys tenen les mateixes funcions i que ens asseguren que respecten la nostra privacitat. Per exemple, un dels cercadors que està creixent força en els últims temps és DuckDuckgo. Fa més o menys allò a què estem acostumats en aquesta mena de programes; amb algunes especificitats, és clar, i potser amb algunes limitacions, ben cert. Des de fa un temps, per aquest motiu, s’ha convertit en una bona alternativa als motors de cerca més coneguts. Podríem fer la prova d’utilitzar-lo durant uns dies com a motor de cerca predeterminat. Això vol dir que no se’n pot fer servir cap altre? No, és clar, es pot provar i si els resultats no són prou satisfactoris, repetir la cerca en un altre. D’acord, la vida és dura, però només són un parell de clics més.

I probablement ens podrem preguntar, com és legítim, qui ens assegura que aquests altres serveis que presumeixen del respecte a la intimitat de l’usuari realment diguin la veritat? I la resposta és que, de fet, potser no hi ha ningú. La xarxa encara s’està construint, i les societats s’hi van adequant al seu ritme. Per ara, ningú no es preocuparà de defensar els drets dels usuaris fins a les últimes conseqüències, però allò que anomenem la comunitat d’usuaris pot proporcionar dades que ens indiquin si podem confiar en algunes empreses o no. Vindria a ser el boca-orella del món que hi ha fora de l’ordinador. Per exemple, DuckDuckGo ja és un dels motors predeterminats de cerca en alguns programes com ara Firefox, ens informen al seu lloc web sobre de quina manera es preocupen per la nostra privacitat, i en conseqüència la comunitat en parla. Tot plegat sembla que indica que generalment es considera una possible alternativa (i òbviament, potser tothom està equivocat). Però en resum, només un cop l’usuari té prou informació sobre tots els elements, pot prendre una decisió informada o una altra.

Bona diada, doncs!


No hi ha comentaris

gen. 26 2014

Language Tool – exercici col·laboratiu

Posted in General |

Aquesta entrada ha estat creada col·laborativament pels alumnes del Postgrau en Correcció i Qualitat Lingüística de la Universitat Autònoma de Barcelona.

Descripció

LanguageTool és una eina de programari lliure per a la correcció gramatical i d’estil en català i en altres llengües. Actualment, permet treballar en vint-i-nou idiomes. Cal tenir present que, com que es tracta de programari desenvolupat per la comunitat, el grau de qualitat està directament relacionat amb el nombre d’usuaris implicats en cada llengua, i la utilitat, doncs, dependrà de l’idioma triat.

LanguageTool funciona com a complement del processador de textos, dels navegadors (només els lliures) i com a programa independent; assenyala diversos tipus d’errors gramaticals amb un subratllat blau i, en activar el botó dret del ratolí, ofereix alternatives de correcció.

És interessant saber que LanguageTool disposa d’un formulari que permet a l’usuari comunicar els possibles errors que no detecta el programa (vegeu Detecció i comunicació de millores, i també ofereix la possibilitat de crear regles pròpies de revisió gramatical per mitjà d’un mòdul.

Opcions configurables

A les opcions de configuració trobarem una llista de totes les funcions que ofereix el programa que es pot personalitzar en funció dels interessos de l’usuari. A tall d’exemple, és interessant destacar-ne unes quantes d’útils:

  • la correcció de la pronominalització d’alguns verbs que no són pronominals
  • el canvi de tant per tan davant d’adjectius i adverbis
  • la correcció de calcs sintàctics del castellà
  • la necessitat de preposició davant de locucions com fins/fins a o cap/cap a
  • la detecció de l’ús de formes dialectals d’ús restringit no recollides per l’estàndard
  • la marca d’algunes construccions desaconsellades per alguns manuals d’estil

i moltes més.

Mòdul de falsos amics

Dins aquesta eina, una de les opcions més útils en el cas que estiguem redactant en una llengua que no és la materna és la detecció i identificació de falsos amics. A diferència d’altres correctors, aquest permet establir dues llengües per a una mateixa correcció: la materna i la de redacció. Per a triar la llengua materna, cal accedir a la configuració del programa; a la part inferior, hi trobarem un desplegable en què podrem seleccionar-la. Quant a la llengua de redacció, la trobarem ràpidament a la barra inferior del mateix processador i la podrem modificar segons convingui. La finalitat d’aquestes tries és la de poder redactar un text en una llengua estrangera i anar-hi detectant els possibles falsos amics causats per interferència de la llengua materna.

Per tal d’il·lustrar-ho, podem imaginar la situació real en què un parlant d’anglès com a llengua materna necessita escriure un text en català. En aquest cas, introduirà l’anglès com a llengua materna i el català com a llengua de redacció; d’aquesta manera, el programa l’advertirà dels possibles falsos amics (com ara actually per actualment). Finalment, cal remarcar que aquesta combinació és possible amb les trenta llengües que formen el LanguageTool, cosa que fa que les possibilitats lingüístiques siguin molt àmplies.

Detecció i comunicació de millores

Pel que fa a les millores que LanguageTool detecta envers altres programes són:

  • Els dobles espais
  • Els accents diacrítics
  • L’apostrofació
  • La minúscula a principi de frase
  • L’ús incorrecte del sinó / si no
  • La mancança de comes amb explicació del tipus de frase (p. ex., ja que).
  • L’ús del per / per a

Pel que fa als errors que el programa omet són:

  • No detecta l’apostrofació dels articles femenins amb noms que comencen amb I/U àtones
  • El degut a utilitzat com a causal
  • La y com a conjunció
  • Incoherència de majúscules i minúscules
  • Incoherència de temps verbals
  • No detecta els guionets (pronoms personals)
  • No detecta la dièresi
  • No detecta barbarismes o paraules que en català no existeixen
  • No detecta l’escriptura de paraules juntes

Llengües disponibles

LanguageTool s’instal·la un cop i serveix per a totes les llengües. En el cas dels processadors de textos, LT es configura automàticament en funció de la llengua del corrector ortogràfic.

LanguageTool incorpora moltes llengües, entre les quals el català. Hi ha algunes diferències específiques en funció de la llengua, per exemple:

Anglès

  • Col·locacions incorrectes. P. ex. ‘today morning’ en comptes de ‘this morning’.
  • Paraules que normalment s’escriuen malament per confusió. P. ex. ‘economic car’ en comptes de ‘economical car’.
  • Algunes qüestions gramaticals com els errors en les combinacions fixades de dos verbs (verb + gerundi o verb + infinitiu) o la manca de concordança entre subjecte i verb.

Italià

  • Detecta errors ortogràfics com la manca d’accents o l’ús d’accents quan no és necessari, com també la repetició de mots (p. ex. ‘perche’ sense accent, ‘Ió’ amb accent, ‘mi mi piace l’italiano’). No detecta, però, aspectes gramaticals com ara la concordança de nombre o gènere entre el subjecte i el verb (p. ex. ‘io parliamo’), entre el nom i l’adjectiu (p. ex. ‘la casa bianchi’) o entre l’article i el nom (p. ex. ‘il casa’). Tampoc no detecta els dobles espais.
  • No detecta l’ús d’apòstrofs no tipogràfics.
  • Corregeix automàticament l’ús de minúscula a principi d’oració.
  • No detecta si l’ordre dels elements de l’oració és l’adequat (p. ex. ‘Italiano parlo bene lo’).

Francès

En l’apartat de configuració per al francès, LanguageTool indica diversos conceptes que el programa detecta com a errors. N’hi ha alguns que són específics de la varietat del francès de Quebec, com ara els errors provocats per calcs de l’anglès (habituals en la societat quebequesa a causa del bilingüisme), però n’hi ha d’altres de generals de la llengua, com ara arcaismes, paraules homònimes usades erròniament, errors tipogràfics, errors de concordança, errors de minúscules i majúscules, etc.

No obstant això, malgrat que aquests fenòmens estan recollits en la configuració, no tots són realment detectats pel programa. A continuació n’exemplifiquem alguns:

  • Je mange une amende. (homònim: la paraula correcta seria amande)
  • Je suis allée a Catalogne. (homònim: la preposició correcta seria à)
  • Cette vrai. (homònim: la construcció correcta seria c’est)
  • Je vais placez la pomme ici. (error gramatical: cal utilitzar l’infinitiu placer)

WikiCheck

Wikicheck és un mòdul en versió beta que permet corregir articles de la Viquipèdia a través de LanguageTool.

Des del lloc web de Wikicheck, es pot cercar entrades en concret (per mitjà d’una cerca per títol o URL) o pàgines aleatòries. El resultat serà un llistat amb els errors que s’han trobat automàticament dins de l’article.

En aquesta llista hi trobarem alguns dels suggeriments que el programa suggereix com a errors subratllats en color blau i amb una petita descripció del suposat problema i sovint amb propostes de correcció. Val la pena, abans d’acceptar o modificar cap dels suggeriments, contextualitzar millor la proposta amb l’article original per poder decidir si realment es tracta d’un error, ja que el context que ens dóna l’aplicació sovint és insuficient.

Per acabar el procés, només cal introduir els canvis desitjats en els camps corresponents i acceptar-los (‘Submit changes to Wikipedia’). Això portarà l’usuari a la pàgina editada de la Viquipèdia de manera que pugui comparar fàcilment la versió original amb l’editada. Un cop feta la revisió, només caldrà tornar a desar.

Ús com a complement del processador de textos

LanguageTool es pot fer servir com a complement dels processadors de text lliures LibreOffice i OpenOffice. Per instal·lar aquest complement, cal que cliquem el menú Eines i escollir l’opció Gestió d’extensions. Tot seguit, s’obrirà una finestreta i haurem de clicar on diu Aconseguiu més extensions aquí. A continuació, s’obrirà una pàgina web amb les extensions, on caldrà cercar, a la pestanya Extensions, el nom del complement LanguageTool. Un cop trobat, caldrà descarregar-ne l’arxiu en format oxt.

Un cop desat l’arxiu, tornem al processador i, des del Gestor d’extensions, s’afegeix l’arxiu LanguageTool-2.3.oxt per mitjà del botó Afegeix. L’enhorabona! Un cop instal·lat, ja podem treballar amb la tranquil·litat de no cometre erros gramaticals. Això sí, hem d’assegurar-nos que el document està configurat en la llengua que ens interessa.

Ús com a complement del navegador Firefox

Per a descarregar LanguageTool com a extensió del navegador Firefox, aneu a Eines > Complements. En el requadre de cerca, busqueu el complement i descarregueu-ne la versió més recent. Si no apareix entre els resultats que es mostren en pantalla, feu clic a “Vegeu tots els resultats”. Un cop aparegui el complement en una pàgina nova del navegador, situeu el cursor damunt el nom i feu clic a “Afegeix al Firefox”. Quan hagi finalitzat la descàrrega, instal·leu-lo i ja el podeu usar; no cal reiniciar el navegador.

Trobareu la nova extensió al Gestor de complements del Firefox (Eines > Complements). Feu clic a “Més” per a veure’n una descripció i al botó Opcions per a modificar-ne els paràmetres.

Un cop tingueu el programa instal·lat, seleccioneu un text o cliqueu en un camp de text per a revisar-ne el contingut. Cliqueu en la icona LT que es mostra per defecte a la part de baix a la dreta en la barra d’extensions, o cliqueu amb el botó dret del ratolí sobre el text i trieu “Revisa amb LanguageTool” per a revisar-lo.

També és possible revisar el text amb una drecera del teclat. Premeu Ctrl+Shift+L (o Command+Shift+L en Mac) per a revisar la selecció actual, o Crtl+Shift+Return (o Command+Shift+Return) per a revisar un camp de text. Podeu canviar aquestes dreceres en la configuració de l’extensió.

LanguageTool intenta detectar automàticament l’idioma del text; tanmateix, podeu seleccionar un idioma per defecte en la configuració del complement. A més, cal seleccionar una llengua materna per a rebre advertències sobre falsos amics. Per a moure la icona de LT a un altre lloc, seguiu els següents passos:

  • Cliqueu amb el boto dret en la barra de complements a la part de baix de la finestra del navegador.
  • Seleccioneu “Personalitza…”.
  • Arrossegueu i deixeu anar la icona allà on vulgueu.
  • Cliqueu en “Fet”.
  • Podeu tancar la barra de complements clicant en el botó de tancament a l’esquerra.

Limitacions conegudes

  • No és possible revisar texts en llocs web carregats abans de la instal•lació de l’extensió.
  • Si seleccioneu un títol i el paràgraf següent, pot aparèixer una falsa alarma perquè LanguageTool no té en compte el canvi de paràgraf. També podria passar que l’última paraula del primer paràgraf i la primera paraula del segon paràgraf s’unissin.
  • El text en els camps de text dins d’un “iframe” no es poden revisar sense seleccionar el text.
  • El text entre etiquetes HTML <script> és revisat si forma part de la selecció.

Ús com a complement del gestor de correu Thunderbird

LanguageTool està disponible com a complement del gestor de correu Thunderbird. Els passos a seguir per a la seva instal·lació són els següents:

1. Obriu el gestor de correu Thunderbird.

2. Cliqueu Opcions > Complements.

3. Cerqueu LanguageTool.

4. Cliqueu “Instal·la” a l’apartat Grammar Checker 0.6.

5. Reinicieu el gestor de correu Thunderbird.

Ara ja podeu fer servir el corrector LanguageTool per a revisar els vostres correus electrònics:

1. Per a configurar l’idioma en el qual treballareu aneu a Opcions > Complements > Extensions.

2. Cliqueu “Preferències” a l’apartat Grammar Checker 0.6.

3. Indiqueu la llengua en la qual escriureu el text i, si escau, la vostra llengua materna.

4. Torneu a la finestra principal i comenceu la redacció d’un nou correu electrònic.

5. Cliqueu la pestanya “Grammar” i a la part inferior esquerra apareixeran les correccions pertinents.

Ús com a programa independent – Instal·lació en GNU/Linux

LanguageTool també es pot instal·lar com a programa independent (cal tenir instal·lat Java). Un cop descarregat des del lloc web, cal descomprimir el zip i executar l’arxiu languagetool-standalone.jar amb Java.

Més informació: http://www.languagetool.org/usage/

Ús com a programa independent – Instal·lació en Windows

Per instal·lar LanguageTool com a programa independent vegeu l’enllaç següent: http://www.languagetool.org/usage/


No hi ha comentaris