Assignatura: Escriptures
hipertextuals.
Projecte de recerca: Blog i anàlisi
lexicomètrica[1]
El corpus utilitzat per fer l’anàlisi
comparatiu de text ha estat extret dels blogs dels companys d’aula Hipertextual i humanista
de Na Pilar Aguarod Salillas; i Hipertextualitzant,
d’en Marc Ambit. El vincle entre tots dos blogs és precisament l’hipertext,
tema troncal en ambdós casos. Utilitzarem el programa Antconc per intentar
deduir quines són les línies mestre en el discurs situat a l’hipertext com a
epicentre en l’estudi del discurs.
Cercarem[2] patrons d’ús gramatical,
frases utilitzades reiteradament o frases estadísticament probables i/o
improbables.
El primer pas ha estat fer un llistat d’ús de
freqüències. La primera paraula rellevant que apareix és museu, a la posició
43, repetida 11 vegades. Selfie es repeteix 10 vegades i blog, hipertext,
internet i xarxa 9 vegades, essent aquesta la darrera de la llista en la
posició 58. Es prefiguren d’aquesta manera les principals paraules clau de la
blogosfera: blog, hipertext, internet.
El resultat de dividir els Types (1173) per
Tokens (3901) és 0,3(…), la qual cosa es podria traduir en una riquesa lèxica
baixa. S’ha de tenir en compte que els posts escollits no superen els 300
caràcters, i això influeix en les repeticions,
l’ús de sinònims i la filiació lemàtica.
També fem notar que hi ha activada la opció Treat all data as
lowercase, per tal
que el programa Antconc faci els càlculs de freqüència considerant totes les
lletres com a minúscules.
Quan fem l’ús de l’eina Clúster, el primer
n-grama rellevant –fake news- surt a la posició 25. Evidentment, sembla que
aquest és un tema que està en voga a l’actualitat, i irònicament ja es
relaciona la paraula “news” amb “fake”, sembla que de forma inevitable.
També a la posició 31 apareix “xarxes socials”,
dots mots que avui hom veu com a una realitat indestriablement vinculada una
respecte de l’altra: la xarxa o és social o no és.
Ara bé. Un cop aplicada la xifra d’stopwords, comprovem que el nombre de types (968) i de tokens (1643) han disminuït,
a banda que efectivament apareixen en la nova llista aplicada paraules amb
continguts específics.
També s’ha utilitzat la pestanya Concordance utilitzant les principals
paraules clau (blog, hipertext i internet), sense trobar aparentment resultats
significatius.
Finalment, la darrera aplicació que s’ha fet
servir és la de Keywords list, per
comparar el corpus analitzat amb una altre de referència, de la mateixa
temàtica. En aquest cas el corpus de
referència triat ha estat Aprendre a
llegir i escriure a la Galàxia Internet, del professor Joan Campàs. La
temàtica, en ser compartida per ambdós projectes, ens pot resultar molt útil
per veure concomitàncies entre els blogs dels companys i el discurs del
professor, segurament molt més aprofundit en el tema que ens ocupa. D’alguna
manera, es demostra que, a nivell
discursiu, estem en una línia “en sintonia” amb la del mestre, amb una petita
particularitat: l’augment de l’ús de la paraula selfie, deguda segurament al
fet que en el mòdul del mestre es troben temàtiques diferents o més focalitzades
en el fenomen selfie que les
estrictament utilitzades en els blogs estudiats.
Com a conclusió final, podem extreure de tot plegat que l’ús de les eines d’anàlisi del discurs poden ser molt útils, especialment per accelerar un procés carregós i amb quantitats ingents de documentació. Però, com apunta Santiago Niño-Becerra[3], cal ser cauts a l’hora de fer deduccions massa acotades, ja que les dades a estudiar són molt limitades –en el nostre cas-, i interpretables en múltiples direccions.
El caràcter migrat del present estudi no
permet, en aquest sentit, aprofundir en un ampli ventall d’interpretacions, més
enllà de les genèriques que situarien el discurs analitzat en un de formalment
acadèmic i en consonància a la temàtica estudiada, en termes generals.
BIBLIOGRAFIA.
Campàs Montaner, Joan (2018) Aprendre a llegir i escriure a la Galàxia
Internet. FUOC. Barcelona.
Navarro Colorado, Borja (2014) Guía ràpida de análisis
de corpus (con AntConc). Universitat d’Alacant. Alacant.
WEBGRAFIA.
Aguarod Salillas, Pilar [blog] Hipertextual
i humanista. [Visitat el 10 de Maig del 2018] https://hipertextualihumanista.wordpress.com/
Ambit,
Marc [blog] Hipertextualitzant. [Visitat
el 10 de Maig del 2018] http://hipertextualitzant.blogspot.com.es/
Cassany, Daniel; Valero, Maria; José, Vázquez (2015) «Desenredando
la web: la lectura crítica de los aprendices de lenguas extranjeras en entornos
digitales» Universitat Pompeu Fabra.
Ocnos. [Visitat el 5 de Maig del 2018]
de Yzaguirre
i Maura, Lluís. [En línia] «Catalan stopwords». LATEL. Universitat Pompeu Fabra. [Visitat el 15 de Maig
del 2018]
Niño-Becerra,
Santiago [blog] Big data. [Visitat el
15 de Maig del 2017]. ISSN 2604-0883 https://sninobecerra.com
[1]
El present treball s’ha publicat en
una post al següent blog:
https://estevetrias.blogspot.com.es/
[2] “Empleamos una metodología cualitativa (Cresswell, 2013;
Gil y Cano, 2010; Yin, 2010) que combina […], recogida de capturas de pantalla,
del análisis del contenido (identificación, codificación y categorización de
los ejes de significado que subyacen en los datos) y del análisis del discurso
(interpretación del sentido del discurso atendiendo a las relaciones entre sus
elementos lingüísticos, su contexto y sus significados sociales).”
(Cassany;Valero;Vázquez, 2015:10)
[3]
El problema que tiene analizar datos radica no tanto en el análisis como en la
interpretación que se da a los resultados. […] Es decir, mucho ojo con las
inferencias y conclusiones si no se hacen de forma completa: se puede llegar a
conclusiones contrarias de las que realmente se expresan . A: Niño-Becerra
[blog] (2017) Big data.
https://sninobecerra.com