Tengo una amplia experiencia con Python y R.

 

Python

Las bibliotecas/tecnologías que utilizo con más frecuencia son:

NLTK – Útil para la minería de datos, el etiquetado de POS (partes del discurso, ej. sustantivos, adjetivos) y el análisis sintáctico en investigaciones de corpus.

Pandas – Necesario para la organización, manipulación y presentación de resultados de la minería de datos de idiomas.

Numpy – Se usa junto con NLTK y Pandas para análisis matemáticos y para resumir datos con estadísticas básicas.

 

R

Utilizo este ecosistema de software para realizar análisis estadísticos complejos, que van desde análisis de varianza, análisis de regresión, PCA, hasta análisis de conglomerados (cluster analysis).

Los siguientes son artículos recientes de los que soy co-autor y que muestran los tipos de análisis que he realizado e informado.

 

Collentine, J. G., & Collentine, K. (2020). Organic models for measuring Spanish learners’ linguistic complexity. In Current Theoretical and Applied Perspectives on Hispanic and Lusophone Linguistics (pp. 39–62). Amsterdam: John Benjamins.

🔗

Collentine, K., & Collentine, J. G. (2020). A corpus analysis of the structural elaboration of Spanish heritage language learners. In Variation and Evolution: Aspects of language contact and contrast across the Spanish-speaking world (pp. 56–73). Amsterdam: John Benjamins.

🔗

Collentine, J. G., & Asención-Delaney, Y. (2020). L2 Discourse Functions of the Spanish Subjunctive. In Routledge Handbook of Corpus Approaches to Discourse Analysis (pp. 252–268). New York, NY: Routledge.

🔗