Análise de dados - Futurelingua.net

Tenho vasta experiência com Python e R.

Python

As bibliotecas/tecnologias que uso com mais frequência são:

NLTK – Útil para a mineração de dados, marcação POS (parte de fala, ej., verbos, adjetivos) e análise sintática em minhas pesquisas de corpus.

Pandas – Filtrando e apresentando resultados de mineração de dados de linguagem.

Numpy – Usado em conjunto com NLTK e Pandas para manipulações matemáticas e para resumir dados com estatísticas básicas.

Eu utilizo este ecossistema de software para produzir análises estatísticas complexas, desde análise de variância, análise de regressão, PCA, até análise de cluster.

A seguir estão artigos recentes de minha coautoria que mostram os tipos de análise que conduzi e relatei.

– Collentine, J. G., & Collentine, K. (2020). Organic models for measuring Spanish learners’ linguistic complexity. In Current Theoretical and Applied Perspectives on Hispanic and Lusophone Linguistics (pp. 39–62). Amsterdam: John Benjamins.

🔗

– Collentine, K., & Collentine, J. G. (2020). A corpus analysis of the structural elaboration of Spanish heritage language learners. In Variation and Evolution: Aspects of language contact and contrast across the Spanish-speaking world (pp. 56–73). Amsterdam: John Benjamins.

🔗

– Collentine, J. G., & Asención-Delaney, Y. (2020). L2 Discourse Functions of the Spanish Subjunctive. In Routledge Handbook of Corpus Approaches to Discourse Analysis (pp. 252–268). New York, NY: Routledge.

🔗