Publications by Hugo Porras
Curso de Procesamiento del Lenguage Natural
1. Análisis de palabras y documentos Una de las principales preguntas que nos hacemos en tareas de mineo de texto y procesamiento del lenguaje natural es ¿cómo cuantificar de qué se trata un documento?. Para llevar a cabo esta tarea, cuando ya tenemos los datos pre-procesados, podemos calcular medidas sobre cada uno de los tokens, es decir, ...
31843 sym R (10327 sym/36 pcs) 6 img
Curso de Procesamiento del Lenguage Natural
PARTE 2 1. Estructuración de datos 1.1. Texto en formato tidy Recordemos los datos que procesamos en la clase anterior para el caso práctico de análisis de noticias, valiéndonos de las herramientas presentes en la librería tidyverse. library(tidyverse) noticiasVelascoDF = readRDS("Caso1_Noticias/noticiasVelascoDF.RDS") noticiasLarreaDF ...
32765 sym R (8753 sym/47 pcs) 5 img
Curso de Procesamiento del Lenguage Natural
1. PLN y Lenguaje natural 1.1. ¿Qué es un lenguaje natural? Para Sarkar (2019): El lenguaje natural es un lenguaje desarrollado y evolucionado por los humanos a través del uso y comunicación “natural” (distinto a un lenguaje de programación). Tal lenguaje puede ser expresado de manera escrita, verbal o incluso mediante señas. 1.2. Co...
59464 sym R (1987 sym/4 pcs) 7 img 1 tbl
Curso de Procesamiento del Lenguage Natural
1. Motivación e introducción 1.1. ¿Qué es la inteligencia artificial (IA)? Acorde a Russell y Norvig (2005): ‘’Nos llamamos a nosotros mismos Homo sapiens - hombre sabio - porque nuestra inteligencia es muy importante para nosotros. Por miles de años hemos intentado entender cómo pensamos; es decir, cómo un mero puñado de masa puede...
8487 sym 21 img
Curso de Procesamiento del Lenguage Natural
PARTE 1 1. Principios básicos del mineo de texto 1.1. ¿Qué es el mineo de texto? Definición del mineo de texto Según Kwartler (2017): “El mineo de texto (text mining) es el proceso de destilar accionables útiles desde texto.” (traducido del inglés) Ventajas del mineo de texto Realizado sobre R (o cualquier lenguaje de programació...
52336 sym R (145715 sym/107 pcs) 12 img
Caso de Estudio: Introducción al análisis de redes sociales usando PLN
1. Introducción El análisis de redes sociales es una herramienta útil para varios fines. Por ejemplo, este puede ser de ayuda para determinar qué tan bien funciona la relación con el público, o con determinados segmentos de él, puede servir también para medir el impacto de alguna determinada campaña o conocer la opinión respecto a algu...
33706 sym R (9741 sym/51 pcs) 23 img
Técnicas de reducción de dimensionalidad robustas y clustering
Introducción al análisis no supervisado El aprendizaje no supervisado es un método de aprendizaje no existe un conocimiento apriori de un fenómeno en los datos. No tenemos una variable dependiente o output. Buscamos entonces encontrar patrones sobre los datos. Las principales técnicas existentes de análisis no supervisado recaen sobre dos c...
26343 sym R (15677 sym/36 pcs) 12 img
Curso de Procesamiento del Lenguage Natural
1. Análisis no supervisado: Métodos de reducción de dimensionalidad 1.1. Definiciones necesarias para el análisis Aprendizaje no supervisado: Tenemos un conjunto variable continuas o categóricas sobre las cuales deseamos aprender o descrubrir un patrón de comportamiento. Tales patrones pueden ser descubiertos a través de técnicas de redu...
28719 sym R (14101 sym/25 pcs) 6 img 2 tbl
Curso de Procesamiento del Lenguage Natural
1. Análisis no supervisado: Métodos de clustering 1.1. Definiciones necesarias para el análisis Aprendizaje no supervisado: Tenemos un conjunto variable continuas o categóricas sobre las cuales deseamos aprender o descrubrir un patrón de comportamiento. Tales patrones pueden ser descubiertos a través de técnicas de reducción de dimension...
22613 sym R (5376 sym/19 pcs) 8 img 2 tbl
Curso de Procesamiento del Lenguage Natural
1. Aprendizaje supervisado: Problemas de regresión 1.1. Definiciones necesarias para el análisis Aprendizaje supervisado: Tenemos una variable dependiente (output) continua o categórica, y queremos predecirla con un conjunto disponible de variables explicativas (input). Problema de regresión: Tenemos como variable dependiente una del tipo c...
28022 sym R (10171 sym/22 pcs) 49 img 28 tbl