Publications by JPAG
Introducción
23/3/2021 Nociones de riesgo colectivo Consideremos el problema de calcular cuantiles para sumas compuestas, como el cuantil al 99.5% (v.gr. capital económico, valor en riesgo, Solvencia II). Desde una perspectiva probabilística, tenemos que calcular, para todo \(s \in \mathbb{R}\), \[ F(s) = P(S \leq s),\,\ \text{donde} \,\ S = \sum_{i=1}^N ...
7752 sym R (893 sym/20 pcs)
Modelo de Riesgo Colectivo
16/4/2021 Introducción La modelación de riesgos colectivos consiste en una serie de técnicas para medir el riesgo asociado con una cartera de contratos de seguro. Se trata de modelar la distribución de la cantidad de pérdida agregada, que es la distribución de sumas compuestas. Sea la variable aleatoria \(S\) la cantidad total de siniestro...
13277 sym R (662 sym/1 pcs) 1 img
Aplicaciones Biomédicas
21/4/2021 Modelación de las pérdidas agregadas Al estudiar la frecuencia y la severidad, se puede pensar en las razones por las que se debería prestar atención a la separación de estos componentes: Contractual. Es común que los contratos de seguro impongan deducibles y límites de póliza por ocurrencia. Por ejemplo, si la póliza tiene u...
20053 sym R (672 sym/5 pcs)
Toxicidad Molecular
4/5/2021 Python \(\texttt{Python}\) es un lenguaje de programación en el que no es necesario compilar, se puede ejecutar línea por línea. La versión actual es \(\texttt{Python 3}\). Una forma de codificar en \(\texttt{Python}\) es a través de \(\texttt{Jupyter Notebook}\). Esta es probablemente la mejor manera de combinar programación, tex...
8137 sym R (1037 sym/19 pcs)
Solubilidad
class: center, middle, inverse, title-slide # Featurización y modelación ### JPAG ### Modelación Predictiva ### 2021/05/07 --- # Featurización Para realizar aprendizaje automático en moléculas, se transforman en vectores de características (*feature*) que se pueden usar como entradas para los modelos. En `DeepChem`, el submódulo de ca...
6046 sym
Tidy Genomics
Contents 1 Getting started: Tibbles A tidy data frame can be constructed by the tibble() function. For example, we illustrate how to construct a data frame from genomic intervals or coordinates. library(tidyverse) chr <- c("chr1", "chr1", "chr2", "chr2") strand <- c("-","-","+","+") start<- c(200,4000,100,400) end<-c(250,410,200,450) mydata <- ...
6657 sym R (24890 sym/102 pcs) 15 img
Árboles y bosques aleatorios
1 Árboles de decisión A pesar de sus ventajas, los árboles de decisión tienden a sobreajustarse si crecen a mucha profundidad y pueden aprender patrones irregulares. Existen muchas variantes de algoritmos de aprendizaje automático basados en árboles. Sin embargo, la mayoría de los algoritmos construyen nodos de decisión de arriba hacia ab...
13277 sym R (18432 sym/55 pcs) 11 img
Redes Neuronales
1 Motivación: ciencia de datos neuronal y la hipótesis no lineal Las redes neuronales son un algoritmo bastante antiguo que originalmente fue motivado por el objetivo de tener máquinas que puedan imitar el cerebro. Esta es sólo una hipótesis, pero se cuenta con algunas evidencias que respaldan esto. Esta parte del cerebro (Figura 1), la part...
20950 sym R (104562 sym/81 pcs) 9 img
Evaluación y tuneo
Contents 1 Introducción Ahora que se ha cubierto el entrenamiento y el preprocesamiento de datos, para continuar con la modelación predictiva a través de la clasificación, la atención se centrará en cómo dividir los datos, cómo evaluar la precisión de la predicción y cómo elegir los parámetros del modelo para maximizar el rendimiento...
14370 sym R (13874 sym/54 pcs) 3 img
Regresión
Contents 1 Introducción Los supuestos subyacentes de un modelo de regresión lineal son: Varianza constante (supuesto de homocedasticidad) Los residuales se distribuyen normalmente Sin multicolinealidad entre predictores (o muy poca) Relación lineal entre la variable de respuesta y los predictores En este ejemplo se considera la esperanza de...
9904 sym R (16205 sym/51 pcs) 23 img