inteligencia_artificial:datasets
Diferencias
Muestra las diferencias entre dos versiones de la página.
| Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previa | ||
| inteligencia_artificial:datasets [2023/06/26 14:58] – [Análisis de las componentes principales (PCA)] alberto | inteligencia_artificial:datasets [2023/09/05 15:58] (actual) – [Irises] alberto | ||
|---|---|---|---|
| Línea 5: | Línea 5: | ||
| Dataset de la flor de Iris, un dataset clásico desarrollado por R. A. Fisher en 1936 en su //paper// "The Use of Multiple Measurements in Taxonomic Problems" | Dataset de la flor de Iris, un dataset clásico desarrollado por R. A. Fisher en 1936 en su //paper// "The Use of Multiple Measurements in Taxonomic Problems" | ||
| - | Es un dataset pequeño, con 3 clases, 50 muestras de datos por cada clase, y 4 atributos: anchura del sépalo, longitud del sépalo, anchura del pétalo y longitud del pétalo, | + | Es un dataset pequeño, con 3 clases, 50 muestras de datos por cada clase, y 4 atributos: anchura del sépalo, longitud del sépalo, anchura del pétalo y longitud del pétalo, |
| Se puede descargar del [[https:// | Se puede descargar del [[https:// | ||
| Línea 201: | Línea 201: | ||
| En el caso de vectores de atributos, el cambio es más sutil, pero también se basa en la misma premisa: que tenga sentido. Los nuevos datos creados deben poder pertenecer a la " | En el caso de vectores de atributos, el cambio es más sutil, pero también se basa en la misma premisa: que tenga sentido. Los nuevos datos creados deben poder pertenecer a la " | ||
| - | Se ha creado en Google colab un ejemplo de [[https:// | + | Se ha creado en Google colab un ejemplo de [[https:// |
| ==== Análisis de las componentes principales (PCA) ==== | ==== Análisis de las componentes principales (PCA) ==== | ||
| Línea 210: | Línea 210: | ||
| En nuestro caso, la vamos a usar para otro fin: Aumentar el número de datos disponible. Para ello, localizaremos los atributos que no influyen prácticamente nada en las componentes principales y les añadiremos un ruido gausiano prácticamente despreciable, | En nuestro caso, la vamos a usar para otro fin: Aumentar el número de datos disponible. Para ello, localizaremos los atributos que no influyen prácticamente nada en las componentes principales y les añadiremos un ruido gausiano prácticamente despreciable, | ||
| - | Con esta técnica aumentaremos los datos del [[https:// | + | Con esta técnica aumentaremos los datos del [[https:// |
inteligencia_artificial/datasets.1687784315.txt.gz · Última modificación: por alberto
