Autores:
- José Manuel Casas
- Sergio Luis Suárez Gómez
- Laura Bonavera
- Fernando Sánchez Lasheras
Edición 1a
Año: 2024
Editorial: Alfaomega – Marcombo
Encuadernación: Rústica
Medida: 15 x 22 cm
Páginas: 186
Lomo: 8.55 mm
Peso: 490 g
$42.900
Autores:
Edición 1a
Año: 2024
Editorial: Alfaomega – Marcombo
Encuadernación: Rústica
Medida: 15 x 22 cm
Páginas: 186
Lomo: 8.55 mm
Peso: 490 g
Compra en hasta 12 pagos mensuales sin usar tarjeta de crédito
¿Tienes dudas? Consulta nuestra FAQ . Crédito sujeto a aprobación.
En un mundo donde los datos se han convertido en el activo más valioso, la capacidad para extraer información significativa de ellos es fundamental. En este contexto, Orange Data Mining emerge como una herramienta indispensable, una brújula que guía a los exploradores de datos a través del vasto océano de información. En este libro, descubrirá el potencial que ofrece Orange Data Mining. Paso a paso aprenderá todas sus capacidades, desde la exploración inicial de conjuntos de datos hasta la creación de modelos predictivos avanzados. Este software de código abierto ofrece un arsenal de herramientas poderosas, todo ello presentado en una interfaz visual intuitiva que facilita el análisis de datos a los menos expertos. A través del enfoque en componentes de este programa, los usuarios podrán construir flujos de trabajo personalizados sin necesidad de codificación, lo que permitirá una exploración ágil y flexible de los datos. Con Orange Data Mining, las posibilidades son infinitas. Desde la segmentación de clientes hasta el descubrimiento de patrones ocultos, desde la clasificación de imágenes hasta la predicción de resultados futuros, este software se convierte en un compañero imprescindible para cualquier persona interesada en este campo.
A medida que lea este libro, descubrirá las grandes posibilidades que ofrece este programa. Ya sea un novato en el campo de la ciencia de datos o un experto en la materia, estamos seguros de que encontrará en Orange Data Mining el mejor aliado en su viaje hacia el descubrimiento y la comprensión de los datos.!
MERCADO, COMPETENCIA Y VENTAJAS COMPETITIVAS
Mercado: toda persona que dedique tiempo a la búsqueda de datos en Internet por razones profesionales o personales, valiéndose de Orange data mining.
Ventajas competitivas: nuestra obra está rigurosamente actualizada.
AUTORES
José Manuel Casas, Sergio Luis Suárez Gómez,Laura Bonavera y Fernando Sánchez Lasheras: son Profesores universitarios en la Universidad de Oviedo, España.
CONTENIDO
Contenido
Prólogo .. XIII
CAPÍTULO 1
Introducción a Orange y su
entorno de trabajo .. 1
1.1. Introducción .. 1
1.2. Instalación de Orange .. 2
1.2.1. Mac OS X .. 2
1.2.2. Windows .. 3
1.2.3. Linux .. 4
1.2.4. Anaconda .. 5
1.2.5. Instalación con pip .. 6
1.3. El entorno de trabajo de Orange .. 6
1.4. Flujo de trabajo en Orange. Canvas y widgets
.. 13
1.4.1. Más sobre flujos de trabajo .. 19
1.4.2. Carga de ficheros en
Orange .. 23
CAPÍTULO 2
Conceptos fundamentales del aprendizaje
automático
2.1. Introducción .. 27
2.2. Clasificación de las metodologías y técnicas
fundamentales del aprendizaje automático .. 28
2.2.1. Clasificación por tipo de aprendizaje .. 28
2.2.2. Clasificación por tipo de tarea .. 30
2.3. Métodos de regresión .. 31
2.3.1. Regresión lineal .. 31
2.3.2. Random forest .. 34
2.3.3. Otros métodos de regresión .. 36
2.4. Métodos de clasificación .. 37
2.4.1. Árbol de decisión .. 37
2.4.2. K-Nearest Neighbors .. 39
2.4.3. Otros modelos de clasificación .. 41
2.5. El agrupamiento o clustering .. 42
2.5.1. K-Means .. 42
2.5.2. t-SNE .. 45
2.5.3. DBSCAN .. 48
2.5.4. Otros métodos de clustering .. 50
CAPÍTULO 3
Análisis de bases de datos
3.1. Sobre la calidad de las bases de datos .. 53
3.2. Detección de espurios y de posibles
agrupaciones en el conjunto de datos .. 54
3.2.1. Local Outlier Factor .. 56
3.2.2. Otros métodos para calcular outliers .. 58
3.3. Exploración de datos faltantes .. 59
3.4. Sobre los tipos de datos faltantes .. 62
3.5. Aplicación de metodologías de imputación ..
63
3.5.1. Ejercicio 3.1 .. 63
3.6. Escalado de las variables .. 64
3.6.1. Ejercicio 3.2 .. 65
3.6.2. Ejercicio 3.3 .. 67
CAPÍTULO 4
Visualización de datos
4.1. Introducción al análisis
exploratorio .. 69
4.1.1. Visualizaciones
inteligentes .. 70
4.2. Gráficos de dispersión .. 73
4.3. Gráficos de cajas .. 75
4.4. Gráficos de violín .. 78
4.5. Gráficos de barras .. 83
4.6. Gráficos de distribución .. 84
4.7. Diagramas de tamiz .. 85
4.8. Gráficos de mosaico .. 87
4.9. Mapas de calor .. 89
CAPÍTULO 5
Redes neuronales artificiales
5.1. Introducción a las redes neuronales artificiales .. 93
5.2. Conjuntos de datos .. 94
5.3. Arquitectura de una red .. 95
5.4. Funciones de activación .. 97
5.5. Funciones de coste .. 102
5.6. Algoritmo de retropropagación .. 104
5.7. Otras arquitecturas de redes .. 106
5.8. Ejemplo. MLP para el set de datos MNIST .. 107
CAPÍTULO 6
Las máquinas de vectores de soporte
6.1. Introducción .. 115
6.2. Ejemplo de aplicación de las máquinas de vectores de soporte como clasificador en Orange.. 116
6.3. Medidas de rendimiento .. 120
CAPÍTULO 7
Métodos combinados (ensemble)
7.1. Introducción .. 147
7.2. Métodos combinados. Un ejemplo que hace uso de la regresión logística y otros modelos .. 148
7.3. Gradient boosting .. 153
7.3.1. Preprocesado .. 154
7.3.2. Gradient boosting (scikit-learn) .. 155
7.3.3. Extreme gradient Boosting (xgboost) .. 156
7.3.4. Extreme gradient boosting random forest (xgboost) .. 158
7.3.5. Gradient boosting (catboost) .. 160
7.3.6. Ejercicio completo .. 164
7.4. Sobre los tipos de datos faltantes .. 165
7.5. Aplicación de metodologías de imputación ..168
7.6. Escalado de las variables .. 169
7.6.1. Ejercicio 2 .. 172
Referencias .. 175