22nd Jan 2025 Lectura de 7 minutos Netflix envuelto con SQL: Sumerjámonos en tu año de streaming Jakub Romanowski PostgreSQL análisis de datos ejercicio de SQL Índice Paso 1: Obtén tus datos de Netflix Paso 2: Cargarlo en PostgreSQL (La manera divertida) Paso 3: Ver qué serie fue la más vista Paso 4: Detectar tendencias a lo largo del año Paso 5: Descubre patrones sorprendentes Netflix envuelto en SQL En este artículo, vamos a convertir tu historial de visionado de Netflix en tu propio Netflix Wrapped, utilizando SQL. ¿Alguna vez te has preguntado qué serie te has visto más a menudo o qué día no has podido resistirte a darle al play? Te mostraré cómo sacar todas esas divertidas conclusiones. ¡Vamos a profundizar! El año está a punto de acabar, así que ¿por qué no echar un vistazo a tus hábitos con Netflix? ¿Recuerdas todos esos fines de semana en los que decías que "sólo verías un episodio"? Sí, yo también. Con SQL, puedes convertir tu historial de visionado de Netflix en información interesante, como encontrar tus programas más vistos o descubrir tus patrones de atracones. Es más fácil de lo que crees y, sinceramente, es muy divertido ver cómo se presentan los datos. Si esto te parece lo tuyo, quizá te interese leer mi otro artículo sobre cómo analizar los datos de Spotify Wrapped con SQL. Pero volvamos a las películas y series. Paso 1: Obtén tus datos de Netflix Lo primero es lo primero: necesitas tu historial de visionado de Netflix. Aquí es donde empieza todo. Vas a descargar los datos que Netflix ha estado guardando silenciosamente sobre todo lo que has visto. Esto es lo que tienes que hacer: Entra en Netflix desde tu navegador (créeme, así es más fácil). Haz clic en Configuración de la cuenta (debajo de tu foto de perfil). Ve a Perfil y control parental, elige tu perfil y haz clic en Ver actividad. Desplázate hasta el final y pulsa Descargar todo. Ya está. Tienes un archivo CSV con todo lo que has visto. ¿Lo tienes? Perfecto. Sigamos adelante. Paso 2: Cargarlo en PostgreSQL (La manera divertida) PostgreSQL es un potente sistema de base de datos relacional de código abierto perfecto para manejar datos estructurados, como tu historial de visionado de Netflix. Es fiable, versátil y ampliamente utilizado en todo, desde proyectos personales a aplicaciones empresariales. Para hacer las cosas aún más fáciles, utilizaremos pgAdmin, una interfaz gráfica amigable para la gestión de bases de datos PostgreSQL. Piense en pgAdmin como su centro de comando: le permite crear bases de datos, ejecutar consultas y visualizar datos sin necesidad de memorizar una tonelada de comandos SQL. Si eres nuevo en estas herramientas, echa un vistazo a esta guía para principiantes: Cómo instalar y configurar PostgreSQL con pgAdmin. Esta guía le guiará a través de todo el proceso, por lo que es muy fácil empezar. Ahora, pongamos sus datos en PostgreSQL para que podamos empezar a jugar con ellos. Esto es lo que haremos: Abra pgAdmin y conéctese a su servidor PostgreSQL. Añade una tabla para tus datos escribiendo esta consulta en Query tool: CREATE TABLE NetflixViewingHistory ( Title TEXT, Date DATE ); Importa tu archivo CSV: Haga clic con el botón derecho en la tabla y seleccione Importar/Exportar. Elige tu archivo CSV, asigna las columnas a Title y Date, y haz clic en Aceptar. ¿Quieres ser más sofisticado? También puedes importar datos con una consulta SQL: COPY NetflixViewingHistory(Title, Date) FROM '/path/to/your/NetflixViewingHistory.csv' DELIMITER ',' CSV HEADER; Sólo tienes que sustituir /path/to/your/NetflixViewingHistory.csv por la ruta real del archivo. Y así de fácil, ¡los datos estarán listos! Para verificar los datos y asegurarse de que todo se ha cargado correctamente, puede ejecutar una simple consulta SQL para comprobar su tabla: SELECT * FROM NetflixViewingHistory LIMIT 10; Esto mostrará las 10 primeras filas de tu tabla. Si ves tus series, fechas y detalles ordenados en columnas, ¡estás listo! Paso 3: Ver qué serie fue la más vista Muy bien, vamos a averiguar qué series te mantuvieron pegado a la pantalla este año. En lugar de mirar todos los títulos, esta consulta se centra en encontrar las series más vistas agrupando los episodios. Al ejecutar esta consulta, descubrirás las series que dominaron tu tiempo en Netflix. Esta consulta cuenta cuántos episodios has visto de cada serie, dándote un claro ganador para tu serie más vista. ¿Fue Friends? ¿Quizá Stranger Things? Echemos un vistazo: SELECT SPLIT_PART(Title, ':', 1) AS Series, COUNT(*) AS WatchCount FROM NetflixViewingHistory GROUP BY Series ORDER BY WatchCount DESC LIMIT 10; Esta consulta te da una lista de tus series más vistas. En mis resultados, "Friends" se llevó el primer puesto, seguida de cerca por "The Office" y "Dr House". Otras series populares para mí fueron "Vikingos", "Breaking Bad" y "Cobra Kai". Incluso "Designated Survivor" y "Fauda" entraron en la lista, lo que demuestra una mezcla bastante ecléctica. Ahora te toca a ti. ¿Cómo es tu lista? ¿Tu serie favorita de todos los tiempos ha pasado el corte, o ha habido alguna sorpresa en el primer puesto? Pruébala y cuéntamelo. Paso 4: Detectar tendencias a lo largo del año Pongámonos empollones con algunas estadísticas mensuales para descubrir tus tendencias de visionado. ¿Viste más durante los acogedores meses de invierno, o el verano fue tu temporada de atracones de Netflix? Utilizando SQL, podemos desglosar tu historial de visionado mes a mes para ver cómo han cambiado tus hábitos a lo largo del año. Aquí tienes una consulta SQL muy interesante: SELECT EXTRACT(YEAR FROM Date) AS Year, EXTRACT(MONTH FROM Date) AS Month, COUNT(*) AS TotalViews FROM NetflixViewingHistory GROUP BY Year, Month ORDER BY Year DESC, Month DESC; Esta consulta te dará un desglose mes a mes de cuántos programas o películas has visto. Por ejemplo, es posible que notes un pico en diciembre gracias a los especiales de las vacaciones o en julio durante esas perezosas tardes de verano. En mi caso, diciembre se salió de la media: un mes lleno de noches de cine. ¿Quieres saber qué mes de 2024 tuvo más visitas en general? Prueba esta consulta: SELECT EXTRACT(MONTH FROM Date) AS Month, COUNT(*) AS TotalViews FROM NetflixViewingHistory WHERE EXTRACT(YEAR FROM Date) = 2024 GROUP BY Month ORDER BY TotalViews DESC LIMIT 1; Esta consulta identifica el mes con más visitas de 2024. Para mí, febrero fue el claro ganador: ¡conseguí ver la impresionante cifra de 77 series y películas! Parece que esas acogedoras tardes de invierno fueron perfectas para maratones de Netflix. Pero, ¿qué película o serie fue la más popular entre los atracones de febrero? Averigüémoslo con esta consulta: SELECT SPLIT_PART(Title, ':', 1) AS Series, COUNT(*) AS TotalViews FROM NetflixViewingHistory WHERE EXTRACT(YEAR FROM Date) = 2024 AND EXTRACT(MONTH FROM Date) = 2 GROUP BY Series ORDER BY TotalViews DESC; Estas consultas te mostrarán tu título favorito y la serie más vista en febrero. En mi caso, la mayoría de los 77 visionados fueron episodios de "Dr. House" y "Yellowstone". ¿Y tú? ¿Fue una serie emblemática o una película reconfortante a la que volviste una y otra vez? ¡Comprueba tus resultados! Paso 5: Descubre patrones sorprendentes ¿Quieres saber cuál es tu día Netflix favorito? Descubramos el día de la semana en el que es más probable que pulse play. SQL puede revelarlo fácilmente analizando tu historial de visionado y contando cuántos programas o películas has visto cada día de la semana. Es una forma divertida de descubrir tus patrones de streaming. SELECT CASE EXTRACT(DOW FROM Date) WHEN 0 THEN 'Sunday' WHEN 1 THEN 'Monday' WHEN 2 THEN 'Tuesday' WHEN 3 THEN 'Wednesday' WHEN 4 THEN 'Thursday' WHEN 5 THEN 'Friday' WHEN 6 THEN 'Saturday' END AS DayOfWeek, COUNT(*) AS Views FROM NetflixViewingHistory GROUP BY DayOfWeek ORDER BY Views DESC; En mi caso, el resultado era bastante obvio: los fines de semana dominaban mi tiempo de Netflix. Los domingos y los sábados eran mis días de atracones. ¿Y tú? ¿Los fines de semana se llevan la palma o ves más contenidos entre semana? SQL permite descubrir fácilmente tus hábitos particulares y revela patrones interesantes en tu historial de visionado. Pruébalo y descubre qué dicen tus datos. Netflix envuelto en SQL ¡Lo has conseguido! Acabas de convertir tu historial de visionado de Netflix en tu propio Netflix envuelto utilizando SQL. ¿No es increíble ver todas esas estadísticas? Desde tus series más vistas hasta tus días de atracón favoritos, tienes una instantánea completa de tus hábitos de streaming. Ya conoces mis estadísticas, ¡ahora es el momento de conocer las tuyas! ¿Cómo son tus resultados? ¿Se ha llevado la palma una serie sorpresa o tu mes de mayor actividad ha sido una sorpresa? Sea cual sea tu historia, SQL te permite descubrirla y compartirla fácilmente. Si esto te ha parecido divertido (y seamos realistas, lo ha sido), deberías echarle un vistazo al tema SQL de la A a la Z. Está repleto de siete cursos increíbles que te enseñan desde consultas básicas hasta habilidades más avanzadas como uniones, agregaciones y subconsultas. Es interactivo, práctico y desarrolla tus habilidades paso a paso, como acabamos de hacer nosotros, pero a un nivel completamente nuevo. Créeme, este curso es el paso perfecto si estás listo para subir de nivel en SQL. ¿Quién sabe? El año que viene podría estar utilizando SQL para analizar cualquier cosa, desde su progreso físico hasta sus planes de viaje. Feliz streaming y consultas. Tags: PostgreSQL análisis de datos ejercicio de SQL