2nd Jul 2025 Lectura de 10 minutos SQL and Chill: 5 conjuntos de datos divertidos para practicar un viernes por la noche Agnieszka Kozubek-Krycuń ejercicio de SQL ejercicio online Índice Conjunto de datos de películas de IMDb Conjunto de datos de los episodios de Los Simpson Base de datos LEGO Avistamientos de ovnis Tu propio Netflix envuelto Bonificación: Nuestro curso Ejercicio de SQL Datasets ¿Listo para SQL y relajarte? ¿Cansado de los aburridos conjuntos de datos de práctica que hacen que SQL parezca un trabajo? Relájese y perfeccione sus habilidades con cinco conjuntos de datos divertidos y extravagantes que harán que aprender SQL parezca más un juego. Es viernes por la noche. No estás de humor para salir, no queda nada bueno por ver y tu cerebro está deseando algo un poco más satisfactorio que desplazarse por el teléfono. Así que enciendes el portátil, abres el editor de SQL y te dispones a relajarte de otra manera. SQL (lenguaje de consulta estructurado) es el lenguaje que potencia los datos. Te ayuda a extraer información de tablas enormes, detectar patrones y responder a preguntas como "¿Cuál es nuestro producto más vendido este mes ?" o "¿Qué ingrediente de la pizza es el verdadero favorito del público?" SQL está en todas partes: en los negocios, en la tecnología, en el marketing... y en tu futuro, si tienes un poco de curiosidad por los datos. Pero la cuestión es la siguiente: aprender SQL no consiste en memorizar comandos. Se trata de practicar. Escribir consultas, ejecutarlas, arreglarlas cuando se estropean y celebrar esos pequeños momentos "a-ha" cuando los resultados por fin tienen sentido. Esto significa que la práctica no tiene por qué parecer un deber. Para demostrarlo, hemos reunido cinco conjuntos de datos divertidos, extraños y sencillamente interesantes que le ayudarán a perfeccionar sus conocimientos de SQL mientras disfruta del proceso. Piense menos en bases de datos corporativas de recursos humanos y más en avistamientos de ovnis y clasificaciones de películas. Y si quieres seguir avanzando, visita la páginaEjercicio de SQL en LearnSQL.com. Es una ruta de aprendizaje interactiva creada para cualquiera que quiera dejar de leer sobre SQL y empezar a hacerlo. Vamos a SQL y a relajarnos. Conjunto de datos de películas de IMDb ¿Qué contiene el conjunto de datos? Los conjuntos de datos no comerciales de IMDb te dan acceso a una amplia gama de información relacionada con el cine que es perfecta para explorar con SQL. El conjunto de datos incluye varias tablas vinculadas (en formato TSV) que cubren: Información básica sobre películas: Títulos, años de estreno, géneros, duración y si se trata de una película, un cortometraje o un episodio de televisión. Datos de calificación: Valoración media de los usuarios y número de votos por título. Datos del equipo: Directores y guionistas relacionados con cada película. Información sobre el reparto: Actores y actrices principales y sus papeles. Fichas de personajes: Nombres, años de nacimiento, profesiones y obras destacadas. Dónde conseguirla: https://developer.imdb.com/non-commercial-datasets/ ¿Qué conceptos SQL puedes practicar? IMDb ofrece un conjunto de datos relacionales con la complejidad del mundo real. Es ideal para practicar uniones, filtros, agrupaciones y mucho más mientras te sumerges en el mundo del cine. SELECT WHERE, y filtrar por texto o número ORDER BY clasificar películas por puntuación o popularidad GROUP BY y funciones de agregación (como AVG(), COUNT()) LIMIT para encontrar los mejores resultados Filtrado con IN, BETWEEN, y LIKE Ideas para consultas divertidas: ¿Cuáles son las 10 comedias más taquilleras estrenadas después de 2010? ¿Quién es el director más consistente, con un éxito tras otro sin muchos fracasos? ¿Cuáles son las secuelas de comedias mejor valoradas que la original? ¿Qué actores han aparecido en el mayor número de películas mejor valoradas (p. ej., IMDb rating > 8)? ¿Cuáles han sido las películas más largas de la historia (y han merecido la pena)? Nivel recomendado: De principiante a intermedio. Ideal para practicar los conocimientos básicos de SQL con datos reales. Conjunto de datos de los episodios de Los Simpson ¿Qué contiene el conjunto de datos? Los Simpson es la comedia de animación más longeva de la historia de la televisión, conocida por sus extravagantes personajes, su humor mordaz y sus sorprendentes y profundos comentarios sociales. Este conjunto de datos recoge la esencia de la serie a lo largo de más de 600 episodios, ofreciéndole una forma estructurada de explorar Springfield a través de los datos. El conjunto de datos incluye varias tablas vinculadas: Episodios: títulos, fechas de emisión, temporadas, números de episodio y descripciones breves. Personajes - Todos los personajes, desde la familia Simpson hasta oscuros habitantes del pueblo, tienen un ID único. Lugares - Lugares que aparecen en la serie, como la Taberna de Moe, la Escuela Primaria de Springfield y el Kwik-E-Mart. Líneas de guión - Más de 150.000 líneas de diálogo, con información sobre quién dijo qué, en qué episodio y dónde ocurrió. Dónde conseguirlo: https://www.kaggle.com/datasets/prashant111/the-simpsons-dataset ¿Qué conceptos SQL puedes practicar? Unir múltiples tablas (personajes, episodios, localizaciones, líneas de guión) Filtrado de texto con LIKE y LOWER() Contar y agrupar con GROUP BY y COUNT() Encontrar valores únicos con DISTINCT Análisis de apariciones de personajes con ORDER BY y LIMIT Ideas de consulta divertidas: ¿Qué temporada de Los Simpson tiene más episodios? ¿Quién habla más? ¿Bart o Lisa? ¿Hay personajes que sólo aparecen en un episodio? ¿Cuáles son los 5 lugares más utilizados en la serie? ¿Cuáles son las 10 palabras que más utiliza Homer? Nivel recomendado: Intermedio. Este conjunto de datos es ideal si te sientes cómodo con las uniones y estás preparado para experimentar con datos de texto y consultas multi-tabla en un entorno divertido. Base de datos LEGO ¿Qué contiene el conjunto de datos? Este conjunto de datos está pensado tanto para los amantes de los ladrillos como para los exploradores de datos. Abarca décadas de colecciones oficiales de LEGO, desde piezas diminutas hasta enormes colecciones temáticas. Los datos están organizados en tablas relacionales que permiten explorar cómo se construyen y catalogan los sets de LEGO. Las tablas incluyen: Sets - Cada set LEGO con su nombre, año de lanzamiento, tema y número de piezas. Piezas: cada pieza individual, con su número, nombre y categoría. Colores: una lista completa de los colores disponibles para los ladrillos LEGO, incluidos los valores RGB. Inventarios: qué piezas aparecen en cada juego y en qué cantidad. Inventario de piezas: conecta los sets, las piezas y los colores, perfecto para explorar cómo se construyen los sets. Temas - El tema al que pertenece cada juego (por ejemplo, Star Wars, Technic, City). Se trata de un conjunto de datos lúdico pero rico, ideal para consultar las relaciones del mundo real y sumergirse en el colorido mundo de LEGO desde la perspectiva de una base de datos. Dónde conseguirlo: Conjunto de datos de Kaggle (actualizado por última vez en 2017): https://www.kaggle.com/datasets/rtatman/lego-database Conjunto de datos original (actualizado a diario): https://rebrickable.com/downloads/ Qué conceptos de SQL puedes practicar? Tablas múltiples JOINs (por ejemplo, conectar juegos, piezas, inventarios y colores) Filtrado con WHERE, IN, y BETWEEN Agregación con GROUP BY, COUNT(), y SUM() Ordenar con ORDER BY y limitar los resultados con LIMIT Exploración de jerarquías (por ejemplo, temas dentro de temas) Ideas de consulta divertidas: ¿Qué juego de LEGO tiene más piezas? ¿Cuáles son los 5 colores de ladrillos LEGO más comunes? ¿Cuáles son los 5 menos comunes? ¿En qué año se lanzaron más sets LEGO nuevos? ¿Hay piezas que sólo aparecen en un set? ¿Qué temas tienen el mayor número medio de piezas por set? ¿Qué temas LEGO son los más coloridos (es decir, según el número de colores de ladrillos utilizados)? Nivel recomendado: Intermedio. Es perfecto si ya dominas los conceptos básicos y quieres sentirte cómodo trabajando con múltiples tablas relacionadas. Avistamientos de ovnis ¿Qué hay en el conjunto de datos? Este peculiar y único conjunto de datos recoge miles de informes de avistamientos de ovnis del siglo XX, recopilados por el Centro Nacional de Información sobre OVNIs (NUFORC). Cada registro incluye la fecha y la hora del avistamiento, la ciudad, el estado y el país donde se produjo, la forma del ovni, el tiempo que estuvo visible e incluso la descripción del suceso por parte del testigo. Con más de 80.000 entradas -completadas con coordenadas-, es el campo de juego perfecto para cualquiera que sienta curiosidad por las misteriosas luces en el cielo y por lo que los datos dicen sobre ellas. Dónde conseguirlo: https://www.kaggle.com/datasets/NUFORC/ufo-sightings ¿Qué conceptos SQL puedes practicar? Filtrado por fecha, hora y texto con WHERE, LIKE, y BETWEEN Agregaciones con COUNT(), AVG(), y GROUP BY Ordenación con ORDER BY Trabajo con datos geográficos (ciudades, estados, países) Ideas básicas de limpieza de datos (por ejemplo, filtrar entradas incompletas o atípicas) Ideas de consulta divertidas: ¿Qué estado de EE.UU. tuvo más avistamientos de ovnis en la década de 1990? ¿Cuáles son las formas de ovnis más comunes a lo largo del tiempo? ¿Hay meses concretos con más avistamientos que otros? ¿Cuál es la duración media de un avistamiento por tipo de forma? ¿Qué ciudades son "puntos calientes" de ovnis según el número de informes? Nivel recomendado: De principiante a intermedio. Esta es una gran opción si te sientes cómodo con el filtrado y la agrupación y quieres explorar datos basados en el tiempo y la ubicación con un toque divertido. Tu propio Netflix envuelto ¿Qué contiene el conjunto de datos? Este conjunto de datos es un poco diferente porque es tuyo. A diferencia de la mayoría de los conjuntos de datos públicos, éste procede directamente de tu propia cuenta de Netflix. En Netflix Wrapped With SQL, te mostramos exactamente cómo descargar tu historial personal de visionado y convertirlo en algo que puedas explorar con SQL. Muchas plataformas de streaming, como Netflix y Spotify, te permiten acceder a tus propios datos. Es una forma estupenda de aprender SQL con algo a lo que ya estás conectado. El archivo del historial de visionado de Netflix incluye dos columnas principales: Título - El nombre de la película o episodio que viste. Fecha - La fecha exacta en que lo viste. Simple, pero potente. Con sólo esta información, puedes analizar tus hábitos de visionado, detectar patrones a lo largo del tiempo e incluso responder a preguntas que no sabías que tenías sobre tu tiempo frente a la pantalla. Dónde conseguirlo: Sigue las instrucciones de nuestro artículo anterior Netflix Wrapped With SQL. ¿Qué conceptos SQL puedes practicar? Filtrar por fecha y título usando WHERE, LIKE, y BETWEEN Agregando con COUNT(), MAX(), AVG(), y GROUP BY para analizar hábitos de visualización Ordenar los resultados con ORDER BY para encontrar los programas más vistos o los días de mayor audiencia. Trabajar con funciones de fecha/hora para extraer meses o días de la semana o calcular intervalos de tiempo. Limpieza básica de texto y formateo utilizando funciones de cadena como SUBSTRING() o TRIM() para nombres de series y episodios Ideas de consulta divertidas: ¿De qué serie de televisión has visto más episodios? ¿Qué mes has visto más contenidos en Netflix? ¿Qué día de la semana sueles darle al "play"? ¿Qué géneros son los que más ves (si se dispone de datos por género)? De media, ¿con qué frecuencia ves algo: todos los días, cada pocos días o sólo los fines de semana? Nivel recomendado: De principiante a intermedio. Ideal para quienes estén familiarizados con las operaciones básicas de SQL y deseen aplicar sus conocimientos a datos personalizados del mundo real. Bonificación: Nuestro curso Ejercicio de SQL Datasets ¿Quieres la libertad de explorar SQL por tu cuenta, pero con bases de datos listas para usar y bien organizadas? El curso Ejercicio de SQL Conjuntos de datos en LearnSQL.es te da acceso a una variedad de bases de datos realistas de tiendas online, universidades, museos y plataformas musicales. A diferencia de los típicos cursos con tareas paso a paso, éste te permite deambular libremente. Explorarás por tu cuenta las estructuras de las bases de datos, formularás tus propias preguntas y escribirás consultas para responderlas. Las bases de datos del curso incluyen: Un sistema universitario (estudiantes, cursos, calificaciones) Una tienda de comercio electrónico (pedidos, productos, clientes) Análisis de blogs (páginas vistas, comportamiento de los usuarios) Una tienda de música digital (artistas, álbumes, compra de canciones) El Museo de Arte Moderno (obras de arte y artistas) Es perfecto para practicar la unión, agrupación, filtrado y escritura de SQL en el mundo real, sin necesidad de configurar nada. Consulta el curso en: Ejercicio de SQL Conjuntos de datos en LearnSQL.com ¿Listo para SQL y relajarte? Practicar SQL no tiene por qué parecer un trabajo, y definitivamente no tiene por qué implicar aburridas bases de datos de empleados. Tanto si te gustan las películas, los avistamientos de ovnis, los juegos de LEGO o tu propio historial de Netflix, existe un conjunto de datos que puede hacer que aprender te parezca un juego. Así que la próxima vez que tenga una tarde tranquila, pruebe a ejecutar algunas consultas extravagantes en lugar de limitarse a desplazarse. Quién sabe, puede que descubras una nueva forma de relajarte. Y si quiere practicar aún más, visite nuestra páginaEjercicio de SQL . Tus futuras habilidades SQL (y tu currículum) te lo agradecerán. Tags: ejercicio de SQL ejercicio online