Saltar la navegación

2.3. 📖 Data Scraping

Introducción

El data scraping, o extracción de datos, es el proceso de recoger datos de sitios web. Los metadatos juegan un papel importante en este proceso, ya que pueden ayudar a identificar y clasificar los datos que se están extrayendo.

Guía paso a paso de Data Scraping en Google Sheets

  • Abrir Google Sheets: Inicia una nueva hoja de cálculo.

  • Usar la Función IMPORTHTML: Esta función es útil para extraer datos de tablas y listas en sitios web. La sintaxis es =IMPORTHTML("url"; "tipo_elemento"; num_index), donde "url" es la dirección del sitio web, "tipo_elemento" puede ser "table" o "list", y "num_index" es el número de la tabla o lista en la página que quieres extraer.
  • Ejemplo: Si quieres extraer la primera tabla de la página web de as donde está la clasificación de la liga (https://resultados.as.com/resultados/futbol/primera/clasificacion/), usarías:

=IMPORTHTML("https://resultados.as.com/resultados/futbol/primera/clasificacion/"; "table"; 1)

Ejemplo

  • Refinar y Analizar los Datos: Una vez que los datos están en Google Sheets, puedes usar otras funciones de Sheets para limpiar y analizar los datos según sea necesario.