Autor: Rigoberto Carvajal (Manual Iberoamericano de Periodismo de Datos)
Se conoce como scraping al arte de controlar de manera automatizada sitios web con el propósito de extraer datos publicados que son de nuestro interés. Este artículo es para personas familiarizadas con el scraping y en él encontrarán una serie de consejos y herramientas, trucos y diseños muy útiles cuando se trata de obtener muchos datos.
El mejor modelo para hacer scraping es en el que existe un programa “orquestador” que puede estar en cualquier lenguaje de programación y que controla a un explorador web. El orquestador es un programa en lenguaje de alto nivel con el que se puede aprovechar muchos recursos de la computadora y que envía comandos al explorador web para guiar la navegación deseada.