Las facetas son filtros que aplica Open Refine para identificar los valores de las diferentes observaciones que tiene cada columna. Además suma el número de observaciones que tienen el mismo valor. Las facetas pueden ser de Texto o numéricas.
Para aplicar una faceta, por ejemplo a la columna “Puesto”, damos click en el triángulo azul, luego en Facet y finalmente en Text facet.
Al hacer esto observamos que en un recuadro a la derecha aparece un listado de los valor de la columna y contabiliza cuántos se repiten. Por ejemplo observamos que existen 2229 profesores interinos licenciados, 649 profesores instructores mientras que solamente hay un rector.
Si quisiéramos modificar un dato para reagruparlo, por ejemplo si identificamos un error ortográfico, damos clic al lado de la observación donde dice Edit, hacemos el cambio y damos clic en Apply.
Como podemos observar hay muchos puestos diferentes que tal vez quisiéramos reagrupar en menos categorías para simplificar el análisis. Para ello usamos la función Cluster, que se encuentra a la derecha del recuadro de la faceta.
La función Cluster de Open Refine permite agrupar observaciones que aunque están escritas diferente, son similares y podrían ser representaciones alternativas de una mismas expresión. Por ejemplo si tenemos San José y san jose, probablemente se refiere a la misma provincia, salvo que tienen una diferencia en las mayúsculas y la tilde.
En este caso supongamos que queremos agrupar diferentes puestos. Al dar clic en Cluster se despliega una nueva ventana. Open Refine tiene varias opciones para hacer el cluster:
Para el ejemplo vamos a seleccionar la opción de metaphone3. Al hacer esto observamos que se agrupan puestos similares.
Si quisiéramos agrupar todos aquellos puestos que comiencen con profesor invitado en una misma categoría, escribimos en el espacio de la derecha e nombre con el que queremos agrupar, seleccionamos el recuadro blanco y abajo damos clic en “Merge Selected & Re-Cluster”. Podemos repetir el procedimiento para todos aquellos valores que queramos reagrupar.
NOTA: Open Refine guarda automáticamente todos los cambios que vayamos realizando. Estos se pueden revisar en la pestaña de Undo/Redo.
Una vez que realizamos todos los cambios podemos exportar la base de datos limpia, dando clic en la opción Export, al lado derecho de la pantalla. Ahí seleccionamos el formato en el que queramos exportar los datos.