
Abril del año pasado, Search Engine Land contribuyente Paul Shapiro escribió un post brillante en el cálculo de PageRank interno. El post esbozó un método para ver la vinculación interna de un sitio web para determinar la importancia de las páginas dentro del sitio web.
Esto es increíblemente potente, pero creo que el concepto de Paul podría ser más fácil de usar. Él usó R, que es un lenguaje y un ambiente para la informática estadística, y la salida es básicamente un manojo de números.
Quiero mostrarle cómo hacer lo mismo en Gephi con el empuje de unos botones en lugar de un montón de código – y, con unos pocos clics más, puede visualizar los datos de una manera que se sentirá orgulloso de mostrar a sus clientes .
Te mostraré cómo obtener este resultado como un ejemplo de cómo Gephi puede ser útil en tus esfuerzos de marketing digital y posicionamiento web SEO. Podrá ver qué páginas son las más fuertes de su sitio web, determinar cómo se pueden agrupar las páginas por temas e identificar algunos problemas comunes en el sitio web, como errores de rastreo o enlaces internos deficientes. Luego describiré algunas ideas para llevar el concepto al siguiente nivel de geekery.
¿Qué es Gephi?
Gephi es un software libre de código abierto que se utiliza para graficar redes y que se utiliza comúnmente para representar redes informáticas y redes de redes sociales.
Es un simple programa de escritorio basado en Java que se ejecuta en Windows, Mac o Linux. Aunque la versión actual de Gephi es 0.9.1, le recomiendo que descargue la versión anterior, 0.9.0, o la versión posterior, 0.9.2, en su lugar. De esa manera usted podrá seguir a lo largo de aquí, y evitará los errores y dolores de cabeza de la versión actual. (Si no lo ha hecho recientemente, puede que tenga que instalar Java en su computadora también.)
1. Comience por rastrear su sitio web y recopilar datos
Normalmente uso Screaming Frog para rastrear. Ya que estamos interesados en las páginas aquí y no en otros archivos, necesitaremos excluir cosas de los datos de rastreo.
Para hacer eso, los de usted con la versión pagada del software deben implementar los ajustes que describiré a continuación. (Si utilizas la versión gratuita, que te limita a recopilar 500 URL y no te permite ajustar tantas configuraciones, te explicaré qué hacer más adelante).
Ir a «Configuración»> «Araña» y verá algo como la captura de pantalla a continuación. Hacer tuyo el mío para obtener los mejores resultados. También añado normalmente. * (Png | jpg | jpeg | gif | bmp) $ a «Configuración»> «Excluir» para deshacerse de las imágenes, que Screaming Frog a veces deja en el informe de rastreo.
Para iniciar el rastreo, coloque la URL de su sitio en el espacio en la parte superior izquierda (foto abajo). A continuación, haga clic en «Inicio» y esperar a que el rastreo para terminar.
Cuando termine el rastreo, vaya a «Exportación masiva»> «Todos los enlaces internos». Deberá cambiar «Archivos de tipo» a «.csv» y guardar su archivo.
Limpieza de la hoja de cálculo
Elimine la primera fila que contiene «Todos los enlaces».
Elimine la primera columna, «Tipo».
Cambie el nombre de la columna «Destino» por «Destino».
Elimine todas las demás columnas además de «Origen» y «Destino».
Guarde el archivo editado (y vuelva a comprobar que el tipo de archivo es .csv).