El último método para la búsqueda de blogs no está exento de errores
Si usamos un motor de búsqueda para dar con un blog interesante o algún tema poco habitual, es probable que los resultados que obtengamos sean bastante pobres.
El problema es que los blogs no están unidos entre ellos con hiperenlaces, al contrario que el resto de la red, y por ese motivo los algoritmos de búsqueda tradicionales no sirven bien para hacen clasificaciones. Por ejemplo, el conocido algoritmo de Google, PageRank, basa sus resultados en el número de vínculos que apuntan a una determinada página web. Cuantos más vínculos reciba una página, más alto será su ranking. Pero también le da más valor a aquellos vínculos que procedan de sitios webs populares, por lo que el ranking final depende de la popularidad de la páginas con las que se esté vinculado.
Este es un buen método para las páginas webs normales, pero no funciona tan bien con la mayoría de los blogs puesto que los vínculos que apuntan a ellos carecen de información suficiente sobre su calidad o contenido. Por ejemplo, no se puede distinguir entre un vínculo hecho con buena intención y otro hecho con otros fines. Además, los blogs normalmente reciben menos vínculos que otro tipo de páginas, incluso cuando tienen un gran número de lectores y demuestran ser influyentes entre un grupo de personas específico pero reducido.
Así que, ¿cómo podemos mejorar las búsquedas entre blogs? Apostolos Kritikopoulos y sus colegas de la Universidad de Economía y Negocios de Grecia señalan que el factor más importante es reforzar el enfoque de PageRank con otra información relativa a la forma en que los blogs se vinculan entre ellos. Afirman que, por ejemplo, que es posible sacar el máximo partido a la temática del blog mediante el uso de etiquetas (tags), y también se pueden aprovechar las contribuciones hechas por autores y comentadores, así como la manera en que estos individuos añaden contenido a más de un blog.
Si tenemos en cuenta estos factores, el tipo de rankings que obtenemos al hacer una búsqueda de blogs cambia radicalmente. Para mostrarnos las diferencias que se obtienen con su método, Kritikopoulos y su equipo hicieron un ranking de los 1000 blogs más importantes, según un conjunto de datos de 2006, primero usando PageRank y luego usando su propio algoritmo, llamado BlogRank. Estos listados (junto con otro método de clasificación) sólo tienen 139 puntos en común.
Los 3 blogs con mejor clasificación según PageRank son:
Los 3 blogs con mejor clasificación según PageRank son:
No está clara la utilidad de BlogRank cuando se trata de búsqueda de palabras clave.
Pero sí es evidente que el equipo creador va a tener que esforzarse bastante para obtener la información que, según ellos, le da a BlogRank ventaja sobre sus competidores. Por ejemplo, no siempre es fácil obtener una lista de todos los comentadores en muchos de los blogs. E incluso cuando es posible, resulta difícil identificar a estos autores y comentadores porque suelen ocultar su identidad (ehem...).
Y eso puede ser lo que haga que BlogRank fracase.
Kritikopoulos y compañía concluyen diciendo que sus resultados experimentales son "bastante alentadores". Puede ser. También dicen que "tenemos que seguir experimentando con nuestro método, evaluándolo, y ajustando sus parámetros".
Eso está claro. Puede que pase algún tiempo antes de que tengamos un motor de búsqueda de blogs que funcione la mitad de bien que con el resto de la red.
Ref: arxiv.org/abs/0903.4035: BlogRank: Método para ranking de blogs basado en conectividad y similitud de contenidos.