Entropías y endogamias
Hace unas horas se me ocurrió agregar al menéame un factor que indicase la variedad de enlaces a sitios distintos de cada autor. Al principio pensaba llamarle “coeficiente de endogamia”, “spam”, o “autobombo”, pero como sabía que levantaría ampollas, discusiones y flames, decidí llamarle entropía.
Aunque no es matemáticamente –para nada– un factor de entropía, la idea es aproximada, y sería la inversa de “endogamia”. Un autor tiene mayor entropía cuando más diversidad de sitios envía, así, tendrá 100% (ó 1) si todas las noticias que envió son de webs diferentes y 0% (ó 0) si todas apuntan al mismo sitio –todo un spammer o máquina RSS–. Lo expresé en “porcentajes” porque la gente está más acostumbrado a verlos que un coeficiente con decimales entre 0 y 1.
Lo anterior que sirva como breve explicación a toda la gente que preguntaba extrañada sobre el nuevo numerito. Pero lo más interesante se nos ocurrió a la madrugada, charlando en el fisgón. Ya que se habla tanto de la “endogamia”, ¿por qué no calcular la “entropía global” del menéame?.
Estos son los números.
Noticias envíadas versus blogs
- Enviadas totales: 14448
- Sitios y blogs diferentes: 6623
Entropía: 46%
Noticias publicadas versus blogs/webs
- Noticias publicadas: 4033
- Sitios y blogs diferentes de publicadas: 2153
Entropía: 53%
Autores de envíos versus autores de noticias publicadas
- Total de autores diferentes con envíos: 2091
- Autores diferentes de publicadas: 946
Entropía: 45%
Yo creo que los números razonablemente altos y bien balanceados. No se ven indicios de “endogamia” o “preferencias” como mucha gente supone. Algún día haré un análisis de la “entropía” individual de los autores que no han publicado. Me jugaría una cena que…
Disclaimer: no tengo ninguna relación con esos provincianos incultos que han puesto en marcha el menéame :-P.
Entropías y endogamias
"…Lo anterior que sirva como breve explicación a toda la gente que preguntaba extrañada sobre el nuevo numerito. Pero lo más interesante se nos ocurrió a la madrugada, charlando en el fisgón. Ya que se habla tanto de la ?endogamia?, ¿por qué no …
Trackback by meneame.net — Thursday 11/5/2006 @ 2:28
Me gusta este índice y me parece muy significativo ¿Podría valorarse de alguna forma a la hora de computar el karma de los usuarios?
No obstante existen huecos… hay usuarios que publican en diversos medios y usan de forma más inteligente el menéme para promocionar sus textos… Yo me he quedado anonadado recientemente con un usuario que, en realidad, no necesita de ninguna promoción, tiene una entropía de más del 50% y, sin embargo… bueno, vosotros mismos: una pregunta de Quiz ¿a qué no sabeis quien es Blanik (http://meneame.net/user.php?login=Blanik)?
Comment by josemaria — Thursday 11/5/2006 @ 7:00
No se podría penalizar de alguna manera el que alguien tuviera una entriopía menor de por ejemplo, un 20%? O menor de un 20% y un mínimo de noticias enviadas…
Porque si se detecta al spammer y no se hace nada, pues la cosa sigue igual.
Tambien estoy viendo que al publicar una noticia de un blog, que este la ha extraído previamente de otro medio, si enlazas al blog, la gente te dice que enlazes la fuente original y acto seguido, te marcan como spam. O un video: Alguien lo encuentra, lo pone en su blog, pero la gente te dice que enlazes al video en youtube. Y si fuera de Video. Google? Es mas difícil encontrarlo si no te dan la url…
Creo que se debe valorar más a una persona que ha encontrado algo y la ha puesto en su blog. ¿Porque no entrar en su blog directamente, y de paso ver que más hay de interesante que se haya publicado?
Claro que tampoco se puede pretender valorar siempre al mismo! No hay nadie tan bueno y perfecto todavía como para que sólo leyendo su blog, ya no necesites leer nada mas!!! XD
Comment by Ivan — Thursday 11/5/2006 @ 9:21
#3 Iván tienes razón, otra variante de lo que comentas, es que hay post que en el memeame tienen un montón de comentarios y que en el blog origen de la noticia no tienen ninguno.
Estuve pensando en esto, y no se si sería buena idea incluir algún tipo de etiqueta que se pueda incluir en los blogs (algo así como el enlace que incluyen muchos para menear la noticia) y que no permita comentarios en el memeame, o que por cada comentario que se envié un trackback al blog original.
Aunque por otro lado tal vez fuese un lío y limitase la potencia del memeame.
Comment by jj — Thursday 11/5/2006 @ 11:04
JJ: Otra idea sería que aparecieran los comentarios (en forma de JS o algo así) en el blog original.
Comment by rvr — Thursday 11/5/2006 @ 13:13
Hombre, yo creo que el poner los comentarios a las reseñas del artículo que hay en meneame, enriquece mucho mas si cabe esa reseña en meneame. Luego cada uno es libre de comentar donde quiera. A mí si me gusta el artículo, le dejo un comentario, y si es necesario, copio y pego a meneame o viceversa. No cuesta nada, apenas dos segundos. Aunque quizás el mayor regalo que le hago al articulista si me gusta su blog, es que me lo añado en marcadores, y eso significa que le leeré más regularmente.
Por otra parte, meter los comentarios de meneame en el blog original sería un… allanamiento de morada!!
Comment by Ivan — Thursday 11/5/2006 @ 16:24
La analogía que estableces entre tu medida y la entropía física no es correcta.
Piensa en un barreño separado en dos partes por un panel vertical, y con una parte lleno de agua caliente y otra de agua fría (estado 1). Y ahora piensa que retiramos el panel, entonces el agua tiende a mezclarse hasta que todo el barreño queda con una única temperatura en todas sus partes (estado 2).
Ahora bien, “todo sistema aislado tiende a la máxima entropía”. Nuestro ejemplo tiende del estado 1 al estado 2, porque el estado 2 es el de máxima entropía. Pasando a la teoría de la información, vemos que el estado 1 es el estado de más información puesto que tiene más estados discernibles. El estado de mayor entropía es el que tiene menos información, y el de menos entropía es el que tiene más información.
Ahora vemos en tu medida que, si un usuario tiene la máxima diversidad de sitios, entonces debería tener 0% de entropía. Mientras que si tiene la mínima diversidad de sitios, entonces debería tener 100% de entropía.
Comment by daviti — Thursday 11/5/2006 @ 16:50
Daviti, me parece que no entiendes el concepto de entropía (sobre todo aplicado a la información). Entropía está asociado con desorden, una serie perfectamente aleatorio tiene mucho más entropía que una secuencia menos aleatoria (por ejemplo).
Y desde el punto de vista físico, el ejemplo del agua y lo que dices es erróneo. El agua resultante de 1 y 2 tiene menos entropía que el agua caliente original.
Comment by gallir — Thursday 11/5/2006 @ 16:59
Siento corregirte gallir, pero es muy importante dejar bien claro este tema, que tiende a confundir a la gente.
El concepto de “desorden” es bastante ambiguo, pues puede parecer que un habitación completamente vacía está más ordenada que una llena de juguetes tirados por doquier. Pero en teoría de la información la cosa está bastante clara: La habitación vacía necesita menos bits de información para ser descrita que la habitación llena de juguetes. Por lo tanto la habitación llena tiene más información que la vacía.
Y la “información” es lo contrario a la “entropía”. Puedes verlo en los estados 1) y 2) del barreño. El estado 2) necesita menos información para ser descrito, puesto que toda el agua está igual, mientras que en el estado 1) tienes que describir las distintas partes. El estado 2) tiene más entropía, puesto que es el estado al que tiende la naturaleza, y la naturaleza tiende al estado de máxima entropía, pero tiene “menos información”.
Comment by daviti — Thursday 11/5/2006 @ 17:11
Daviti, sigue el enlace a ala wikipedia que está en el apunte, allí explica el significado de entropía en información. Ni el enlace que pones, ni lo que dice en la wikipedia tiene nada que ver con tu afirmación.
La entropía (matemática) de la información es proporcional (es la suma de la propabilidad por el logaritmo de su inversa) con la probabilidad que aparezcan los diferentes códigos o caracteres de tu alfabeto.
En la blogocosa el juego de caracteres serían cada unos de los blogs, por lo que la entropía de un conjunto de enlaces aumentaría con el número de enlaces distintos que hay en un conjunto. Ergo, mientras más enlaces distintos hay en el conjunto, mayor es su entropía. O sea: la idea de entropía usada aquí es “coherente”. Si tuviese el número completo de sitios web podría calcularte el níumero exacto. O quizás también podría hacerlo sólo considerando el número de sitios que hay referenciados en el menéame, pero se entiende mejor con el “%”.
Comment by gallir — Thursday 11/5/2006 @ 17:21
Mhh, tal vez tengas razón.
Pero a mí me suena que la secuencia de diversidad nula tiene menos información, y por lo tanto debería tener máxima entropía, ¿no? ¿Qué es lo que está fallando?
Comment by daviti — Thursday 11/5/2006 @ 17:36
Un universo de sucesos hiperordenados es un universo de sucesos dinámicamente muerto, un sistema cerrado, sin posibilidad alguna de cambio o evolución. Esos índices de “entropía” no dicen nada porque no son resultados de funciones históricas, es decir, de procesos irreversibles.
Saludos
Comment by Tron — Saturday 13/5/2006 @ 16:07
A tron:
Existe una definición matemática de la entropía en sistemas de la información, está en el enlace.
Por otro lado, sí que es resultado de “funciones históricas”, son las noticias envías en el pasado y esas noticias no son “reversibles”.
Comment by gallir — Saturday 13/5/2006 @ 16:16
No son funciones históricas, es un reduccionismo a una función reversible del tipo a+b = c
Comment by Tron — Saturday 13/5/2006 @ 16:18
*plonk*
Comment by gallir — Saturday 13/5/2006 @ 16:22
*plonk*
Comment by Tron — Saturday 13/5/2006 @ 16:27
Daviti, una cosa es la información que podemos obtener intrinseca del sistema, observandolo y otra la necesaria para describirlo.
Así:
Orden –> Diversidad muy baja –> Necesitamos poca información para describirlo ( pocos microestados posibles compatibles con el macroestado medible; Entropia Termodinámica)–> Tiene mucha información para nosotros, nos habla de como está estructurado internamente.
Por otro lado:
Desorden –> Gran Diversidad –> Necesitamos mucha información para describirlo ( muchos microestados posibles compatibles con el macroestado medible;Entropia Termodinámica)—> Tiene poca información para nosotros, no nos dice mucho de como está estructurado internamente.
Por otro lado lo de la entropía de cada autor lo veo bien, pero no del todo efectivo para delimitar si hay autobombo o no. Yo por ejemplo no me atrevo a menear todo lo interesante que veo por que algunas cosas no las conozco. Sería bueno relacionar esa entropía con la calidad de la noticia ( algo subjetivo y dificil !!).
Ciao
Comment by Avern0s — Monday 15/5/2006 @ 15:36