Data mining. Análisis de las interacciones sociales de los usuarios en Twitter (1)

En una entrada anterior, Data mining. Análisis de las actividades de los usuarios en Twitter, hemos podido ver como la minería de datos nos permite analizar la actividad de los usuarios, en términos de frecuencia de su actividad en Twitter, durante un periodo determinado de tiempo presentando diversos gráficos para visualizar dicha información aplicando diversos criterios temporales (día de la semana, hora del día,…). También hemos podido medir y determinar que aplicaciones se utilizan para generar los tuits.

Sin embargo, a partir de la información suministrada por Twitter en la extracción de los datos y la aplicación de algunos algoritmos en el texto de los tuits, podemos profundizar mucho más en el análisis de la actividad de los usuarios y entrar en el dominio de las interacciones sociales. Para ello, hemos procedido a establecer la tipología de tuits que puede generar un determinado usuario. En nuestro caso hemos considerado los siguientes casos:

  • Propio: Es el tuit por excelencia, para comunicar algo propio (opinión, sentimiento, estado, notificación…) en búsqueda de una audiencia. Compuesto de texto y/o enlaces sin hacer  referencia a otro usuario.
  • Respuesta: Tuit de respuesta a otro usuario según el protocolo de Twitter (Reply)  Una alta frecuencia de este tipo tuit implica una conversación activa.
  • RT: Tuit de republicación del tuit de otro usuario que consideras interesante de acuerdo con el protocolo de Twitter (Retweet).
  • Vía: Mención al tuit de otro usuario, equivalente en cierta medida al RT, pero al margen del protocolo estándar de Twitter. Se suele utilizar los términos de: vía, por, by… para indicar la autoría del enlace o texto incluido en el tuit. En general conlleva algún comentario o valoración del enlace o tuit de referencia.
  • Mención: Tuit donde se menciona a otros usuarios que no se ajustan a los patrones para los tuits de Respuesta, RT o Vía.

De acuerdo con dicha tipología aplicada al caso de ejemplo, @usuarioSrX, podemos obtener una serie de gráficos, frecuencia por hora, día de la semana o porcentajes, entre otros posibles :

Slide054

Slide056

Slide058

¿Qué conclusiones podemos extraer en este caso?. La primera es que en su actividad tuitera domina la conversación (64,5%) y la segunda es que utiliza marginalmente el RT recurriendo a otras vías al margen del protocolo de Twitter para realizar menciones (0,5% contra un 22,1%).

En una próxima entrada comentaremos el análisis de la utilización de los #hashtag en las interacciones y las relaciones (Respuestas, RTs, Menciones) con otros usuarios.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *