18 mayo 2012

En lo que pierdo el tiempo: mailinator

Hace unos años se puso de moda monitorizar sitios como pastebin, incluso han nacido sitios dedicados exclusivamente a esto, como LeakedIn o cuentas de Twitter como PastebinLeaks o PastebinDorks. Todas tienen por objetivo buscar datos sensibles en los nuevos tablones de anuncios de Internet.

Por otra parte, también conocemos servicios web que nos brindan la posibilidad de usar cuentas temporales de correo electrónico donde no guardaremos información sensible, y que preferimos facilitar antes que la de nuestro buzón real, como son mailinator.com o trashmail.net. Este tipo de sitios no requiere autenticación, basta con introducir un nombre de usuario y e voilà

Ahora solo falta unir los dos puntos.

Sin tener demasiado claro que me podía encontrar configuré getmail, para descargarme periódicamente los correos de basura de algunas cuentas de mailinator.com mediante POP3,  lo que me pareció mejor opción que usar el RSS o "scrapear" la página.

Con este propósito cree un archivo con los nombres propios más comunes basándome en el número de repeticiones del diccionario de nombres de facebook y palabras basadas en patrones de teclado, como son "qwerty" o "asdf". Muchos de estos patrones pueden ser calculados por john the ripper con el comando: john -external=keyboard -stdout

Una vez ejecutado contra un centenar de cuentas descubrí que mailinator ya contempla gente como yo y tras conectar varias veces, acabas en un filtro durante unos minutos, así que toco meter espacio temporal entre unas peticiones y otras.

Tras unos días bajando spam y correos varios de todos los buzones saqué una lista con los que más tráfico tienen. Por lo menos de la lista inicial.

Para evitar el filtro anticotillas de mailinator, pensé en utilizar GMail como cliente POP3, ya que tienen decenas de direcciones IP desde las que realizan las conexiones y bloquearlo, es mucho más complicado que a mi pobre servidor. Pero por desgracia tan solo permite añadir cinco cuentas de correo. Que anidando cuentas podrían ser muchas más. Pero para ir probando, suficiente, y más teniendo en cuenta que ya sabía las 5 con más datos al día.



Otra ventaja de utilizar GMail es su filtro antispam, que catalogará este tipo de correos con una etiqueta adicional. ¡Ojo!, yo no digo que el objetivo de todo esto, hasta ahora nada claro, no sea tener decenas de miles de correos de spam para montarme mi propio servicio o tal vez buscar correos con malware.

Unos días después ya se pueden consultar los primeros resultados: muchos registros en portales de citas de todos los países del mundo, registros de páginas porno, registros en foros, bastante malware y por supuesto... miles de correos con spam.



Por seguir experimentando usé Yahoo Pipes, hice un ejemplo que obtenía 20 RSS, los mezclaba y eliminaba duplicados, creando un nuevo RSS "limpio" que poder visitar:



Al final, tampoco he encontrado en estos días nada especialmente asombroso, por lo menos en este tiempo. Pero cuando uno mira por un agujerito, nunca sabe que se va a encontrar y cuánto tiempo ha de mirar para ver pasar algo.

4 comments :

Diego Ferreiro dijo...

Como comentario al uso de pipes, te diria que probases YQL, que te permite paralelizar las querys y en 4 lineas tienes un cliente Web corriendo. Mucho mas flexible ;)

Alejandro Ramos dijo...

¡Como barres para casa Diego! Un día le dedicaré un rato. Aquí me fui a lo que conocía..

sito sito dijo...

Es curioso como la gente puede trabajar en cosas en paralelo sin saberlo :). Hace unos cuantos meses "escaneamos" unas cuantas cuentas y servidores en busca de información "jugosa", na de na. Al menos, parecía lógico que gente se registrara en servicios con esa cuenta y luego fuera factible resetear su cuenta...

Un saludo. Alfonso Muñoz

Felipe Jarenau dijo...

¿Has probado con 10minutemail.com?