Hoy en día, saber recopilar información se ha vuelto clave para estar un paso adelante en temas de ciberseguridad y análisis de amenazas. Y si hablamos de herramientas útiles para eso, TheHarvester es una de las más populares. Es una herramienta hecha en Python que usan muchos profesionales de seguridad para buscar datos que ya están disponibles públicamente en Internet. ¿Para qué? Para detectar posibles puntos débiles antes de que lo haga alguien con malas intenciones, y así tomar medidas a tiempo para proteger lo que realmente importa.
TheHarvester es una herramienta OSINT (Open Source Intelligence) diseñada para recopilar información pública relacionada con dominios específicos. Fue creada originalmente por Christian Martorella y se encuentra disponible en GitHub como parte del proyecto EdgeSecurity.
Con TheHarvester, los profesionales de ciberseguridad pueden obtener correos electrónicos, subdominios, nombres de empleados, direcciones IP, y más, utilizando motores de búsqueda y otros servicios públicos como Shodan, Bing, Yahoo, Google, y diversos directorios de metadatos.
Esta herramienta es particularmente útil en la fase de reconocimiento de un test de penetración (pentest) o de una auditoría de seguridad. Su propósito principal es reunir información crítica sin generar ruido ni alertar al objetivo, ya que no interactúa directamente con sus servidores.
Las principales funciones de TheHarvester incluyen:
Recolección de direcciones de correo electrónico asociadas a un dominio.
Identificación de subdominios existentes.
Obtención de direcciones IP y rangos asociados.
Localización de hostnames relacionados.
Detección de posibles vulnerabilidades abiertas al público.
Podría interesarte leer: Potenciando la Ciberseguridad con OSINT Framework
TheHarvester aprovecha las APIs públicas de motores de búsqueda y otras plataformas que indexan datos disponibles libremente en Internet. Al realizar una consulta con un dominio específico, la herramienta lanza múltiples solicitudes a estas fuentes y recoge los resultados para organizarlos en un informe consolidado.
Por ejemplo, si ejecutas una búsqueda para ejemplo.com, TheHarvester analizará información disponible sobre ese dominio en Google, Bing, Yahoo, Shodan, etc., extrayendo correos electrónicos, nombres de host, subdominios, e incluso posibles relaciones con otros dominios.
A lo largo de los años, TheHarvester ha expandido su compatibilidad con diversas fuentes de inteligencia. Algunas de las más utilizadas son:
Google y Bing: para extraer correos electrónicos y URLs indexadas.
LinkedIn: para obtener nombres de trabajadores (requiere configuración específica).
Shodan: para identificar dispositivos y servicios expuestos públicamente.
VirusTotal: análisis de metadatos en archivos.
Censys: búsqueda avanzada de hosts conectados a Internet.
Hunter.io, AnubisDB, GitHub: otras plataformas para descubrimiento de datos útiles.
La posibilidad de integrar múltiples APIs convierte a TheHarvester en una herramienta muy versátil, ideal tanto para análisis de red como para inteligencia empresarial.
El proceso de instalación es simple si usas un entorno Linux o Kali Linux, que ya la incluye por defecto.
O también puedes instalarla con apt
en distribuciones Debian-like:
Una vez instalada, usarla es tan fácil como lanzar algunos comandos desde la terminal. Aquí te dejamos varios ejemplos prácticos para que empieces a explorar:
Para hacer una búsqueda básica de información en Google y Bing sobre un dominio, puedes indicarle el nombre del dominio y las fuentes que quieres usar, junto con el límite de resultados.
Si quieres enfocar tu búsqueda en correos electrónicos y subdominios utilizando Shodan, también puedes hacerlo con una simple instrucción.
Si prefieres obtener los resultados en un archivo HTML para revisarlos luego con calma o compartirlos, TheHarvester te permite generar ese reporte fácilmente.
Y si deseas consultar varias fuentes al mismo tiempo y ajustar el número de resultados, puedes personalizarlo en el mismo comando.
Importante: Algunas fuentes (como Shodan, Censys o Hunter.io) requieren que configures una clave de API. Esto se hace editando el archivo api-keys.yaml
que encontrarás en la carpeta donde se instaló la herramienta.
A continuación, algunos consejos clave para usar TheHarvester de forma eficiente y segura:
Evita abusar de las consultas: los motores de búsqueda pueden bloquear tu IP si haces demasiadas solicitudes en poco tiempo.
Integra TheHarvester con otras herramientas como Maltego, Recon-ng o SpiderFoot para un análisis más completo.
Mantén tus APIs actualizadas: muchas plataformas cambian sus reglas o límites de acceso con frecuencia.
Usa proxies o VPNs para proteger tu identidad durante las búsquedas.
Lo que hace único a TheHarvester es su enfoque minimalista, su alta velocidad de ejecución y la capacidad de operar en modo completamente pasivo. Mientras otras herramientas como Maltego ofrecen análisis visuales más complejos, TheHarvester se especializa en recopilar datos crudos de manera rápida y efectiva. Además, al ser open-source, la comunidad contribuye constantemente con nuevas fuentes, mejoras y correcciones.
Fácil de usar: No necesitas ser un experto para empezar a sacarle provecho.
Compatible con muchas fuentes: Funciona con motores de búsqueda, plataformas OSINT y servicios como Shodan, Bing, Google, etc.
Gratis y de código abierto: Puedes usarla sin pagar nada y modificarla si sabes un poco de Python.
Ideal para la fase de reconocimiento: Te permite recolectar correos, subdominios, IPs y más sin dejar rastro.
Útil tanto para novatos como profesionales: Tiene la simplicidad que necesitan los que recién empiezan, pero también la flexibilidad que buscan los más avanzados.
Depende de la información pública: Solo encuentra lo que ya está disponible en Internet, así que no esperes descubrir datos privados o confidenciales.
Límites de algunos servicios: Si abusas de ciertas fuentes, pueden bloquearte, mostrar CAPTCHAs o limitar tus búsquedas.
Resultados no siempre actualizados: Lo que encuentras puede estar desactualizado si las fuentes no han indexado lo más reciente.
Requiere configuración para algunas APIs: Para sacarle el jugo completo, necesitarás configurar claves de acceso para ciertos servicios.
TheHarvester es una de esas herramientas que simplemente tienes que conocer si estás metido en ciberseguridad o empezando con OSINT. Te permite ver qué información está flotando por ahí sobre tu empresa (o la de alguien más), y eso puede ayudarte a prevenir problemas antes de que aparezcan.
Ya seas un profesional con experiencia o alguien que apenas está dando sus primeros pasos, TheHarvester es una herramienta que vale la pena tener en tu caja de herramientas digitales.