Google hacking: averigua cuanta información sobre ti o tu empresa aparece en los resultados
Google no solo posee el motor de búsqueda más popular, sino que es uno de los más poderosos. Esta solución utiliza un “robot” que indexa una enorme cantidad de contenidos de la web, y permite que miles de millones de páginas web sean visibles a través de los resultados de estas búsquedas. Sin embargo, dentro del gran mar de datos y contenidos públicos, algunas piezas de información confidencial o sensibles podrían ser revelados en los resultados de búsqueda, y con frecuencia, esto sucede sin que el dueño del sitio web se percate.
A menos que los administradores de los sitios webs bloqueen ciertos recursos para evitar su exposición, o que se protejan secciones privadas de los sitios web mediante un sistema de autenticación, Google indexa toda la información que está presente en los mismos. Luego de un tiempo, toda esta información está disponible para cualquier persona que sepa cómo buscarla (y encontrarla 😉).
Comandos para filtrar las búsquedas en Google
A la hora de realizar una búsqueda en Google, hay ciertas palabras clave y operadores que funcionan como un lenguaje de consulta estructurado y tienen un significado especial para este motor de búsqueda. Los mismos se utilizan para filtrar los resultados. Es decir que los usuarios pueden apoyarse en estos operadores para encontrar resultados relevantes para sus búsquedas de forma más rápida y precisa, aunque, por otra parte, una persona con fines malintencionados podría utilizar estas mismas técnicas para obtener información sensible, y esto es lo que se conoce como “Google Dorks” o “Google Hacking”.
Operador | Ejemplo de búsqueda en Google | Propósito | ¿Se puede combinar con otros? |
---|---|---|---|
site | site:wikipedia.org | Buscar resultados dentro de un sitio específico | si |
related | related:wikipedia.org | Buscar sitios relacionados | si |
cache | cache:wikipedia.org | Buscar la versión del sitio en caché | si |
intitle | intitle:wikipedia | Buscar en el título de la página | si |
inurl | inurl:wikipedia | Buscar una palabra contenida en una URL | si |
filetype:env | filetype:pdf | Buscar por tipos de archivo específicos | si |
intext | intext:wiki | Buscar en el texto del sitio web solamente | si |
“” | “Wikipedia” | Buscar palabra por coincidencia exacta | si |
+ | jaguar + car | Buscar más de una palabra clave | si |
– | jaguar speed -car | Excluir palabras de la búsqueda | si |
OR | jaguar OR car | Combinar dos palabras | si |
* | how to * Wikipedia | Operador de comodín | si |
imagesize | imagesize:320×320 | Búsqueda de imágenes por tamaño | no |
@ | @wikipedia | Buscar en redes sociales | si |
# | #wiki | Buscar hashtags | si |
$ | camera $400 | Buscar un precio | si |
.. | camera $50..$100 | Buscar dentro un rango de precios | si |
Tabla: Ejemplos de algunos operadores de búsqueda comunes. Fuente: Wikipedia
Google Hacking Database GHDB
Google Hacking Database (GHDB) es un proyecto open-source que recopila una inmensa colección de los dorks conocidos. Este proyecto es la eminencia en lo que refiere a esta temática, y es actualizado y mantenido por el grupo Offensive Security (los mismos creadores de Kali Linux, Backtrack y Exploit-DB).
Estos dorks a su vez están clasificados en distintas categorías:
Estos dorks a su vez están clasificados en distintas categorías:
A continuación, compartimos ejemplos de dorks extraídos del proyecto GHDB y algunos resultados relevantes:
intitle:”webcamXP 5″
Con este dork se pueden encontrar cámaras web modelo “WebcamXP 5” que están transmitiendo en vivo y que no tienen ningún tipo de restricción de acceso por IP (whitelist) o que no requieren autenticación.
intext:”index of” inurl:ftp
Con el siguiente dork se pueden hallar servidores FTP abiertos, que podrían estar exponiendo información sensible, y que no requieren ningún tipo de autenticación.
“Index of” inurl:phpmyadmin
phpMyAdmin es una herramienta del stack de LAMP (Linux, Apache, PHP/Perl/Python, MySQL). Este software se utiliza para administrar una base de datos MySQL o MariaDB. Los paneles de inicio de sesión de phpMyAdmin no deberían estar accesibles públicamente y se debe restringir el acceso mediante una lista blanca:
inurl:/wp-content/uploads/ ext:txt “username” AND “password” | “pwd” | “pw”
Esta consulta permite buscar archivos txt con las palabras “username”, “password”, “pwd” o “pw” en sitios web que utilicen el popular gestor de contenidos WordPress.
intitle:”index of” “dump.sql”
Esta consulta expone archivos de backup o volcados de bases de datos que podrían contener información sensible a la cual puede acceder cualquiera, sin necesidad de autenticarse.
Habiendo planteado algunos ejemplos y casos de uso, vemos que las posibilidades son muy amplias. En el caso de que esta temática te resulte interesante, recomendamos visitar la sección de recursos externos.
Por último, vale la pena reflexionar sobre esta herramienta y las opciones que ofrece. Es importante configurar la privacidad de cuentas y servicios expuestos en Internet de forma correcta con el fin de evitar la exposición de información indebida que puede ser utilizada en nuestra contra por actores malintencionados.
Fuente: WeLiveSecurity
Comentarios
Publicar un comentario
siempre es bueno, leer tus comentarios