Déterminer le nombre de sous-domaines d'un site

Olivier Duffez (admin)
Membre du personnel
A votre avis, est-il possible de déterminer le nombre de sous-domaines d'un site (quelconque) ? Eventuellement en utilisant les moteurs de recherche...

J'ai pensé à faire une requête du type site:example.com puis à relancer en boucle des requêtes du type site:example.com -site:sousdom1.example.com puis site:example.com -site:sousdom1.example.com -site:sousdom2.example.com en me basant sur chaque nouveau sous-domaine que je trouve dans les 1ers résultats

Mon problème est qu'on est vite limité par la taille de la requête à faire dans le moteur.

Merci d'avance pour vos idées géniales ;-)
 
Nouveau WRInaute
je ne suis pas un genie mais d'apres ce que je sais , un sous-domaine n'est rien d'autre qu'un repertoire en amont du 'www' ?

Si c'est le cas il suffirait (selon moi) de lire l'arboresence du ftp a partir du dossier 'web' et excluant le dossier 'www' ...
 
WRInaute accro
Netcraft te donnera des résultats assez fiables je pense.

Via les moteurs de recherche, j'aurais pensé comme toi, ou alors prendre tous les résultats et extraire le sous-domaine ^^.

Mais Google met plutôt les sous-domaines en avant dans les résultats non ? (cela arrive qu'un sousdomaine se retrouve en queue des résultats ?)
 
WRInaute accro
>> un sous-domaine n'est rien d'autre qu'un repertoire en amont du 'www'

d'une part : "non" :) un sous domaine peut-etre un sous repertoire comme il ne peut ne pas en être

et de deux : je pense qu'Olivier cherches à les connaitre sans avoir les mots de passe FTP sur le compte :)
 
WRInaute accro
Code:
site:example.com -filetype:rss -filetype:html -filetype:php -filetype:htm
en rajoutant au fur et à mesure d'autres extensions, ça marche pas trop mal.
 
WRInaute impliqué
Netcraft n'est pas du tout fiable... il me donne des résultats trés mauvais. Il me trouve 5 sous domaines sur 98 existants...
 
WRInaute impliqué
Olivier, tu cherches à faire une recherche rapide (permettant la recherche sur de multiple ndd) ? ou une recherche unique ?
 
WRInaute accro
Netcraft base ses stats sur une barre, comme Alexa.

Donc si un site a un nom de domaine "planqué" niveau trafic, cela ne passera pas, par contre pour avoir une vu d'ensemble de tous les sous-domaines de google.com par exemple c'est pas mal.
 
WRInaute occasionnel
Google :
inurl:site.tld -site:www.site.tld
Ca sort quelques sous domaines, et il faut un peu filtrer.
Exemple (au hasard ;) ) :
-https://www.google.com/search?num=100&hs=MZJ&hl=fr&client=opera&rls=fr&q=inurl%3Adicodunet.com+-site%3Awww.dicodunet.com&btnG=Rechercher&lr=lang_en%7Clang_fr
 
Olivier Duffez (admin)
Membre du personnel
ça revient à faire site:site.tld -site:www.site.tld ce qui a déjà été proposé non ?
 
WRInaute impliqué
as tu des spiders olivier ?

si oui, il te suffirait de scanner toutes les urls indexées sur google pour le ndd voulu (-https://www.google.com/search?q=site%3Awebrankinfo.com)
de chercher dans le source toutes les chaines de caractères commençant par http:// et de prendre le contenu qui se situe dans la chaine entre "http://" et "."

De refaire la même opération sur yahoo et msn et enfin d'enlever les doublons.
 
Olivier Duffez (admin)
Membre du personnel
scanner toutes les URL indexées... non tout de même je n'imaginais pas faire ça. D'ailleurs toute requête sur un moteur ne renvoit que 1000 résultats tout au plus.

Mais j'ai déjà quelques idées avec vos messages, merci.
 
WRInaute accro
wullon a dit:
ou alors prendre tous les résultats et extraire le sous-domaine ^^.

legoufred a dit:
si oui, il te suffirait de scanner toutes les urls indexées sur google pour le ndd voulu (-https://www.google.com/search?q=site%3Awebrankinfo.com)
de chercher dans le source toutes les chaines de caractères commençant par http:// et de prendre le contenu qui se situe dans la chaine entre "http://" et "."

De refaire la même opération sur yahoo et msn et enfin d'enlever les doublons.
:roll:


Mais c'est dans quel but exactement ?
 
Membre Honoré
Up pour signaler qu'en ce moment :
site:*.example.com

Marche pas mal pour connaître les sous-domaines (qui sont affichés en premier), même si la commande est limitée.
 
Discussions similaires
Haut