Accueil > > > ASPIRATEUR DE GALERIES INTERNET
ASPIRATEUR DE GALERIES INTERNET
Information sur la source
Description
Hi, Cette idée trotte depuis un bail dans ma tête.. Marre de télécharger une par une les images d'une galerie ? Pourquoi pas faire quelques sockets mIRC qui vous simplifieront la vie ? :D Ca c'est pour l'idée.. Il existe des aspirateurs de site très complets et puissants, je soumets ce code car il permet de voir quelques trucs : - accès à une page web en sockets - téléchargement d'un document en sockets (avec retrait des en têtes HTTP préalablement..) - l'utilisation fantastique de /echo -s ! =] Deux exemples sont fournis dans le code pour vous montrer. Je place le code en initié pour éviter qu'il ait peur au milieu des répondeurs et away systemz... Je n'attends pas particulièrement de commentaires sur mon "style" en mIRC lol
Source
- ;-------------------------------------------
- ; Aspirateur de galeries web / Pada / 2006
- ;
- ; - cf le code pour des exemples
- ; - presque aucune vérif coté paramètres n'est effectuée
- ; => préciser un path valide !!
- ; - pas testé avec des espaces dans le path
- ; - je sais que j'aurais pu factoriser les on sock*,
- ; ca n'aurait fait que compliquer le code
- ; et le rendre hermétique à toute évolution
- ; - marche avec les liens <a> classiques a priori..
- ; (relatif/absolu, non testé sur les absolus)
- ; - formats détectés : png/jpg/jpeg/gif
- ; (changer le masque de regex au besoin)
- ;
- ;-------------------------------------------
-
-
- ;aliases exemples (héhé je spamme pour mon sport le vtt trial ^^)
- alias ex1 dl_img http://www.espacetrial.com/demos-compets/knokke/knokke/knokke-09.jpg knokke-09.jpg
- alias ex2 mkdir trial | dl_gallery http://www.espacetrial.com/demos-compets/knokke/ trial/
-
-
- ;-------------------------------
- ; aspiration d'une page/galerie
- ; /dl_gallery <url> <path> [prefix]
- ;-------------------------------
- alias dl_gallery {
- sockclose dl_img
- hfree -w DL_Gallery
- h gal_site $gettok($remove($$1,http://),1,47)
- h gal_get $remove($1,http://,$h(gal_site))
- h gal_path $iif($right($$2,1) !isin \/,$2 $+ /,$2)
- h gal_prefix $3
- h gal_N 0
- h gal_C 1
- h gal_end 0
- sockopen dl_gallery $h(gal_site) 80
- }
- on *:sockopen:dl_gallery:{
- if ($sockerr) {
- echo -a * /dl_gallery : erreur de connexion au site ( $h(gal_site) )
- return
- }
- echo 4 -s * Aspiration de http:// $+ $h(gal_site) $+ $h(gal_get) en cours ...
- sockwrite -n $sockname GET $h(gal_get) HTTP/1.1
- sockwrite -nt $sockname Host: $h(gal_site)
- sockwrite -n $sockname
- .timerdl_gal_end 1 5 dl_gal_end
- }
- on *:sockread:dl_gallery:{
- if ($sockerr) {
- echo -a * /dl_gallery : erreur de transaction ( $h(gal_site) )
- return
- }
- sockread &a
- var %a 1,%c 1
-
- ;si lien coupé en tampon
- if $h(TempA) {
- if $bfind(&a,1,62) {
- var %a $ifmatch
- dl_detectlink $h(TempA) $+ $bvar(&a,1,%a).text
- }
- h TempA
- }
-
- ;détection d'autres liens
- while ($bfind(&a,%a,60 97 32) || $bfind(&a,%a,60 65 32)) {
- var %a1 = $bfind(&a,%a,60 97 32)
- var %a2 = $bfind(&a,%a,60 65 32)
- var %first = $iif(%a1 < %a2,$iif(%a1,%a1,%a2),$iif(%a2,%a2,%a1))
- %a = $iif(($bfind(&a,%first,62) <= $calc(%first + 500)) && $bfind(&a,%first,62),$bfind(&a,%first,62),$calc(%first + 1))
-
- ;détection de lien
- ;lien coupé
- if (%a == $calc(%first + 1)) {
- h TempA $bvar(&a,%first,500).text
- ;echo -s Mise en tampon : $bvar(&a,%first,500).text
- }
- ;lien ok
- else {
- dl_detectlink $bvar(&a,%first,$calc(%last - %first + 1)).text
- }
- ;timeout
- .timerdl_gal_end 1 5 dl_gal_end
- ;sécurité
- if (%c >= 2000) { break }
- inc %c
- }
-
- }
- on *:sockclose:dl_gallery:{
- dl_gal_end
- }
- alias dl_gal_end {
- if !$h(gal_end) {
- h gal_end 1
- sockclose dl_gallery
- .timerdl_gal_end off
- echo 4 -s * Gallerie analysée ! $h(gal_N) images ont été trouvées.
- echo 4 -s * Téléchargement des images en cours...
- dl_treatqueue
- }
- }
-
- alias dl_detectlink {
- ;echo 12 -s Lien détecté -> $1-
- if $regex($1-,/href="?([^>" ]+?\.(?:jpg|jpeg|png|gif))"?/i) {
- h gal_N $calc($h(gal_N) +1)
- echo 5 -s * Image détectée : $h(gal_N) -> $remove($regml(1),")
- dl_addqueue $h(gal_N) $h(gal_site) $+ $h(gal_get) $regml(1)
- }
- }
-
- ;--------------------------------
- ; gestion de la queue list
- ; /dl_addqueue <numero_item> <page> <url_img>
- ; /dl_treatqueue
- ;--------------------------------
- alias dl_addqueue {
- ;url relative
- if (http:// != $left($$3,7)) {
- ;url gallerie - fichier
- if (. isin $gettok($$2,-1,47)) || (? isin $gettok($$2,-1,47)) { var %url_site = $remove($2,$gettok($2,-1,47)) }
- else { var %url_site = $$2 }
- var %url_site = http:// $+ $iif(/ == $right(%url_site,1),%url_site,%url_site $+ /)
- ;url image
- var %img = %url_site $+ $3
- }
- ;url absolue
- else {
- var %img = $3
- }
- h queue_ $+ $$1 %img
- }
- alias dl_treatqueue {
- var %c = $h(gal_C)
- var %url = $h(queue_ $+ %c)
- if !%url && !$sock(dl_img).status {
- echo 4 -s * Téléchargements terminés !
- echo 4 -s * Accès aux images : /run $shortfn($h(gal_path))
- return
- }
- elseif !$sock(dl_img).status {
- dl_img %url $h(gal_path) $+ $h(gal_prefix) $+ $gettok(%url,-1,47)
- h gal_C $calc($h(gal_C) + 1)
- }
- ;les timers ici sont volontaires, histoire que le /dl_img reste indépendant,
- ;plutot qu'un appel a la queue en sockclose du dl_img =]
- .timer 1 1 dl_treatqueue
- }
-
-
- ;--------------------------------
- ; téléchargement d'une image
- ; /dl_img <url> <nom_sortie>
- ;--------------------------------
- alias dl_img {
- sockclose dl_img
- h img_site $gettok($remove($$1,http://),1,47)
- h img_get $remove($1,http://,$h(img_site))
- h img_path $$2
- h img_end 0
- sockopen dl_img $h(img_site) 80
- }
- on *:sockopen:dl_img:{
- if ($sockerr) {
- echo -a * /dl_img : erreur de connexion au site ( $h(img_site) )
- return
- }
- echo 5 -s * Téléchargement de http:// $+ $h(img_site) $+ $h(img_get) ...
- .remove $h(img_path)
- sockwrite -n $sockname GET $h(img_get) HTTP/1.1
- sockwrite -nt $sockname Host: $h(img_site)
- sockwrite -nt $sockname Referer: http:// $+ $h(gal_site) $+ $h(gal_get)
- sockwrite -n $sockname
- .timerdl_img_end 1 5 dl_img_end
- }
- on *:sockread:dl_img:{
- if ($sockerr) {
- echo -a * /dl_img : erreur de transaction ( $h(img_site) )
- return
- }
- sockread &a
- ;coupure des en têtes
- if $bfind(&a, 1,$+($cr,$lf,$cr,$lf)) {
- bcopy -z &b 1 &a $calc($ifmatch + 4) -1
- bunset &a
- if $bvar(&b,0) {
- bcopy &a 1 &b 1 -1
- }
- }
- ;echo -s Debug : $bvar(&a,1,$bvar(&a,0)).text
- if $bvar(&a,0) {
- bwrite $h(img_path) -1 -1 &a
- }
- .timerdl_img_end 1 5 dl_img_end
- }
- on *:sockclose:dl_img:{
- dl_img_end
- }
- alias dl_img_end {
- if !$h(img_end) {
- h img_end 1
- sockclose dl_img
- .timerdl_img_end off
- echo 5 -s * Téléchargement terminé.
- }
- }
-
- ;-----------------------------------
- ; alias hadd/$hget par simplicité
- ; /h <item> [value]
- ; $h(>item>)
- ;-----------------------------------
- Alias h {
- if $isid { return $hget(DL_Gallery,$$1) }
- elseif ($2 == $null) { hdel DL_Gallery $$1 }
- else { hadd -m DL_Gallery $$1 $2- }
- }
;-------------------------------------------
; Aspirateur de galeries web / Pada / 2006
;
; - cf le code pour des exemples
; - presque aucune vérif coté paramètres n'est effectuée
; => préciser un path valide !!
; - pas testé avec des espaces dans le path
; - je sais que j'aurais pu factoriser les on sock*,
; ca n'aurait fait que compliquer le code
; et le rendre hermétique à toute évolution
; - marche avec les liens <a> classiques a priori..
; (relatif/absolu, non testé sur les absolus)
; - formats détectés : png/jpg/jpeg/gif
; (changer le masque de regex au besoin)
;
;-------------------------------------------
;aliases exemples (héhé je spamme pour mon sport le vtt trial ^^)
alias ex1 dl_img http://www.espacetrial.com/demos-compets/knokke/knokke/knokke-09.jpg knokke-09.jpg
alias ex2 mkdir trial | dl_gallery http://www.espacetrial.com/demos-compets/knokke/ trial/
;-------------------------------
; aspiration d'une page/galerie
; /dl_gallery <url> <path> [prefix]
;-------------------------------
alias dl_gallery {
sockclose dl_img
hfree -w DL_Gallery
h gal_site $gettok($remove($$1,http://),1,47)
h gal_get $remove($1,http://,$h(gal_site))
h gal_path $iif($right($$2,1) !isin \/,$2 $+ /,$2)
h gal_prefix $3
h gal_N 0
h gal_C 1
h gal_end 0
sockopen dl_gallery $h(gal_site) 80
}
on *:sockopen:dl_gallery:{
if ($sockerr) {
echo -a * /dl_gallery : erreur de connexion au site ( $h(gal_site) )
return
}
echo 4 -s * Aspiration de http:// $+ $h(gal_site) $+ $h(gal_get) en cours ...
sockwrite -n $sockname GET $h(gal_get) HTTP/1.1
sockwrite -nt $sockname Host: $h(gal_site)
sockwrite -n $sockname
.timerdl_gal_end 1 5 dl_gal_end
}
on *:sockread:dl_gallery:{
if ($sockerr) {
echo -a * /dl_gallery : erreur de transaction ( $h(gal_site) )
return
}
sockread &a
var %a 1,%c 1
;si lien coupé en tampon
if $h(TempA) {
if $bfind(&a,1,62) {
var %a $ifmatch
dl_detectlink $h(TempA) $+ $bvar(&a,1,%a).text
}
h TempA
}
;détection d'autres liens
while ($bfind(&a,%a,60 97 32) || $bfind(&a,%a,60 65 32)) {
var %a1 = $bfind(&a,%a,60 97 32)
var %a2 = $bfind(&a,%a,60 65 32)
var %first = $iif(%a1 < %a2,$iif(%a1,%a1,%a2),$iif(%a2,%a2,%a1))
%a = $iif(($bfind(&a,%first,62) <= $calc(%first + 500)) && $bfind(&a,%first,62),$bfind(&a,%first,62),$calc(%first + 1))
;détection de lien
;lien coupé
if (%a == $calc(%first + 1)) {
h TempA $bvar(&a,%first,500).text
;echo -s Mise en tampon : $bvar(&a,%first,500).text
}
;lien ok
else {
dl_detectlink $bvar(&a,%first,$calc(%last - %first + 1)).text
}
;timeout
.timerdl_gal_end 1 5 dl_gal_end
;sécurité
if (%c >= 2000) { break }
inc %c
}
}
on *:sockclose:dl_gallery:{
dl_gal_end
}
alias dl_gal_end {
if !$h(gal_end) {
h gal_end 1
sockclose dl_gallery
.timerdl_gal_end off
echo 4 -s * Gallerie analysée ! $h(gal_N) images ont été trouvées.
echo 4 -s * Téléchargement des images en cours...
dl_treatqueue
}
}
alias dl_detectlink {
;echo 12 -s Lien détecté -> $1-
if $regex($1-,/href="?([^>" ]+?\.(?:jpg|jpeg|png|gif))"?/i) {
h gal_N $calc($h(gal_N) +1)
echo 5 -s * Image détectée : $h(gal_N) -> $remove($regml(1),")
dl_addqueue $h(gal_N) $h(gal_site) $+ $h(gal_get) $regml(1)
}
}
;--------------------------------
; gestion de la queue list
; /dl_addqueue <numero_item> <page> <url_img>
; /dl_treatqueue
;--------------------------------
alias dl_addqueue {
;url relative
if (http:// != $left($$3,7)) {
;url gallerie - fichier
if (. isin $gettok($$2,-1,47)) || (? isin $gettok($$2,-1,47)) { var %url_site = $remove($2,$gettok($2,-1,47)) }
else { var %url_site = $$2 }
var %url_site = http:// $+ $iif(/ == $right(%url_site,1),%url_site,%url_site $+ /)
;url image
var %img = %url_site $+ $3
}
;url absolue
else {
var %img = $3
}
h queue_ $+ $$1 %img
}
alias dl_treatqueue {
var %c = $h(gal_C)
var %url = $h(queue_ $+ %c)
if !%url && !$sock(dl_img).status {
echo 4 -s * Téléchargements terminés !
echo 4 -s * Accès aux images : /run $shortfn($h(gal_path))
return
}
elseif !$sock(dl_img).status {
dl_img %url $h(gal_path) $+ $h(gal_prefix) $+ $gettok(%url,-1,47)
h gal_C $calc($h(gal_C) + 1)
}
;les timers ici sont volontaires, histoire que le /dl_img reste indépendant,
;plutot qu'un appel a la queue en sockclose du dl_img =]
.timer 1 1 dl_treatqueue
}
;--------------------------------
; téléchargement d'une image
; /dl_img <url> <nom_sortie>
;--------------------------------
alias dl_img {
sockclose dl_img
h img_site $gettok($remove($$1,http://),1,47)
h img_get $remove($1,http://,$h(img_site))
h img_path $$2
h img_end 0
sockopen dl_img $h(img_site) 80
}
on *:sockopen:dl_img:{
if ($sockerr) {
echo -a * /dl_img : erreur de connexion au site ( $h(img_site) )
return
}
echo 5 -s * Téléchargement de http:// $+ $h(img_site) $+ $h(img_get) ...
.remove $h(img_path)
sockwrite -n $sockname GET $h(img_get) HTTP/1.1
sockwrite -nt $sockname Host: $h(img_site)
sockwrite -nt $sockname Referer: http:// $+ $h(gal_site) $+ $h(gal_get)
sockwrite -n $sockname
.timerdl_img_end 1 5 dl_img_end
}
on *:sockread:dl_img:{
if ($sockerr) {
echo -a * /dl_img : erreur de transaction ( $h(img_site) )
return
}
sockread &a
;coupure des en têtes
if $bfind(&a, 1,$+($cr,$lf,$cr,$lf)) {
bcopy -z &b 1 &a $calc($ifmatch + 4) -1
bunset &a
if $bvar(&b,0) {
bcopy &a 1 &b 1 -1
}
}
;echo -s Debug : $bvar(&a,1,$bvar(&a,0)).text
if $bvar(&a,0) {
bwrite $h(img_path) -1 -1 &a
}
.timerdl_img_end 1 5 dl_img_end
}
on *:sockclose:dl_img:{
dl_img_end
}
alias dl_img_end {
if !$h(img_end) {
h img_end 1
sockclose dl_img
.timerdl_img_end off
echo 5 -s * Téléchargement terminé.
}
}
;-----------------------------------
; alias hadd/$hget par simplicité
; /h <item> [value]
; $h(>item>)
;-----------------------------------
Alias h {
if $isid { return $hget(DL_Gallery,$$1) }
elseif ($2 == $null) { hdel DL_Gallery $$1 }
else { hadd -m DL_Gallery $$1 $2- }
}
Conclusion
Je remercie bien évidemment mes parents sans qui je n'en serais pas là aujourd'hui.
Historique
- 12 août 2006 03:00:48 :
- Vérification longueur &binvar, pour éviter des erreurs en status (le snippet fonctionnait quand même)
- 12 août 2006 03:12:24 :
- Amélioration Regex
- 12 août 2006 04:08:27 :
- Ajout d'un header "Referer" : certains sites bloquent l'accès direct à leurs images par un .htaccess basé sur le http referer. Ce header permet de passer outre la limitation..
- 12 août 2006 04:13:36 :
- Bug sur les urls raccourcies type url/url/?blah=bleh (le path pour les images était mal construit..)
- 12 août 2006 13:48:09 :
- Corrections diverses grâce à RCA ArKanis =] J'updaterai plus en profondeur d'ici quelques jours
- 13 août 2006 14:38:12 :
- Désormais la page html est chargée en binaire, les détections étaient foirées lorsque la variable "sockreaded" était trop longue.. ce qui empêchait de détecter certains liens
Ajout d'une option pour ajouter un prefixe aux noms des images téléchargées
Par conséquent les path a espaces ne marcheront pas, c'est sûr ^^, utiliser $shortfn
Sources du même auteur
Sources de la même categorie
Commentaires et avis
Discussions en rapport avec ce code source dans le forum
Comment connecter un Socket ( sock ) à travers un proxy ? [ par biggoude ]
JE souhaite connecter un Socket sur un server IRC en le passant par un Proxy, comment faire cela ?Merci
Plus aucun socket ne répond... [ par Kolibot ]
Aucun socket ne répond depuis qqs jours... quelqu'un aurait'il une idée...By Koli
dcc send en socket [ par abdoulax ]
yo j'aurai besoin que qlq1 m'explik ac précsion le protocole du dcc send . ou sinon il me faudrai un exemple d'addon ki reproduirai le dcc send en soc
socket tokens avec gametiger.net [ par pcgpegase ]
bjour / bsoir tout les gens ! :)Bon alors étant un newbie du scripting irc et n'ayant pas trouvé de réponses à mon problème je demande votre aide :>
socket ! [ par Le_Corse ]
Salut,Quelqun connaitrais pas un bon tuto pour les sockets Svp ?merci ^^» Le_Corse
svp aidez moi pour socket news [ par nocomment ]
Bonjour je cherche désésperement une remote sur plein de site qui serai capable de dire les news sur un canal en tapant par exemple !news sur le gener
socket-pingpong [ par samsungman ]
bijour je voudré savoir koment ne pas se faire deconecté a chaque foi kon ce connect a un server ?
socket [ par KiNdErMaXi ]
bonjour,j'aurai voulus savoir comment connecter un socket dans une fenetre (un clone) et pouvoir lui faire faire des actions ( msg, etc ... )j'ai lus
AntiSpam [ par chez_moe ]
Salut les boys , J'ai un leger probleme de spambot sur Undernet pis le seul anti-spam génial que j,ai trouver c'est celui de JHD "socket anti spa
Questions sur les sockets et autres [ par zzzzzz ]
Salut :) J'ai quelques questions en vracs sur les sockets : Peu on déterminer le nom d'un socket ouvert sachant que son pseudo est aléatoir
|
Derniers Blogs
UNE JOLIE-HORLOGE ET PAS QU'UN PEU !UNE JOLIE-HORLOGE ET PAS QU'UN PEU ! par neodante
Pour les possesseurs d'iPhone, ça y est Bijin Tokei - qui se traduit littéralement en Français par " Jolie Horloge " - est arrivé et GRATUITEMENT s'il vous plaît ! Après la version Tokyo, Hokkaido, night club, racing, Gal, "pour les mademoiselles'", . voi...
Cliquez pour lire la suite de l'article par neodante TECHDAYS PARIS 2010 : CONNECTEZ VOS DONNéES à SHAREPOINT 2010 AVEC LES BUSINESS CONNECTIVITY SERVICESTECHDAYS PARIS 2010 : CONNECTEZ VOS DONNéES à SHAREPOINT 2010 AVEC LES BUSINESS CONNECTIVITY SERVICES par ROMELARD Fabrice
Animé par: Gaetan Bouveret et Julien Chomarat Business Connectivity Services (BCS) est dans SharePoint 2010 la version 2 de Business Data Catalog (BDC dans SharePoint 2007). Il s'agit de la solution permettant de visualiser des données provenan...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice [DIVERS] SUIVRE VOS SéRIES PRéFéRéS SUR LA TOILE[DIVERS] SUIVRE VOS SéRIES PRéFéRéS SUR LA TOILE par orion
Comme de nombreux geek, je suis un grand amateur de série TV et je rate régulièrement des épisodes de mes séries préférés. Une solution s'offre à vous avec ce merveilleux site : Tv Gorge - www.tvgorge.com Moteur de recherche à l'appui, vous pouvez ...
Cliquez pour lire la suite de l'article par orion TECHDAYS PARIS 2010 : LA BI DANS SHAREPOINT 2010TECHDAYS PARIS 2010 : LA BI DANS SHAREPOINT 2010 par ROMELARD Fabrice
Animé par: Vincent Bellet et Baptiste Giraudier La BI dans SharePoint 2010, Les nouveaux services d'application dans SP2010 et SQL Server Reporting services 2008 R2. La BI dans SharePoint est généralisée pour tous afin de permettre à tous les coll...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice
Forum
RE : ON RAWMODERE : ON RAWMODE par WorldDMT
Cliquez pour lire la suite par WorldDMT AVERTISSMENT ET KIKKAVERTISSMENT ET KIKK par mouhcine951990
Cliquez pour lire la suite par mouhcine951990
Logiciels
DB-MAIN (9.1.0)DB-MAIN (9.1.0)DB-MAIN is a data-modeling and data-architecture tool. It is designed to help developers and anal... Cliquez pour télécharger DB-MAIN Xilisoft DPG Convertisseur (5.1.37.0120)XILISOFT DPG CONVERTISSEUR (5.1.37.0120)Xilisoft DPG Convertisseur offre aux fans de Nintendo DS une bonne solution leur permettant de dé... Cliquez pour télécharger Xilisoft DPG Convertisseur GraphicsGale (2.01.01)GRAPHICSGALE (2.01.01)GraphicsGale est un logiciel de PixelArt avec de nombreuse fonctionnalités permettant de réalisé ... Cliquez pour télécharger GraphicsGale Architecte 3D (Platinum 2010)ARCHITECTE 3D (PLATINUM 2010)Architecte 3D Platinium vous permet de concevoir facilement les plans votre future maison, de l'é... Cliquez pour télécharger Architecte 3D TeamViewer 5 (TeamViewer 5)TEAMVIEWER 5 (TEAMVIEWER 5)Dépanner un ami,expliquer une manipulation devient un jeu d'enfant.
Prise en main d'un autre ord... Cliquez pour télécharger TeamViewer 5
|