Regalo del Blog FIIS-UNI, script en Python para descargar todas las publicaciones disponibles de la Editorial Taylor & Francis


http://www.searchenginepeople.com/wp-content/uploads/2008/01/ebooks_250x2511.jpg

Gra­cias a   @unimauro , http://unimauro.blogspot.com

Puedes bajar libros, paper, review and jour­nal de la edi­to­r­ial Tay­lor & Fran­cis claro todos los que estén disponibles hasta el 31 de Enero . Fun­ciona en tu Linux.… Hay libros y edi­to­ri­ales de mas de 50 años … así que va a demorar un poco la descarga :D

En tu línea de coman­dos:
# python script_de_unimauro.py

y a esperar …

PD Quién ya haya bajado todo, por fa avisa para compartir …

Aquí el código:
(puedes descar­garlo tam­bién de aquí:   descar­gar)

*******************************************************************************************

import string
import urllib2
import os
import sys
import subprocess

def coma(cad):
try:
ret­code = subprocess.call(cad, shell=True)
print ret­code
if ret­code < 0:
print »sys.stderr, “Pro­ceso Hijo Fallo”, –ret­code
else:
print »sys.stderr, “Pro­ceso Hijo envi­ado”, ret­code
except OSEr­ror, e:
print »sys.stderr, “Eje­cu­cion Fal­l­ida:”, e

s0=“http://www.tandf.co.uk/journals/JanMathMadness/“
ur1=“http://www.informaworld.com/smpp/“
jur=“JanMathMadness“
coma(“mkdir “+jur+” && cd “+jur+”/”)

r0=urllib2.urlopen(s0)
h0=r0.read()

for i in range(1,len(h0.split(“<p class=\“crop\”><a href=\””))):
d=h0.split(“<p class=\“crop\”><a href=\””)[i].split(“\”><img”)[0].split(“\” title=\””)[0][-4:]
n=h0.split(“<p class=\“crop\”><a href=\””)[i].split(“\”><img”)[0].split(“\” title=\””)[1]
s1=h0.split(“<p class=\“crop\”><a href=\””)[i].split(“\”><img”)[0].split(“\” title=\””)[0]
coma(“mkdir “+jur+”/”+d+” && cd “+jur+”/”+d+”/”)
coma(“echo “+n+” > “+jur+”/”+d+”/Journal.txt”)
r1=urllib2.urlopen(s1)
h1=r1.read()

for j in range(1,len(h1.split(“<td nowrap=\“nowrap\” style=\“text-indent: 5px;\”>”))):
s2=ur1+h1.split(“<td nowrap=\“nowrap\” style=\“text-indent: 5px;\”>”)[j][12:43]
coma(“mkdir “+jur+”/”+d+”/”+str(j)+” && cd “+jur+”/”+d+”/”+str(j)+”/”)
r2=urllib2.urlopen(s2)
h2=r2.read()

p=len(h2.split(“title=\“Click to view the PDF fulltext\”>Full Text PDF</a> | <a href=\”./”))-1

for k in range(0,p):

print ur1+h2.split(“title=\“Click to view the PDF fulltext\”>Full Text PDF</a> | <a href=\”./”)[k][-58:-2]
coma(“wget “+ur1+h2.split(“title=\“Click to view the PDF fulltext\”>Full Text PDF</a> | <a href=\”./”)[k][-58:-2])
coma(“mv *.pdf “+jur+”/”+d+”/”+str(j)+”/”)

coma(“cd .. ”)

coma (“cd .. ”)

coma(“ cd ..”)

*******************************************************************************************

Share and Enjoy:
  • Print
  • Digg
  • Sphinn
  • del.icio.us
  • Facebook
  • Mixx
  • Google Bookmarks

Artícu­los relacionados:



, , , , , ,

  1. #1 por almod­hena - enero 19th, 2010 a las 22:18

    hola que tal! per­mí­tame felic­i­tarlo por su exce­lente blog, me encan­taría ten­erlo en mi web de edu­ca­cion .Estoy seguro que su blog sería de mucho interés para mis visitantes!.Si puede sír­vase a con­tac­tarme almodhena@gmail.com

    salu­dos

    Like or Dis­like: Thumb up 0 Thumb down 0

(No será publicado)

  1. No hay trackbacks

Additional comments powered by BackType