All spiders go here

Spiders are based on Scrapy.

Configuration

Create a file config.yml with the following info:

    CRAWLERA_USER: abc
    CRAWLERA_PASS: abc
    drivername: postgres
    username: postgres
    host: localhost
    port: 5432
    password: pass
    database: manolo
    api_key: scrapinghub's api key
    sh_project: scrapinghub's project
    scraping_past_number_of_days: 14
    
    # spiders that are banned when working from scrapinghub.com
    banned_spiders:
      - inpe

The database credentials are needed so that the spider will upload data to the production database.

List of Entities

Ministerio de Transportes y Comunicaciones
- url: http://scrv-reporte.mtc.gob.pe/
Ministerio de la Mujer
- url: http://webapp.mimp.gob.pe:8080/visitaweb/
Ministerio de Energia y Minas
- url: http://intranet.minem.gob.pe/GESTION/visitas_pcm/Busqueda/
Instituto Nacional Penitenciario
- url: http://visitasadm.inpe.gob.pe/VisitasadmInpe/Controller
Ministerio de Defensa
- url: http://www.mindef.gob.pe/visitas/qryvisitas.php
Presidencial del Consejo de Ministros
- url: http://hera.pcm.gob.pe/Visitas/controlVisitas/index.php?r=consultas/visitaConsulta/index
Organismo Supervisor de las Contrataciones del Estado
- url: http://visitas.osce.gob.pe/controlVisitas/index.php?r=consultas/visitaConsulta/index
Ministerio de Produccion
- url: http://www2.produce.gob.pe/produce/transparencia/visitas/
Tribunal Constitucional
- url: http://tc.gob.pe/transparencia/visitas/
Ministerio de Cultura
- url: http://visitas.mcultura.gob.pe/?r=consultas/visitaConsulta/index
Ministerio de Justicia
- url: http://app3.minjus.gob.pe:8080/visita_web/consulta_visita_comision
Ministerio de Relaciones Exteriores
- url: http://visitas.rree.gob.pe/consultavisitas/
Ministerio del Trabajo
- url: http://www.trabajo.gob.pe/visitas.php
Ministerio de Educacion
- url: http://visitasmed.perueduca.edu.pe/controlVisitas/index.php?r=consultas/visitaConsulta
Ministerio de Salud
- url: http://intranet5.minsa.gob.pe/RegVisitasCons/listado.aspx
Ministerio del Ambiente
- url: http://visitas.minam.gob.pe/frmConsulta.aspx
Ministerio de Agricultura y Riesgo
- url: http://sistemas.minag.gob.pe/visitas/controlVisitas/index.php?r=consultas/visitaConsulta
Ministerio de Desarrollo e Inclusion social
- url: http://sdv.midis.gob.pe/sis_visita/Transparencia/Transparencia/TransparenciaVisitas
Ministerio de Comercio Exterior y Turismo
- url: http://www.mincetur.gob.pe/visitaspublico/Visitas/FrmVisitantes.aspx
Congreso de la Republica
- url: http://regvisitas.congreso.gob.pe/regvisitastransparencia/
Presidencia
- url: http://www.presidencia.gob.pe/visitas/consulta_visitas.php
Ministerio de Vivienda
- url: http://geo.vivienda.gob.pe/Visitas/controlVisitas/index.php?r=consultas/visitaConsulta/index

Run this way

scrapy crawl SPIDER_NAME -a date_start=DATE_ISO_FORMAT -a date_end=DATE_ISO_FORMAT

Name		Name	Last commit message	Last commit date
Latest commit History 302 Commits
manolo_scraper		manolo_scraper
.gitignore		.gitignore
.travis.yml		.travis.yml
CREDITS		CREDITS
Makefile		Makefile
README.md		README.md
requirements-testing.txt		requirements-testing.txt
requirements.txt		requirements.txt
run_scraper.sh		run_scraper.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

All spiders go here

Configuration

List of Entities

Run this way

About

Releases

Packages

Languages

matiskay/manolo_scraper

Folders and files

Latest commit

History

Repository files navigation

All spiders go here

Configuration

List of Entities

Run this way

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages