Skip to content

garagelab/cuits

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

CUITs.org

CUITs.org es una base de datos abierta de información sobre personas físicas y jurídicas.

Scraping

Por el momento, la información sale de Argentina Compra.

Hay dos procesos que corren en momentos diferentes:

  • bin/argentina-compra-list: Obtiene los IDs de todos los proveedores listados. Es un proceso lento dado que corre una búsqueda sobre muchos registros (y parece que no están paginando bien el resultado). Como es lento, queda separado para poder correrse en algún momento de la noche. Los IDs se guardan en Redis, para que otro worker los tome.

  • bin/argentina-compra-fetch: Dados los IDs de proveedores encolados en Redis, hace scraping de la página de cada proveedor, normaliza un poco los datos y los guarda también en Redis.

Licencia

MIT.

About

Base de datos abierta de CUITs de Argentina

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages