icw-lib

Instagram data crawler.


License
MIT
Install
pip install icw-lib==2.0.1

Documentation

icw-lib

PyPI version

Libreria python creada para descargar datos de una fotograf铆a de Instagram.

Instalaci贸n

Para instalar la 煤ltima versi贸n desde PyPi, utiliza:

pip3 install icw-lib

O instala la 煤ltima versi贸n manualmente desde Github:

git clone https://github.com/Haneawa/icw-lib
cd icw-lib
python setup.py install

Uso b谩sico

from icw-lib.Crawler import Crawler
from icw-lib.Download import Download
from icw-lib.Validator import Validator
 
# Crea las instancias de las clases importadas
validator = Validator()
crawler   = Crawler()
download  = Download()

# Crea una variable con el enlace de Instagram.
link = "https://www.instagram.com/p/Bl7-bMwgSNn/"

# Valida el enlace utilizando un m茅todo de la clase Validator.
validated = validator.Validate(link)
if validated is True:
  # Comienza el procesado del enlace y su posterior descarga.
  process = crawler.Crawl(link)
  
  # Puedes obtener los siguientes datos directo del enlace.
  link    = crawler.GetLink(process)
  account = crawler.GetAccountname(process)
  
  # Inicia la descarga con el m茅todo download de la clase Download.
  # La imagen se habr谩 descargado en el directorio por defecto (images).
  download.Download(link, account)
  
 else:
  print("隆El link no es valido!")
  

Clases

Nombre de clase Descripci贸n simple
Download Realiza la conexi贸n con el codigo fuente y guarda la informaci贸n requerida.
Validator Valida los enlaces mediante la comparaci贸n con una expresi贸n regular.
Crawler Obtiene el c贸digo fuente y lo filtra seg煤n los requerimentos dados.

Download Class

Nombre del m茅todo Sintaxis de m茅todo Argumentos requeridos Descripci贸n
Download Downloader() string (link de la imagen) Inicializador de la clase.
Download* Download() null (no requiere) M茅todo de descarga del enlace, utiliza el enlace provisto en la creaci贸n de la instancia.
Saver Saver() null (no requiere) Este m茅todo maneja el nombre del archivo y evita una sobreescritura renombrando s铆 se da el caso.
Sufix AddSufix() null (no requiere) M茅todo que a帽ade un subfijo de archivo al filename.

*Download: hace referencia a el nombre duplicado, pertenece un m茅todo de la clase con el mismo nombre.

Validator Class

Nombre del m茅todo Sintaxis de m茅todo Argumentos requeridos Descripci贸n
Validator Validator() string (link de la imagen) Inicializador de la clase.
Validate Validate() null (requiere) Valida si el enlace proviene de una imagen de Instagram mediante el match con una expresi贸n regular.

Crawler Class

Nombre del m茅todo Sintaxis de m茅todo Argumentos requeridos Descripci贸n
Crawler Crawler() string (link de la imagen) Inicializador de la clase crawler.
Crawl Crawl() null (no requiere) Obtiene el codigo fuente directo del enlace provisto en el constructor de la clase crawler.
Get link GetLink() BeautifulSoup plain text (c贸digo fuente del enlace) Filtra la informaci贸n que contiene el c贸digo fuente y encuentra el link a la p谩gina web que contiene la imagen solamente.
Get account name GetAccountname() BeautifulSoup plain text (c贸digo fuente del enlace) Filtra la informaci贸n que contiene el c贸digo fuente y encuentra el nombre de la cuenta solamente.

Requerimientos.

Python 3.6 BeautifulSoup