How to reduce your reliance on "bad" open source packages ✨ RSVP

jcrawler
Release 1.3.0

Asynchronous control flow wrapper to crawl websites

Keywords: crawler, async, await, promises, web scraping, scraper, puppeteer, cheerio, osmosis
License: MIT
Install: npm install jcrawler@1.3.0

Documentation

jcrawler

Asynchronous control flow wrapper to crawl websites

How to Install

  npm install jcrawler

Usage

  const jcrawler = require('jcrawler')
  const puppeteer = require('puppeteer')

  (async () => {
    const crawler = jcrawler({
      puppeteer,
      concurrency: 2,
      rateLimit: 1000, // 1 second
      retries: 5,
      retryInterval: 1000, // 1 second
      backoff: 2, // multiplies the retryInterval for each retry
      log: true
    })

    crawler
      .on('data', data => console.log(data)) // events: data, error and end
      .on('error', err => console.error(err))
      .on('end', (data, results) => console.log(results.timer.time))

    const fruits = ['apple', 'banana', 'orange']

    await crawler.each(fruits, async (browser, page, fruit) => {
      // using puppeteer
      await page.goto('http://google.com')
      await page.type("input[title='Search']", fruit)
      await page.click("input[value=\"I'm Feeling Lucky\"]")
      await page.screenshot({ path: `${fruit}.png`) })
    })
  })()

License

MIT License - Daniel Sousa

Dependencies: 0
Dependent packages: 3
Dependent repositories: 1
Total releases: 8
Latest release: Jan 31, 2018
First release: Dec 8, 2017
Stars: 5
Forks: 0
Watchers: 1
Contributors: 1
Repository size: 35.2 KB
SourceRank: 9

Source repo 2FA enabled: TEXT!
Package manager 2FA enabled: TEXT!
Is security responsive: TEXT!
Dependencies are managed: TEXT!
Issue-free release available: TEXT!
Succession plan available: TEXT!
Package manager 2FA enabled: TEXT!

Releases

1.3.0: Jan 31, 2018
1.2.0: Jan 10, 2018
1.1.0: Jan 10, 2018
1.0.2: Dec 14, 2017
1.0.1: Dec 13, 2017
1.0.0: Dec 10, 2017
0.1.1: Dec 8, 2017
0.1.0: Dec 8, 2017

Contributors

See all contributors

Something wrong with this page? Make a suggestion

Export .ABOUT file for this package

Last synced: 2022-06-19 04:01:25 UTC

jcrawler
Release 1.3.0

Release 1.3.0

1.3.0

1.2.0

1.1.0

1.0.2

1.0.1

1.0.0

0.1.1

0.1.0

Documentation

jcrawler

How to Install

Usage

License

Stats

Development practices

Releases

Contributors

jcrawler Release 1.3.0

Release 1.3.0 Toggle Dropdown 1.3.0 1.2.0 1.1.0 1.0.2 1.0.1 1.0.0 0.1.1 0.1.0

Documentation

jcrawler

How to Install

Usage

License

Stats

Development practices

Releases

Contributors

jcrawler
Release 1.3.0

Release 1.3.0

1.3.0

1.2.0

1.1.0

1.0.2

1.0.1

1.0.0

0.1.1

0.1.0