Utilice un complemento para simular el tráfico humano
import NextCaptcha from 'nextcaptcha-ts';
import puppeteer from 'puppeteer';
Luego, abra una instancia de Chrome y navegue hasta la página de demostración.
const url = "https://www.google.com/recaptcha/api2/demo"
const browser = await puppeteer.launch({});
const page = await browser.newPage();
await page.goto(url, {
waitUntil: 'networkidle0',
});
El siguiente paso es localizar la clave del sitio web CAPTCHA y la URL del sitio web en el
Cliente NextCaptcha, que devuelve la solución de texto. Guárdelo en la variable data.solution.gRecaptchaResponse.
const data = await client.recaptchaV2({websiteKey, websiteURL: url});
console.log('gRecaptchaResponse: ', data.solution.gRecaptchaResponse);
console.log('submitting form .. ');
await Promise.all([
page.click('#recaptcha-demo-submit'),
page.waitForNavigation({ waitUntil: "networkidle0" })
]);
console.log('making a screenshot ...');
await page.screenshot({ path: 'screenshot.png' });
console.log('closing browser .. ');
await browser.close();
import NextCaptcha from 'nextcaptcha-ts';
import puppeteer from 'puppeteer';
const url = "https://bot.sannysoft.com"
const browser = await puppeteer.launch({
headless: true
});
const page = await browser.newPage();
await page.goto(url, {
waitUntil: 'networkidle0',
});
console.log('making a screenshot ...');
await page.screenshot({ path: 'screenshot.png' });
await sleep(30000)
console.log('closing browser .. ');
await browser.close();
function sleep(time = 1000) {
return new Promise((resolve) => {
setTimeout(() => {
resolve(true)
}, time)
})
}
Mostrará que está presente WebDrive (falló)
¡Acceso denegado! sannysoft detectó tráfico no humano y bloqueó nuestro bot. Aquí es donde viene al rescate el puppeteer-extra-plugin-stealth, un complemento para puppeteer-extra y dramaturgo-extra para evitar la detección. Hará que su tráfico parezca más manual y evitará que se bloquee, es decir, con CAPTCHA.
Para empezar, instale el paquete Stealth.
import puppeteer from 'puppeteer-extra';
import puppeteer-extra-plugin-stealth from 'puppeteer-extra-plugin-stealth';
const StealthPlugin = require('puppeteer-extra-plugin-stealth')
puppeteer.use(StealthPlugin())
luego usa al titiritero como el normal
const url = "https://bot.sannysoft.com"
const browser = await puppeteer.launch({
headless: true
});
const page = await browser.newPage();
await page.goto(url, {
waitUntil: 'networkidle0',
});
console.log('making a screenshot ...');
await page.screenshot({ path: 'screenshot.png' });
await sleep(30000)
console.log('closing browser .. ');
await browser.close();
function sleep(time = 1000) {
return new Promise((resolve) => {
setTimeout(() => {
resolve(true)
}, time)
})
}
Veamos el resultado:
¡Éxito! Esto ayuda a evitar CAPTCHA con Puppeteer.