プラグインを使用して人間の往来をシミュレートする
import NextCaptcha from 'nextcaptcha-ts';
import puppeteer from 'puppeteer';
次に、Chrome インスタンスを開き、デモ ページに移動します。
const url = "https://www.google.com/recaptcha/api2/demo"
const browser = await puppeteer.launch({});
const page = await browser.newPage();
await page.goto(url, {
waitUntil: 'networkidle0',
});
次のステップは、テキスト ソリューションを返す NextCaptcha クライアントの CAPTCHA websiteKey と websiteURL を見つけることです。それを data.solution.gRecaptchaResponse 変数に保存します。
const data = await client.recaptchaV2({websiteKey, websiteURL: url});
console.log('gRecaptchaResponse: ', data.solution.gRecaptchaResponse);
console.log('submitting form .. ');
await Promise.all([
page.click('#recaptcha-demo-submit'),
page.waitForNavigation({ waitUntil: "networkidle0" })
]);
console.log('making a screenshot ...');
await page.screenshot({ path: 'screenshot.png' });
console.log('closing browser .. ');
await browser.close();
import NextCaptcha from 'nextcaptcha-ts';
import puppeteer from 'puppeteer';
const url = "https://bot.sannysoft.com"
const browser = await puppeteer.launch({
headless: true
});
const page = await browser.newPage();
await page.goto(url, {
waitUntil: 'networkidle0',
});
console.log('making a screenshot ...');
await page.screenshot({ path: 'screenshot.png' });
await sleep(30000)
console.log('closing browser .. ');
await browser.close();
function sleep(time = 1000) {
return new Promise((resolve) => {
setTimeout(() => {
resolve(true)
}, time)
})
}
WebDriveが存在している(失敗)と表示されます
アクセスが拒否されました! sannysoft が人間以外のトラフィックを検出し、ボットをブロックしました。ここで、検出を防ぐための puppeteer-extra および playwright-extra 用プラグインである puppeteer-extra-plugin-stealth が役に立ちます。これにより、トラフィックがより手動のように見え、CAPTCHA などでブロックされることがなくなります。
まず、ステルスパッケージをインストールします
import puppeteer from 'puppeteer-extra';
import puppeteer-extra-plugin-stealth from 'puppeteer-extra-plugin-stealth';
const StealthPlugin = require('puppeteer-extra-plugin-stealth')
puppeteer.use(StealthPlugin())
人形遣いを通常の
const url = "https://bot.sannysoft.com"
const browser = await puppeteer.launch({
headless: true
});
const page = await browser.newPage();
await page.goto(url, {
waitUntil: 'networkidle0',
});
console.log('making a screenshot ...');
await page.screenshot({ path: 'screenshot.png' });
await sleep(30000)
console.log('closing browser .. ');
await browser.close();
function sleep(time = 1000) {
return new Promise((resolve) => {
setTimeout(() => {
resolve(true)
}, time)
})
}
出力を見てみましょう:
成功しました!これにより、Puppeteer で CAPTCHA をバイパスできるようになります。