我正在运行一个脚本,登录到一个网站上的认证会话,并单击一个按钮,以下载excel文件。我能够运行它没有问题,而当headless: false,但当headless:true,文件不下载。
我的研究表明浏览器可能在下载完成之前关闭了?我添加了大约15秒的等待,这比下载文件所需的时间要长得多,但仍然得不到任何东西。我尝试的另一个解决方案是手动从userAgent中删除HeadlessChrome子字符串,以防站点阻止它,但这也不起作用。在部署在Heroku上的生产web应用程序中使用的脚本中可以使用headless:false吗?
async function getData () {
try {
const wait = (ms) => new Promise(resolve => setTimeout(resolve, ms))
const browser = await puppeteer.launch();
const page = await browser.newPage();
await page.goto('<url>');
//login
await page.type('#username',username);
await page.click('#signIn');
await wait(4000)
await page.type('#password',password);
await page.click('#signIn');
await page.waitForNavigation();
await page.keyboard.press('Enter'); //click out of any pop up
// //go to merchandising page
await page.click('#m_69-link');
await page.waitForSelector('#ExcelReportButton', {visible: true})
//click on export as excel icon
await wait(4000)
await page.click('#ExcelReportButton');
await wait(15000)
await browser.close();
} catch (error) {
console.log(error)
}
};发布于 2021-01-10 08:26:17
尝试添加额外的头文件,这对我很有效:
await page.setExtraHTTPHeaders({
'Accept-Language': 'en-US,en;q=0.9'
});
await page.setUserAgent('Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Safari/537.36');https://stackoverflow.com/questions/64991534
复制相似问题