Node.js try 使用Puppeteer抓取Twitter时数组空

发布于04月25日

所以我试图在Twitter上抓取一个页面来获取推文:

我想获取元素;单独获取文本、图像、视频，但我不断获取空数组

//Scraper.js
const puppeteer = require('puppeteer');
const fs = require('fs');

async function scrapeTwitter() {
  try {
    const browser = await puppeteer.launch();
    const page = await browser.newPage();
    await page.goto('https://twitter.com/coindesk');
    await page.waitForLoadState('networkidle2');


    const html = await page.content();
    const $ = cheerio.load(html);
    const tweets = $('[data-testid="tweet"]');
    
    const posts = [];
    tweets.each(function () {
      const text = $(this).find('.tweet-text').text().trim();
      const image = $(this).find('.tweet-image').attr('src');
      const video = $(this).find('.tweet-video').attr('src');
      posts.push({ text, image, video });
    });
    
      
    await browser.close();
    
    return posts;
  } catch (error) {
    console.error('Error scraping Twitter:', error);
    return [];
  } 
}

module.exports = scrapeTwitter;

Node.js try 使用Puppeteer抓取Twitter时数组空

推荐答案

Node.js相关问答推荐

Windows上使用ES6+的OpenAPI规范的Express服务器不接受嵌套路由'

为什么在导出的函数中调用node-sqlite3中的数据库方法时不起作用？

如何在MEVN堆栈中结合创建和更新表单流程？

如何从基于JSON的HTML/SCSS模板生成PDF？

mongodb首先自连接，然后根据某些条件与另一个表连接

如何在Node.js的telegraf.js命令中添加参数？

有没有办法判断 UUID 是否是使用 node.js 中的特定命名空间生成的？

$not 的聚合版本是什么？

在 MacOS Ventura 上使用 NVM 安装 node ？

看起来这段代码try GET 请求发送的值变为空白

NestJS TypeORM 可选查询不起作用

bash：npm：找不到命令？

如何在 Node.js 的 console.log() 中创建换行符

使用 Node.js 在内存中缓冲整个文件

如何将`yarn.lock`与`package.json`同步？

JavaScript 异步编程：promise 与生成器

如何在 MongoDB 中查询引用的对象？

Node.js, require.main === 模块

Express.js：没有这样的文件或目录

什么时候应该将函数存储到变量中？