Node.js 在 Nodejs 中解析大型 JSON 文件

发布于08月09日

我有一个文件，它以JSON的形式存储了许多JavaScript对象，我需要读取该文件，创建每个对象，并对它们进行处理(在我的例子中，将它们插入数据库).JavaScript对象可以用以下格式表示:

Format A:

[{name: 'thing1'},
....
{name: 'thing999999999'}]

还是Format B:

{name: 'thing1'}         // <== My choice.
...
{name: 'thing999999999'}

注意，...表示很多JSON对象.我知道我可以将整个文件读入内存，然后像这样使用JSON.parse():

fs.readFile(filePath, 'utf-8', function (err, fileContents) {
  if (err) throw err;
  console.log(JSON.parse(fileContents));
});

然而，文件可能非常大，我更喜欢使用流来完成这一点.我看到的流的问题是，文件内容在任何时候都可能被分解成数据块，那么如何在这样的对象上使用JSON.parse()呢？

理想情况下，每个对象都将被读取为一个单独的数据块，但我不确定是否为how to do that.

var importStream = fs.createReadStream(filePath, {flags: 'r', encoding: 'utf-8'});
importStream.on('data', function(chunk) {

    var pleaseBeAJSObject = JSON.parse(chunk);           
    // insert pleaseBeAJSObject in a database
});
importStream.on('end', function(item) {
   console.log("Woot, imported objects into the database!");
});*/

注意，我希望避免将整个文件读入内存.时间效率对我来说并不重要.是的，我可以try 一次读取多个对象，然后一次插入所有对象，但这是一个性能调整——我需要一种保证不会导致内存过载的方法，无论文件中包含多少对象.

我可以 Select 使用FormatA或FormatB，或者其他，请在你的答案中详细说明.谢谢

Node.js 在 Nodejs 中解析大型 JSON 文件

推荐答案

Node.js相关问答推荐

为高流量网站优化Node.js实时通知服务

如何使用MongoDB在Node.js 中向数组中添加项？

如何使用聚合管道交换键值对

无法使用Sequelize连接AWS RDS

如何在mongodb集合中设置数据限制？

我的Node.js应用程序没有将Mongoose方法findByIdAndDelete作为函数进行检测

条件内的表达式

使用 axios 和 Cheerio (Node js) 抓取 google 搜索

合并Shift对象数组以创建最终的排班表

使用 create-expo-app 时如何更改 webpack-config.js 中的哈希函数？

用户与mongoose 的完美搭配

Winston http 日志(log)级别的行为与 info 不同

tsc：当我上传 React+next js 和 node 项目时，在 heroku 找不到

`npm install` 以Killed结尾

node.js 是否支持yields ？

带有加密的nodejs中的SALT和HASH密码

如何在不全局安装的情况下在 Node REPL 中要求 node 模块？

nodejs - 如何读取和输出 jpg 图像？

在 Node.js 中混合使用 JavaScript 和 TypeScript

react-native run-android 无法识别