解析Java中的巨大XML

问题描述:

我有一个需要使用Java解析的20 GB XML文件。有人知道如何解析这样一个大文件吗?常规文件IO操作不起作用并抛出错误。解析Java中的巨大XML

谢谢

+1

也许尝试使用缓冲区来读取它的一部分。无论如何20GB的XML听起来像这是一个糟糕的使用XML。 plesae解释为什么这么大。 – Gilad 2013-02-20 22:58:53

您可能无法一次将整个文件解析到DOM树或类似文件中,但流式方法(如SAX或StAX)应该可以正常工作。

一般来说,20GB是非常不寻常的。唯一可能的解决方案是使用一些SAX解析器,如果您不能预处理该文件并将其分割成更小的一些块。只要您可以写入文件,它不应该对文件造成任何IO错误。