从SQL Server导出CSV数据导入到Neo4j图形数据库

问题描述:

我需要从SQL Server批量导入一些高度连接的数据到Neo4j进行分析。从SQL Server导出CSV数据导入到Neo4j图形数据库

有2个链接Neo4j的开发者指南中discusss这样的:

我第一次尝试从SQL Server导入和生成CSV文件导入数据导出向导无法将我的表中的列加载到节点属性中。

有没有人知道配置SSIS包以产生符合Neo4j要求的CSV导出的指南?

我没有指导,以指向你,但我可以为你指明正确的方向来解决这个问题你自己:

  • 不要使用导入导出向导 - 这是非常有限在您配置平面文件目标的能力中,它不会允许您修复管道中的数据。
  • 听起来就像他们想要一个标题行一样。这意味着您需要确保数据的第一行是。如果您的数据来自SQL,则可以使用UNION完成。即

    SELECT 'Column1' as Column1 
        , 'Column2' as Column2 
    UNION 
    SELECT <actual data from my table> 
    
  • 将平面文件连接管理器通过

  • 您可以使用派生列或脚本任务,把引号特殊的“第一个数据行中列名”检查有标题行在文本字符或报价:

    - "Special character in non-quoted text ← make sure unusual text is always quoted" 
    - "stray quotes – standalone double or single quote in the middle 
    of non-quoted text, or non-escaped quotes in quoted text ← escape 
    or remove stray quotes" 
    

每链接中的建议,您可以使用CSVkit或爸爸解析来检查你最后的问题在尝试将其上传到neo4j之前,您可以使用CSV文件。通常,这些数据质量问题是特定于您的域的,一旦少数问题得到解决,就不需要进一步照顾和喂养。