每日一结
想要做好一件事真的是不容易
犯的错误:做之前没确认好信息
之前跑了一批大数据,今天要统计结果,发现有个字段的值分布有问题;
这个问题要追溯到分配工作的时候,上级跟我说你去跟数据组确认好某个字段的含义,我就只确认了这一个字段,对要用的其他字段B,理所当然的认为是原始数据表中的X字段,当跑完千万级的数据才发现,源头的数据我就采集错了,两者关系是 对比文献号类型 & 对比文献类型 表面意思相近但具体意思却大不相同。
这个问题是可以避免的,只要但是跟数据组确认好每个要用的字段,就不会出现,导致结果今天没统计出来,因为两个库,花了近一天时间来导出原始数据。
总结:做事之前要确认好需求,不明确的地方一定要问清楚再开始做,不能想当然的自己认为,不要有这种想法!
补救过程
原始数据在数据库A,结果集存在数据库B,dblink网络太慢,采用从A库中把用的字段导入表中,把表Export dmp文件,再把dmp文件上传到B库中
具体实现——ORACEL dmp 导出表,导入表:
- 登录A库查询新建表(需要的字段组成的表),然后选择Tools,选择Export Table,如图:
- 按下图进行下步进行
设置好之后,点击右下角的Export按钮,开始导出dmp文件(这里dmp文件以表的名字命名,不知道不是表名的有没有影响) - 漫长的等待之后dmp文件生成结束
- 登录B库,准备导入dmp文件,不需要提前创建表,导入时候会自动创建
- 按照图片操作
- 等待完成,勾选多次提交的,执行过程中可以看表中数据增长。
遇到的问题
- 安装的PL/SQL绿色版,没有exp,找了一台有exp.exe的,版本又不对,又找了一个版本是10的exp才跑上
- 导入表时,未勾选commit,一直等,库中数据也不动,不知道什么原因,后来发现不勾选是最后一次提交,最后,关闭重新开始,勾选commit多次提交,马上就能看到数据增张。
- 不选中index,有的话,多次提交,多次创建索引,会慢