R 数据表模糊匹配
想要把A表中num1与B表中PHN_NBR两个字段进行模糊匹配。num1为主表,但是问题两张表之间没有联系,怎么匹配呢?
思路:在A表中新生成一列ID,仅仅区别行数。循环A表与B表,当num1与PHN_NBR匹配成功后,在B表中新增加一列ID2,ID2为匹配成功的A的ID号。然后通过匹配两张表的ID,即可完成。
可能比较绕口,看下面例子即可明白:
1、在A表中新生成一列ID
2、循环A表与B表,当num1与PHN_NBR匹配成功后,在B表中新增加一列ID2,ID2为匹配成功的A的ID号
3、匹配两张表的ID
coon <- merge(x =contact_phone_1,y = phone_1,by.x=‘phonenumber’,by.y=‘ID’, all.x = T)
END
有问题,欢迎留言。
每日更新(sql,R,python,databricks,sqlserver),感谢关注!!!