R编程 - 如何从数据集中删除特殊字符?
问题描述:
答
使用正则表达式来删除不需要的字符,例如:
dataset$textcolumn <- gsub("[^\\w\\s]", "", dataset$textcolumn, perl=TRUE)
去除除了字字符和空格一切。要做更复杂的替换,请查看帮助主题?regexp
。
也看看编码(Encoding
和iconv
在这里很有帮助。),也许文本是正确的,但假定错误的编码。