为了账号安全,请及时绑定邮箱和手机立即绑定

如何从字符串中删除所有空格?

如何从字符串中删除所有空格?

慕姐4208626 2019-09-20 15:10:20
所以" xx yy 11 22  33 "会成为"xxyy112233"。我怎样才能做到这一点?
查看完整描述

3 回答

?
ibeautiful

TA贡献1993条经验 获得超5个赞

一般来说,我们需要一个矢量化的解决方案,所以这里有一个更好的测试示例:


whitespace <- " \t\n\r\v\f" # space, tab, newline, 

                            # carriage return, vertical tab, form feed

x <- c(

  " x y ",           # spaces before, after and in between

  " \u2190 \u2192 ", # contains unicode chars

  paste0(            # varied whitespace     

    whitespace, 

    "x", 

    whitespace, 

    "y", 

    whitespace, 

    collapse = ""

  ),   

  NA                 # missing

)

## [1] " x y "                           

## [2] " ← → "                           

## [3] " \t\n\r\v\fx \t\n\r\v\fy \t\n\r\v\f"

## [4] NA

基础R方法: gsub

gsub用另一个字符串替换string(fixed = TRUE)或正则表达式(fixed = FALSE,默认值)的所有实例。要删除所有空格,请使用:


gsub(" ", "", x, fixed = TRUE)

## [1] "xy"                            "←→"             

## [3] "\t\n\r\v\fx\t\n\r\v\fy\t\n\r\v\f" NA 

正如DWin所指出的那样,在这种情况下fixed = TRUE不是必需的,但提供稍好的性能,因为匹配固定字符串比匹配正则表达式更快。


如果要删除所有类型的空格,请使用:


gsub("[[:space:]]", "", x) # note the double square brackets

## [1] "xy" "←→" "xy" NA 


gsub("\\s", "", x)         # same; note the double backslash


library(regex)

gsub(space(), "", x)       # same

"[:space:]"是一个匹配所有空格字符的特定于R的正则表达式组。  \s是一个独立于语言的正则表达式,它做同样的事情。


该stringr方法:str_replace_all和str_trim

stringr在基本R函数周围提供了更多人类可读的包装器(尽管截至2014年12月,开发版本具有构建在其上的分支stringi,如下所述)。上述命令的等价物,使用[ str_replace_all][3],是:


library(stringr)

str_replace_all(x, fixed(" "), "")

str_replace_all(x, space(), "")

stringr还有一个str_trim只删除前导和尾随空格的函数。


str_trim(x) 

## [1] "x y"          "← →"          "x \t\n\r\v\fy" NA    

str_trim(x, "left")    

## [1] "x y "                   "← → "    

## [3] "x \t\n\r\v\fy \t\n\r\v\f" NA     

str_trim(x, "right")    

## [1] " x y"                   " ← →"    

## [3] " \t\n\r\v\fx \t\n\r\v\fy" NA      

该stringi方法:stri_replace_all_charclass和stri_trim

stringi基于独立于平台的ICU库构建,并具有广泛的字符串操作功能。以上的等价物是:


library(stringi)

stri_replace_all_fixed(x, " ", "")

stri_replace_all_charclass(x, "\\p{WHITE_SPACE}", "")

这里"\\p{WHITE_SPACE}"是对于该组被认为是空白,相当于Unicode码位的替换的语法"[[:space:]]","\\s"和space()。对于更复杂的正则表达式替换,也有stri_replace_all_regex。


stringi还有修剪功能。


stri_trim(x)

stri_trim_both(x)    # same

stri_trim(x, "left")

stri_trim_left(x)    # same

stri_trim(x, "right")  

stri_trim_right(x)   # same


查看完整回答
反对 回复 2019-09-20
  • 3 回答
  • 0 关注
  • 3045 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信