R×stringr::str_split_1 文字列を分割して文字ベクトルを返す

title: R×stringr::str_split_1 文字列を分割して文字ベクトルを返す
url: stringr-str-split-1-in-r

R言語で、文字列を分割して文字ベクトルを返す方法について解説します。文字列の操作には、tidyverseパッケージに含まれているstringrパッケージを使用するのが便利です。ここでは、stringrパッケージのstr_split_1()を使用した方法についてお伝えします。

str_split_1()の概要

str_split_1()は、文字列を分割して文字ベクトルを返すための関数です。

str_split_1()の使い方


str_split_1(string, pattern)

str_split_1の引数

string

文字ベクトルまたは文字ベクトルに変換可能なものを指定します。

pattern

検索するパターンを指定します。
デフォルトの解釈は、vignette(“regular-expressions”)で説明されている正規表現です。マッチング動作をより細かく制御するには、regex()を使用してください。
fixed()を使用して、固定文字列(つまり、バイトのみを比較する)をマッチングします。これは高速ですが、近似値です。一般的に、人間のテキストをマッチングするには、指定されたロケールの文字マッチング規則を尊重するcoll()が適しています。
boundary()を使用して、文字、単語、行、文の境界をマッチングします。空のパターン””は、boundary(“character”)と同等です。

準備

あらかじめ、tidyverseパッケージを読み込んでおきます。


library(tidyverse)

使用例

文字列「りんご,ごりら,らっぱ」を「,」で分割して文字ベクトルを返すには次のようにします。


str_split_1("りんご,ごりら,らっぱ", ",")

[1] "りんご" "ごりら" "らっぱ"