R×stringr::str_split_i 文字ベクトル内の各文字列を分割してi番目の文字ベクトル返す

R言語のstringrパッケージに含まれているstr_split_i()関数について解説します。この関数は、「文字列を分割したあと、特定の○番目の部分だけをピンポイントで抜き出したい」ときに使える関数です。

stringrパッケージは、文字列データを操作するための強力で便利な関数を多く取り扱っています。また、Rのデータサイエンス向け主要パッケージ群であるtidyverseパッケージにも含まれています。

1 概要
2 使い方
3 引数
4 使用例
- 4.1 準備
- 4.2 特定番目の部分だけを取り出す
5 参考文献

概要

str_split_i()は、文字ベクトル内の各文字列を分割してi番目の文字ベクトル返すための関数です。

使い方


str_split_i(string, pattern, i)

引数

string

文字ベクトルまたは文字ベクトルに変換可能なものを指定します。

pattern

検索するパターンを指定します。
デフォルトの解釈は、vignette(“regular-expressions”)で説明されている正規表現です。マッチング動作をより細かく制御するには、regex()を使用してください。
fixed()を使用して、固定文字列（つまり、バイトのみを比較する）をマッチングします。これは高速ですが、近似値です。一般的に、人間のテキストをマッチングするには、指定されたロケールの文字マッチング規則を尊重するcoll()が適しています。
boundary()を使用して、文字、単語、行、文の境界をマッチングします。空のパターン””は、boundary(“character”)と同等です。

返す要素を指定します。
負の値を指定すると、右側から数えられます。

使用例

準備

あらかじめ、tidyverseパッケージまたはstringrパッケージを読み込んでおきます。


# library(tidyverse)でもよい
library(stringr)

特定番目の部分だけを取り出す

文字ベクトル「りんご,ごりら,らっぱ」と「すずめ, めだか, からす」を「,」で分割して最初の文字ベクトルのリストを返すには次のようにします。


str_split_i(c("りんご,ごりら,らっぱ", "すずめ, めだか, からす"), ",", 1)


[1] "りんご" "すずめ"

参考文献

Split up a string into pieces — str_split • stringr

概要

使い方

引数

使用例

準備

特定番目の部分だけを取り出す

参考文献

関連記事