R言語で、位置を使用して部分文字列を取得および設定する方法について解説します。文字列の操作には、tidyverseパッケージに含まれているstringrパッケージを使用するのが便利です。ここでは、stringrパッケージのstr_sub()を使用した方法についてお伝えします。
str_sub()の概要
str_sub()は、位置を使用して部分文字列を取得および設定するための関数です。
str_sub()の使い方
str_sub(string, start = 1L, end = -1L)
str_sub(string, start = 1L, end = -1L, omit_na = FALSE) <- value
str_sub()の引数
string
文字ベクトルまたは文字ベクトルに変換可能なものを指定します。
start, end
抽出する文字の範囲(両端を含む)を定義する整数ベクトルのペアを指定します。
正の値は文字列の左から数え、負の値は右から数えます。つまり、文字列が"abcdef"の場合、1は"a"を、-1は"f"を表します。
あるいは、ベクトルのペアの代わりに、startに行列を渡すこともできます。行列は、startとend、またはstartとlengthというラベルの付いた2つの列を持つ必要があります。これにより、str_sub()はstr_locate()などの出力を直接処理します。
omit_na = FALSE
単一の論理値を指定します。
TRUEの場合、指定された引数のいずれかに欠損値がある場合は、入力は変更されません。
str_sub()の戻り値
string/start/endと同じ長さの文字ベクトルを返します。
endがstartより前にある場合、またはstartがstringの範囲外にある場合、対応する出力は空文字列になります。
準備
あらかじめ、tidyverseパッケージを読み込んでおきます。
library(tidyverse)
使用例
文字列「abcde」内で文字列「bcd」を取得するには次のようにします。
str_sub("abcde", 2, 4)
[1] "bcd"
文字列「abcde」内で文字列「ab」を「AB」に設定するには次のようにします。
x <- "abcde"
str_sub(x, 1, 2) <- "AB"
x
[1] "ABcde