R言語のstringrパッケージに含まれているstr_equal()関数について解説します。この関数は、「2つの文字列ベクトルが「等しいかどうか」を要素ごとに判定(比較)したい」ときに使える関数です。
stringrパッケージは、文字列データを操作するための強力で便利な関数を多く取り扱っています。また、Rのデータサイエンス向け主要パッケージ群であるtidyverseパッケージにも含まれています。
概要
str_equal()は、2つの文字列が同じが判定するための関数です。str_equal()は、Unicode正規化ルールを使用し、オプションで大文字と小文字を無視します。
使い方
str_equal(x, y, locale = "en", ignore_case = FALSE, ...)
引数
x
文字ベクトルを指定します。
y
文字ベクトルを指定します。
locale = “en”
比較に使用するロケールを指定します。
すべての可能なオプションについては、stringi::stri_locale_list()を参照してください。デフォルトの動作がプラットフォーム間で一貫していることを保証するために、デフォルトは「en」(英語) になります。
ignore_case = FALSE
文字列を比較するときに大文字と小文字を無視するかどうかを指定します。
…
照合を制御するために使用されるその他のオプションです。stringi::stri_opts_collator()に渡されます。
使用例
準備
あらかじめ、tidyverseパッケージまたはstringrパッケージを読み込んでおきます。
# library(tidyverse)でもよい
library(stringr)
文字列の比較
2つの文字列を比較するには次のようにします。
str_equal("あいうえお", "あいうえお")
[1] TRUE
str_equal("あいうえお", "かきくけこ")
[1] FALSE