R言語で、文字ベクトルをランク付けする方法について解説します。文字列の操作には、tidyverseパッケージに含まれているstringrパッケージを使用するのが便利です。ここでは、stringrパッケージのstr_rank()を使用した方法についてお伝えします。
str_rank()の概要
str_rank()は、文字ベクトルをランク付けするための関数です。
str_rank()の使い方
str_rank(x, locale = "en", numeric = FALSE, ...)
str_rank()の引数
x
文字ベクトルまたは文字ベクトルに変換可能なものを指定します。
locale = “en”
比較に使用するロケールを指定します。
使用可能なすべてのオプションについては、stringi::stri_locale_list() を参照してください。デフォルトの動作がプラットフォーム間で一貫しているように、デフォルトは “en”(英語)です。
numeric = FALSE
真偽値を指定します。TRUE の場合、数字を文字列ではなく数値としてソートします。
…
照合を制御するために使用されるその他のオプションを指定します。stringi::stri_opts_collator() に渡されます。
準備
あらかじめ、tidyverseパッケージを読み込んでおきます。
library(tidyverse)
使用例
文字列「りんご」と「ごりら」、「らっぱ」のランク付けしたベクトルを取得するには次のようにします。
str_rank(c("りんご", "ごりら", "らっぱ"))
[1] 3 1 2