R言語のforcatsパッケージに含まれているfct_anon()関数について解説します。この関数は、「データの構造や統計的な関係性は保ちたいけれど、具体的な名前(カテゴリ名)は隠してスクリプトやグラフを共有したい」ときに使える関数です。
forcatsパッケージは、因子型(factor型)データを操作するための強力で便利な関数を多く取り扱っています。また、Rのデータサイエンス向け主要パッケージ群であるtidyverseパッケージにも含まれています。
概要
fct_anon()は、因子水準を匿名化するための関数です。fct_anon()は、因子水準を任意の数値識別子に置き換えますが、因子水準の値も順序も保持されません。
使い方
fct_anon(f, prefix = "")
引数
f
因子を指定します。
prefix = “”
ランダムラベルの前に挿入する文字プレフィックスを指定します。
使用例
準備
あらかじめ、tidyverseパッケージまたはforcatsパッケージを読み込んでおきます。
# library(tidyverse)でもよい
library(forcats)
解説のために、次の因子を使用します。
F <- fct(letters[floor(runif(20, min = 1, max = 5))])
F
[1] b c a a c b d c c a d d d b c c c d b a
Levels: b c a d
因子水準を匿名化する
因子Fを匿名化するには次のようにします。
fct_anon(F)
[1] 3 2 4 4 2 3 1 2 2 4 1 1 1 3 2 2 2 1 3 4
Levels: 1 2 3 4
因子水準が数値に置き換わっていることが確認できます。