R×forcats::fct_anon 因子水準を匿名化する

R言語のforcatsパッケージに含まれているfct_anon()関数について解説します。この関数は、「データの構造や統計的な関係性は保ちたいけれど、具体的な名前(カテゴリ名)は隠してスクリプトやグラフを共有したい」ときに使える関数です。

forcatsパッケージは、因子型(factor型)データを操作するための強力で便利な関数を多く取り扱っています。また、Rのデータサイエンス向け主要パッケージ群であるtidyverseパッケージにも含まれています。

概要

fct_anon()は、因子水準を匿名化するための関数です。fct_anon()は、因子水準を任意の数値識別子に置き換えますが、因子水準の値も順序も保持されません。

使い方


fct_anon(f, prefix = "")

引数

f

因子を指定します。

prefix = “”

ランダムラベルの前に挿入する文字プレフィックスを指定します。

使用例

準備

あらかじめ、tidyverseパッケージまたはforcatsパッケージを読み込んでおきます。


# library(tidyverse)でもよい
library(forcats)

解説のために、次の因子を使用します。


F <- fct(letters[floor(runif(20, min = 1, max = 5))])
F

 [1] b c a a c b d c c a d d d b c c c d b a
Levels: b c a d

因子水準を匿名化する

因子Fを匿名化するには次のようにします。


fct_anon(F)

 [1] 3 2 4 4 2 3 1 2 2 4 1 1 1 3 2 2 2 1 3 4
Levels: 1 2 3 4

因子水準が数値に置き換わっていることが確認できます。

参考文献