Rのdplyrパッケージのgroup_by関数は指定した列をグルーピングできるので便利ですが、文字列を指定できません。
このパッケージのgroup_by_関数は文字列を指定できますが、複数の文字列を指定する場合には少し工夫が必要になります。

ここでは、異なるダイエットの雛の体重と年齢が収められているChickWeightをサンプルデータとします。


> library(dplyr)
> data(ChickWeight)
> str(ChickWeight)
Classes ‘nfnGroupedData’, ‘nfGroupedData’, ‘groupedData’ and 'data.frame':	578 obs. of  4 variables:
 $ weight: num  42 51 59 64 76 93 106 125 149 171 ...
 $ Time  : num  0 2 4 6 8 10 12 14 16 18 ...
 $ Chick : Ord.factor w/ 50 levels "18"<"16"<"15"<..: 15 15 15 15 15 15 15 15 15 15 ...
 $ Diet  : Factor w/ 4 levels "1","2","3","4": 1 1 1 1 1 1 1 1 1 1 ...
 - attr(*, "formula")=Class 'formula'  language weight ~ Time | Chick
  .. ..- attr(*, ".Environment")= 
 - attr(*, "outer")=Class 'formula'  language ~Diet
  .. ..- attr(*, ".Environment")= 
 - attr(*, "labels")=List of 2
  ..$ x: chr "Time"
  ..$ y: chr "Body weight"
 - attr(*, "units")=List of 2
  ..$ x: chr "(days)"
  ..$ y: chr "(gm)"

このデータは、Chick列とDiet列がFactorとなっていますので、この列を文字列としてグルーピングするコードは次のようになります。
ここでは、新たにn列をグルーピングされた集合の度数として追加しました。


> ChickWeight %>% group_by_(.dots = lapply(c("Chick", "Diet"), as.symbol)) %>% summarise(n = n())
# A tibble: 50 x 3
# Groups:   Chick [?]
   Chick Diet      n
     
 1 18    1         2
 2 16    1         7
 3 15    1         8
 4 13    1        12
 5 9     1        12
 6 20    1        12
 7 10    1        12
 8 8     1        11
 9 17    1        12
10 19    1        12
# ... with 40 more rows

関連する記事

  • RaspberryPi Bluetoothスピーカーで音を出す方法 Raspberry Pi 3 Model B を用いてBluetoothスピーカーと接続した後、aplayコマンドがエラー出して音が出なかった問題の対応を備忘録として残しておく。 以下はすべてSSH接続によるCUIで行っている。 環境:Raspbian GNU/Linux 8.0 […]
  • R言語 CRAN Task View:ベイズ推論R言語 CRAN Task View:ベイズ推論 CRAN Task View: Bayesian Inferenceの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Maintainer: Jong Hee Park Contact: jongheepark at […]
  • 統計的因果推論による傾向スコアとIPW推定量の基本的な考え方統計的因果推論による傾向スコアとIPW推定量の基本的な考え方 [latexpage] 統計的因果推論による因果効果を調べる手段として、傾向スコアとIPW推定量という概念があります。ここでは、なぜ傾向スコアを考えるのか、傾向スコアの逆数の重み付けはどのような意味があるのかを、複雑な数式を用いずに具体例を通してご説明します。 さっそくですが、次の具体例を考えます。 […]
  • Ubuntu 日本語形態素解析システムJUMANのインストール方法Ubuntu 日本語形態素解析システムJUMANのインストール方法 buntu14.04で日本語形態素解析システムJUMANのインストール方法をお伝えする。 JUMAN単体では次のコマンドで簡単にインストールできる。 $ sudo apt-get install […]
  • 基本統計量基本統計量 [latexpage] 基本統計量とは、データの基本的な特徴を表す値のことで、代表値と散布度に区分できる。代表値とは、データを代表するような値のことで、例えば、平均値、最大値、最小値などがある。散布度とは、データの散らばり度合いを表すような値のことで、例えば、分散、標準偏差などがある。 平均値 […]
R dplyrパッケージのgroup_by_関数で複数の文字列を指定する方法