R×stringr::str_extract_all 文字列からすべての完全一致を抽出する

R言語のstringrパッケージに含まれているstr_extract_all()関数について解説します。この関数は、「条件に合うキーワードや数字が、1つの文の中に何個あるか分からないけれど全部拾い上げたい」ときに使える関数です。この関数は、文字列の中から、指定したパターン（正規表現など）にマッチする部分をすべて抽出する関数です。

stringrパッケージは、文字列データを操作するための強力で便利な関数を多く取り扱っています。また、Rのデータサイエンス向け主要パッケージ群であるtidyverseパッケージにも含まれています。

1 概要
2 使い方
3 引数
4 使用例
- 4.1 準備
- 4.2 文字列からすべての完全一致を抽出する
5 参考文献

概要

str_extract_all()は、文字列からすべての完全一致を抽出するための関数です。

使い方


str_extract_all(string, pattern, simplify = FALSE)

引数

string

入力ベクトルを指定します。文字ベクトルまたは文字ベクトルに変換可能なものを指定します。

pattern

検索するパターンを指定します。
デフォルトの解釈は、vignette(“regular-expressions”)で説明されている正規表現です。マッチング動作をより細かく制御するには、regex()を使用します。
fixed()を使用して、固定文字列（つまり、バイト列のみを比較する）に一致させます。これは高速ですが、近似値です。一般的に、人間のテキストに一致させるには、指定されたロケールの文字マッチング規則を尊重するcoll()を使用することをお勧めします。
boundary()を使用して、文字、単語、行、文の境界に一致させます。空のパターン””は、boundary(“character”) と同等です。

simplify = FALSE

真偽値を指定します。

FALSE（デフォルト）：文字ベクトルのリストを返します
TRUE：文字行列を返します

使用例

準備

あらかじめ、tidyverseパッケージまたはstringrパッケージを読み込んでおきます。


# library(tidyverse)でもよい
library(stringr)

文字列からすべての完全一致を抽出する

文字列からすべての完全一致を抽出するには次のようにします。


str_extract_all(c("あかいろ", "くろ", "いろいろ"), "いろ")


[[1]]
[1] "いろ"

[[2]]
character(0)

[[3]]
[1] "いろ" "いろ"

参考文献

Extract the complete match — str_extract • stringr

概要

使い方

引数

使用例

準備

文字列からすべての完全一致を抽出する

参考文献

関連記事