前回は、100人の学生のスコアを求めて、スコアの昇順に3つのグループに振り分ける方法を試した。振り分け方は、単純に、3つのグループに属する学生の少ないほうからである。前回の終わりに、各インデックスの平均値を考慮したものを考えてみると書いたが、その前に、一つ確認しておかなければならないことを忘れていたので、今回はその確認をしようと思う。

何を確認し忘れたかというと、全体のパターン数だ。もし、全体のパターン数が少なければ、全体のパターンから計算して平均的な分類方法を導き出せばよい。

しかし、先に結論を述べると、この方法では無理である。これを高校で習う数学の「組み合わせ」と「対数」を用いて確認してみる。

組み合わせの記法として、C(10,2)=10*9/2*1=45とし、対数logは底10の常用対数であるとする。

前回と同様に、具体例として、100人の学生を3つのクラスに分ける場合について見ていく。
この場合、全体のパターン数は

  1. 最初に100人の学生のうち、34人を選んでグループ1とし、
  2. 残った66人の学生のうち、33人をグループ2とし、
  3. さらに残った33人の学生をグループ3とし、
  4. グループ2とグループ3は区別されないことを考慮

すれば求めることができる。つまり、全体のパターン数TはC(100,34)×C(66,33)×C(33,33)÷2通りである。
これを実際に求めても良いのだか、イメージがつきにくいので、全体のパターン数の桁数を求めてみる。
log(C(100,34)×C(66,33)×C(33,33)÷2)
=log(C(100,34))+log(C(66,33))+log(C(33,33))-log(2)
≒26.76+18.85+0-0.30
=45.31
よって
45log10<log(T)<46log10
となるが、常用対数は単調増加なので、
10^45<T<10^46
が成り立つ。ゆえに、Tは46桁の数値であることが分かる。

言い換えると、全体のパターン数は、1000000000000000000000000000000000000000000000より大きいのである。

仮に、1秒間に100万パターン計算できたとして、これを日数に直すと約2.89×10^35日かかるのである。

全体のパターン数を調べ上げれば、真の分類方法が分かるのであるが、現実的な時間内で求めることは現状不可能なので、真の分類方法に近い、より精度の高い分類方法を実験的に考察して行こうと思う。

関連する記事

  • これだけは抑えておきたい成長性分析の基本これだけは抑えておきたい成長性分析の基本 成長性分析とは、様々な観点から成長性・拡大性・発展性を測定する分析である。 規模拡大などの経営戦略がいつも経営者の思い描く通りに進むとは限らないため、様々な観点から自社および自社を取り巻く環境の状況を把握する必要がある。 ここでは、成長性分析の代表的な指標をいくつか紹介する。 売上高伸び率 売上高伸び率とは、前期売上高より当期売上高がどの程度上昇または下降したかを […]
  • Linux:Eclipse+CDTでC/C++開発Linux:Eclipse+CDTでC/C++開発 Linux環境においてEclipseでCDTを用いてC/C++開発を行う場合にはまったことを備忘記録として残しておく。 CDTインストール直後、関数が認識されないエラーの対処 CDTのインストール後にすぐにC++開発を行おうとしてコードを入力した場合、関数が認識されずエラーが出る。この場合は一度Eclipseを再起動すれば、次回からきちんと認識される。 外部ヘッダーファ […]
  • R言語 CRAN Task View:生存時間解析R言語 CRAN Task View:生存時間解析 CRAN Task View: Survival Analysisの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Maintainer: Arthur Allignol and Aurelien Latouche Contact: arthur.allignol at […]
  • Ubuntu OpenCVをインストールする手順Ubuntu OpenCVをインストールする手順 Ubuntu16.04にOpenCV3.3をインストールする手順をお伝えいたします。 OpenCVは、JPEGとPNGの画像だけを扱うように、できるだけ最小の構成を目指します。 そのため、動画に関する設定はできるだけ除いた形でインストールを行います。 環境 今回の作業環境を確認しておきます。また、以下の作業はすべてターミナルにて行っております。 Ubuntuのバージ […]
  • R言語 CRAN Task View:極値解析R言語 CRAN Task View:極値解析 CRAN Task View: Extreme Value Analysisの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Maintainer: Christophe Dutang, Kevin Jaunatre Contact: Christophe.Dutang at […]
平均的に分類する方法の考察(2)