CRAN Task View: Databases with Rの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。

Maintainer: Yuan Tang
Contact: terrytangyuan at gmail.com
Version: 2019-06-15
URL: https://CRAN.R-project.org/view=Databases

このCRANタスクビューは、さまざまなデータベースのアクセシビリティに関連するパッケージのリストが含まれています。これにはデータのインポート/エクスポートやデータ管理は含まれません。

データセットが大きくなるにつれて、スプレッドシート、生のテキストファイルなどの従来のファイル形式でデータセットを保存することは不可能になります。これはストレージが限られているデバイスには適さず、共同作業者間で簡単に共有できません。代わりに、今日の人々はよりスケーラブルで信頼性の高いデータ管理のためにデータベースにデータを保存する傾向があります。

データベースシステムは、サポートしているdatabase modelsに基づいて分類されることがよくあります。Relational databasesは、1980年代に支配的になりました。リレーショナルデータベースのデータは、データの書き込みとクエリのロジックを表現するためにSQLを使用して、一連のテーブルの行と列としてモデル化されます。テーブルはリレーショナルです。あなたのソフトウェアを使っているユーザーがいます。 これらのソフトウェアには作成者と貢献者がいます。非リレーショナルデータベースは、クエリ言語としてNoSQLを使用して非構造化データを格納するという大きな需要のために、近年人気が出てきました。通常、ユーザーはデータスキーマを事前に定義する必要はありません。アプリケーションに変化する要件がある場合は、非リレーショナルデータベースの方がはるかに使いやすく、管理も簡単です。

このタスクビューに表示される内容は、産業界および学界で急速に変化しています。 タスクビューのメンテナに提案を送信するか、このGithub repository of this task viewにプルリクエストまたは発行を送信してください。

ctvパッケージはこれらのタスクビューをサポートします。その機能install.viewsおよびupdate.viewsは、それぞれ、特定のタスクビューからのパッケージのインストールまたは更新を許可します。オプションcoreOnlyを指定すると、以下のコアとしてラベル付けされたパッケージに操作を制限できます。

Achim ZeileisおよびKirillMüller、HannesMühleisen、Rich FitzJohn、Dirk Eddelbuettel、Hadley Wickhamによる提案や修正(ならびにここに追加するのを忘れていたかもしれない他の人も)に感謝します。最初の.ctvファイルとMarkdown変換スクリプトをhere で高性能コンピューティングのためのCRANタスクビューのGithubレポジトリで利用可能にしたDirk Eddelbuettelに感謝します。大事なことを言い忘れましたが、私がこのタスクビューの編成を始めるのを助けてくれたAchim Zeileisに感謝します。

リレーショナルデータベース

このセクションには、R内のリレーショナルデータベースへのアクセスを提供するパッケージが含まれています。

  • DBIパッケージは、Rとリレーショナルデータベース管理システム間の通信のためのデータベースインタフェース定義を提供します。注目すべきは、いくつかのパッケージはこのインターフェース定義(DBI準拠)に従おうとしますが、多くの既存のパッケージは従わないということです。
  • RODBCパッケージは、ODBCインターフェースを介してデータベースへのアクセスを提供します。
  • RMariaDBパッケージは、MariaDBおよびMySQLへのDBI準拠のインタフェースを提供します。
  • RMySQLパッケージは、MySQLへのインターフェースを提供します。これはS-PLUSから移植された古いコードに基づくMySQLとMariaDBへのレガシーDBIインターフェースです。Rcppをベースにした最新のMySQLクライアントは、上記のRMariaDBパッケージから入手できます。
  • オープンソースのリレーショナルデータベースであるPostgreSQL用のパッケージ:
    • RPostgreSQLパッケージとRPostgresパッケージはどちらも、PostgreSQLへの完全にDBI準拠のRcppベースのインタフェースを提供します。
    • rpostgisパッケージは、その空間的拡張PostGISへのインターフェースを提供します。
    • RGreenplumは、PostgreSQL上にオープンソースの並列データベースであるGreenplumへの完全にDBI準拠のインターフェースを提供します。
  • ROracleパッケージは、OCIに基づくDBI準拠のOracle databaseドライバです。
    • oraパッケージは、ROracle接続を介してデータベースを照会および参照するための便利な機能を提供します。
  • SQLite、自己完結型、高信頼性、組み込み、フル機能、パブリックドメイン、SQLデータベースエンジン用のパッケージ:
    • RSQLiteパッケージは、RにSQLiteデータベースエンジンを組み込み、DBIパッケージに準拠したインターフェースを提供します。
    • filehashSQLiteパッケージは、バックエンドとしてSQLiteを使用した単純なKey-Valueデータベースです。
    • liteqパッケージは、SQLiteの上に構築された、R用の一時的および永続的なメッセージキューを提供します。
  • bigrqueryパッケージは、Googleの完全管理型、ペタバイト規模、低コストの分析データウェアハウスであるGoogle BigQueryへのインターフェースを提供します。
  • RDruidパッケージは、イベント駆動型データ用の高性能分析データストアであるApache Druidへのインターフェースを提供します。
  • RH2パッケージは、JavaデータベースであるH2 Database Engineへのインターフェースを提供します。
  • influxdbrパッケージは、大量の書き込みやクエリの負荷を処理するために設計された時系列データベースであるInfluxDBへのインタフェースを提供します。
  • odbcパッケージは、Open Database Connectivity (ODBC)のドライバへのDBI準拠のインタフェースを提供します。これは、特にリレーショナルデータストア用に設計された、低レベルの高性能インタフェースです。
  • RPrestoパッケージは、ギガバイトからペタバイトまでのあらゆるサイズのデータソースに対してインタラクティブな分析クエリを実行するための、オープンソースの分散SQLクエリエンジンであるPrestoへのDBI準拠のインタフェースを実装しています。
  • RJDBCパッケージは、バックエンドとしてJDBCを使用するRのDBIインターフェースの実装です。これにより、RはJDBCドライバーを持つすべてのDBMSに接続できます。
  • implyrパッケージは、Apache Impalaのバックエンドを提供します。これは、次に格納されたデータに対する低遅延のSQLクエリを可能にします。
    • Hadoop Distributed File System (HDFS)
    • Apache Hbase
    • Apache Kudu
    • Amazon Simple Storage Service (S3)
    • Microsoft Azure Data Lake Store (ADLS)
    • Dell EMC Isilon

非リレーショナルデータベース

このセクションには、R内の非リレーショナルデータベースへのアクセスを提供するパッケージが含まれています。

  • データベース、キャッシュ、およびメッセージブローカーとして使用できる、オープンソースのインメモリデータ構造ストアRedis用のパッケージ:
    • RcppRedisパッケージは、hiredis libraryを使用してRedisへのインターフェースを提供します。
    • reduxパッケージは、Redisへの低レベルインターフェースを提供し、ほとんどインターフェースなしで任意のRedisコマンドの実行を可能にし、200以上のredisコマンドへの高レベル生成インターフェースを可能にします。
  • オープンソースのRESTfulな分散検索および分析エンジンであるElasticsearchのパッケージ:
    • elasticパッケージは、Elasticsearchへの汎用インターフェースを提供します。
    • uptasticsearchパッケージは、データサイエンスワークフローに合わせたElasticsearchクライアントです。
  • mongoliteパッケージは、libmongocをベースとした高レベルで高性能のMongoDBクライアントを提供します。これには、集約、索引付け、map-reduce、ストリーミング、SSL暗号化、およびSASL認証のサポートが含まれます。
  • R4CouchDBパッケージは、CouchDBの基本的なデータベースと文書管理操作のための機能のコレクションを提供します。
  • RCassandraパッケージは、ログイン、更新、クエリなど、Apache Cassandaの最も基本的な機能への直接インタフェース(Javaを使用せずに)を提供します。
  • aws.dynamodbパッケージは、Amazon DynamoDBへのアクセスを提供します。
  • rrocksdbパッケージは、RocksDBへのアクセスを提供します。

データベースツール

このセクションには、データベースの操作やテスト、データベーステーブルの操作などのためのツールを提供するパッケージが含まれています。

  • poolパッケージを使用すると、オブジェクトプールを作成できます。これにより、新しいオブジェクトをフェッチするための計算量が少なくなります。
  • DBItestパッケージは、インターフェイスへの適合性についてDBIバックエンドをテストするヘルパーです。
  • dbfakerパッケージは、データベース書き込みの有効性を保証するためのツールです。 SQLをサポートするデータベースに書き込まれるデータフレームのプロパティを分析および型チェックするための一連のユーティリティを提供します。
  • dbplyrパッケージは、データベース用のdplyrバックエンドであり、リモートデータベーステーブルをインメモリデータフレームのように扱うことができます。 基本機能は、DBIバックエンドを持つすべてのデータベースで機能します。 より高度な機能を使用するには、パッケージ作成者がSQL変換を提供する必要があります。
  • sqldfパッケージは、SQLを使用してRデータフレームを操作するための機能を提供します。
  • pointblankパッケージは、PostgreSQLやMySQLなどのデータベース内のデータテーブルを検証するためのツールを提供します。
  • TScompareパッケージは、2つのデータベースでシリーズの等価性を比較するためのユーティリティを提供します。

関連する記事

  • Ubuntu,R h2oパッケージのインストールの方法Ubuntu,R h2oパッケージのインストールの方法 Rのパッケージh2oは、さまざまなクラスタ環境内のニューラルネットワーク(ディープラーニング)、ランダムフォレスト、勾配ブースティングマシン、一般化線形モデルなどの並列分散機械学習アルゴリズムを計算するビッグデータのためのオープンソースの数学エンジンH2O用のRスクリプト機能である。 ここでは、ubuntu14.04環境下でh2oパッケージのインストールの仕方についてお […]
  • R言語 CRAN Task View:欠損データR言語 CRAN Task View:欠損データ CRAN Task View: Missing Dataの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。 Maintainer: Julie Josse, Nicholas Tierney and Nathalie Vialaneix (r-miss-tastic […]
  • R言語 CRAN Task View:関数データ解析R言語 CRAN Task View:関数データ解析 CRAN Task View: Functional Data Analysisの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Fabian Scheipl Contact: fabian.scheipl at […]
  • Ubuntu MongoDBのインストールする手順Ubuntu MongoDBのインストールする手順 Ubuntu16.04にMongoDB3.4をインストールする手順をお伝えいたします。 環境 今回の作業環境を確認しておきます。また、以下の作業はすべてターミナルにて行っております。 Ubuntuのバージョン $ cat […]
  • R言語 CRAN Task View:極値解析R言語 CRAN Task View:極値解析 CRAN Task View: Extreme Value Analysisの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Christophe Dutang, Kevin Jaunatre Contact: Christophe.Dutang at […]
R言語 CRAN Task View:Rデータベース