CRAN Task View: Databases with Rの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載しました。
Maintainer: | Yuan Tang |
Contact: | terrytangyuan at gmail.com |
Version: | 2020-08-02 |
URL: | https://CRAN.R-project.org/view=Databases |
このCRANタスクビューは、さまざまなデータベースのアクセシビリティに関連するパッケージのリストが含まれています。これにはデータのインポート/エクスポートやデータ管理は含まれません。
データセットが大きくなるにつれて、スプレッドシート、生のテキストファイルなどの従来のファイル形式でデータセットを保存することは不可能になります。これはストレージが限られているデバイスには適さず、共同作業者間で簡単に共有できません。代わりに、今日の人々はよりスケーラブルで信頼性の高いデータ管理のためにデータベースにデータを保存する傾向があります。
データベースシステムは、サポートしているdatabase modelsに基づいて分類されることがよくあります。Relational databasesは、1980年代に支配的になりました。リレーショナルデータベースのデータは、データの書き込みとクエリのロジックを表現するためにSQLを使用して、一連のテーブルの行と列としてモデル化されます。テーブルはリレーショナルです。あなたのソフトウェアを使っているユーザーがいます。これらのソフトウェアには作成者と貢献者がいます。非リレーショナルデータベースは、クエリ言語としてNoSQLを使用して非構造化データを格納するという大きな需要のために、近年人気が出てきました。通常、ユーザーはデータスキーマを事前に定義する必要はありません。アプリケーションに変化する要件がある場合は、非リレーショナルデータベースの方がはるかに使いやすく、管理も簡単です。
このタスクビューに表示される内容は、産業界および学界で急速に変化しています。タスクビューのメンテナに提案を送信するか、このGithub repository of this task viewにプルリクエストまたは発行を送信してください。
ctvパッケージはこれらのタスクビューをサポートします。その機能install.viewsおよびupdate.viewsは、それぞれ、特定のタスクビューからのパッケージのインストールまたは更新を許可します。オプションcoreOnlyを指定すると、以下のコアとしてラベル付けされたパッケージに操作を制限できます。
Achim ZeileisおよびKirillMüller、HannesMühleisen、Rich FitzJohn、Dirk Eddelbuettel、Hadley Wickhamによる提案や修正(ならびにここに追加するのを忘れていたかもしれない他の人も)に感謝します。最初の.ctvファイルとMarkdown変換スクリプトをhere で高性能コンピューティングのためのCRANタスクビューのGithubレポジトリで利用可能にしたDirk Eddelbuettelに感謝します。大事なことを言い忘れましたが、私がこのタスクビューの編成を始めるのを助けてくれたAchim Zeileisに感謝します。
リレーショナルデータベース
このセクションには、R内のリレーショナルデータベースへのアクセスを提供するパッケージが含まれています。
- DBIは、Rとリレーショナルデータベース管理システム間の通信のためのデータベースインタフェース定義を提供します。注目すべきは、いくつかのパッケージはこのインターフェース定義(DBI準拠)に従おうとしますが、多くの既存のパッケージは従わないということです。
- RODBCは、ODBCインターフェースを介してデータベースへのアクセスを提供します。
- RMariaDBは、MariaDBおよびMySQLへのDBI準拠のインタフェースを提供します。
- RMySQLは、MySQLへのインターフェースを提供します。これはS-PLUSから移植された古いコードに基づくMySQLとMariaDBへのレガシーDBIインターフェースです。Rcppをベースにした最新のMySQLクライアントは、上記のRMariaDBパッケージから入手できます。
- オープンソースのリレーショナルデータベースであるPostgreSQL用のパッケージ:
- RPostgreSQLとRPostgresはどちらも、PostgreSQLへの完全にDBI準拠のRcppベースのインタフェースを提供します。
- rpostgisは、その空間的拡張PostGISへのインターフェースを提供します。
- RGreenplumは、PostgreSQL上にオープンソースの並列データベースであるGreenplumへの完全にDBI準拠のインターフェースを提供します。
- ROracleは、OCIに基づくDBI準拠のOracle databaseドライバです。
- SQLite、自己完結型、高信頼性、組み込み、フル機能、パブリックドメイン、SQLデータベースエンジン用のパッケージ:
- RSQLiteは、RにSQLiteデータベースエンジンを組み込み、DBIパッケージに準拠したインターフェースを提供します。
- filehashSQLiteは、バックエンドとしてSQLiteを使用した単純なKey-Valueデータベースです。
- liteqは、SQLiteの上に構築された、R用の一時的および永続的なメッセージキューを提供します。
- bigrqueryは、Googleの完全管理型、ペタバイト規模、低コストの分析データウェアハウスであるGoogle BigQueryへのインターフェースを提供します。
- RDruidは、イベント駆動型データ用の高性能分析データストアであるApache Druidへのインターフェースを提供します。
- RH2は、JavaデータベースであるH2 Database Engineへのインターフェースを提供します。
- influxdbrは、大量の書き込みやクエリの負荷を処理するために設計された時系列データベースであるInfluxDBへのインタフェースを提供します。
- odbcは、Open Database Connectivity (ODBC)のドライバへのDBI準拠のインタフェースを提供します。これは、特にリレーショナルデータストア用に設計された、低レベルの高性能インタフェースです。
- RPrestoは、ギガバイトからペタバイトまでのあらゆるサイズのデータソースに対してインタラクティブな分析クエリを実行するための、オープンソースの分散SQLクエリエンジンであるPrestoへのDBI準拠のインタフェースを実装しています。
- RJDBCは、バックエンドとしてJDBCを使用するRのDBIインターフェースの実装です。これにより、RはJDBCドライバーを持つすべてのDBMSに接続できます。
- implyrは、Apache Impalaのバックエンドを提供します。これは、次に格納されたデータに対する低遅延のSQLクエリを可能にします。
- Hadoop Distributed File System (HDFS)
- Apache Hbase
- Apache Kudu
- Amazon Simple Storage Service (S3)
- Microsoft Azure Data Lake Store (ADLS)
- Dell EMC Isilon
- dbxは、DBIの上にSQLを記述せずに、高性能のバッチ操作と安全な挿入/更新/削除のための直感的な機能を提供します。研究環境と本番環境の両方向けに設計されており、Postgres、MySQL、MariaDB、SQLiteなどの複数のデータベースバックエンドをサポートしています。
- sparklyrは、Apache Spark DataFramesへのdplyrインターフェースと、Sparkの分散型機械学習パイプラインへのRインターフェースを提供します。
- RClickhouseは、Yandex ClickhouseのDBIインターフェースであり、ビッグデータの探索とペタバイト規模のデータへのスケーリングを可能にする高性能のリレーショナル列ストアデータベースです。dbplyrを使用してSQLコマンドを自動生成することにより、基本的なdplyrサポートを提供します。
非リレーショナルデータベース
このセクションには、R内の非リレーショナルデータベースへのアクセスを提供するパッケージが含まれています。
- データベース、キャッシュ、およびメッセージブローカーとして使用できる、オープンソースのインメモリデータ構造ストアRedis用のパッケージ:
- RcppRedisは、hiredis libraryを使用してRedisへのインターフェースを提供します。
- reduxは、Redisへの低レベルインターフェースを提供し、ほとんどインターフェースなしで任意のRedisコマンドの実行を可能にし、200以上のredisコマンドへの高レベル生成インターフェースを可能にします。
- オープンソースのRESTfulな分散検索および分析エンジンであるElasticsearchのパッケージ:
- elasticは、Elasticsearchへの汎用インターフェースを提供します。
- uptasticsearchは、データサイエンスワークフローに合わせたElasticsearchクライアントです。
- mongoliteは、libmongocをベースとした高レベルで高性能のMongoDBクライアントを提供します。これには、集約、索引付け、map-reduce、ストリーミング、SSL暗号化、およびSASL認証のサポートが含まれます。
- R4CouchDBは、CouchDBの基本的なデータベースと文書管理操作のための機能のコレクションを提供します。
- RCassandraは、ログイン、更新、クエリなど、Apache Cassandaの最も基本的な機能への直接インタフェース(Javaを使用せずに)を提供します。
- aws.dynamodbは、Amazon DynamoDBへのアクセスを提供します。
- rrocksdbは、RocksDBへのアクセスを提供します。
データベースツール
このセクションには、データベースの操作やテスト、データベーステーブルの操作などのためのツールを提供するパッケージが含まれています。
- poolを使用すると、オブジェクトプールを作成できます。これにより、新しいオブジェクトをフェッチするための計算量が少なくなります。
- DBItestは、インターフェイスへの適合性についてDBIバックエンドをテストするヘルパーです。
- dbplyrは、データベース用のdplyrバックエンドであり、リモートデータベーステーブルをインメモリデータフレームのように扱うことができます。基本機能は、DBIバックエンドを持つすべてのデータベースで機能します。より高度な機能を使用するには、パッケージ作成者がSQL変換を提供する必要があります。
- sqldfは、SQLを使用してRデータフレームを操作するための機能を提供します。
- pointblankは、PostgreSQLやMySQLなどのデータベース内のデータテーブルを検証するためのツールを提供します。
- TScompareは、2つのデータベースでシリーズの等価性を比較するためのユーティリティを提供します。