CRAN Task View: Web Technologies and Servicesの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。

Maintainer: Thomas Leeper, Scott Chamberlain, Patrick Mair, Karthik Ram, Christopher Gandrud
Contact: thosjleeper at gmail.com
Version: 2017-09-19
URL: https://CRAN.R-project.org/view=WebTechnologies

このタスクビューには、RとWorld Wide Webを一緒に使用するための情報が含まれています。 Rの基本バージョンには、Webとやり取りするための多くのツールが付属していません。 ありがたいことに、Webとやりとりするツールはますます多くなりました。 このタスクビューでは、Webベースのデータと情報を取得するためのパッケージ、WebベースのRアプリケーションを構築するためのフレームワーク、およびRからアクセスできるオンラインサービスに焦点を当てています。使用可能なパッケージと機能のリストを、アクティビティーのタイプ別にグループ化して以下に示します。 Open Data Task View には、Rからアクセスできるオンラインデータソースの詳細な説明があります。

このタスクビューの追加や改善のためのコメントや提案がある場合は、GitHubにアクセスして問題を提出するsubmit an issue か、変更を加えてプルリクエストを送信してくださいsubmit a pull request

GitHubに貢献できない場合は、Thomasに電子メール(gmail dot comのthosjleeper)を送信してください。 下記のいずれかのパッケージに問題がある場合は、そのパッケージのメンテナーに連絡してください。 RパッケージでまだサポートされていないWebサービス、API、データソース、またはその他のオンラインリソースについて知っている場合は、GitHubのパッケージ開発のリストthe package development to do list on GitHub に追加することを検討してください。

RからWebを操作するためのツール

HTTPリクエストのコアツール

RからWebとやりとりするほとんどの使用例をカバーする2つのパッケージがあります。

httr は、HTTPメソッド(GET、POST、PUT、HEAD、DELETEなど)を実行するためのユーザーフレンドリーなインターフェースを提供し、最新のWeb認証 プロトコル(OAuth 1.0、OAuth 2.0)。 HTTPステータスコードは、HTTPコールのデバッグに役立ちます。 httrを使用すると、レスポンスオブジェクトからhttpステータスコードを取得するstop_for_status()など、これを簡単に使用できます。コールが成功しなかった場合は、機能を停止します。 (warn_for_status()も参照してください)。httpコールのconfigパラメータにlibcurlオプションを追加で渡すことができます。

RCurl は、Rとlibcurl C library の間のより密接なインタフェースを提供する下位レベルのパッケージですが、ユーザーフレンドリーではありません。 これは、WebベースのXML上での操作やFTP操作の実行に役立ちます。 より具体的な状況では、以下のリソースが役立ちます。

  • curl は、base Rのurl()とhttp 2.0、ssl(https、ftps)、gzip、deflateなどのサポートとSSL互換の代替としてcurl()関数を提供する別のlibcurlクライアントです。 ほとんどのR関数は、安全でないHTTPを扱っているウェブサイト(すなわち、 “https”ではない”http”接頭辞を持つ)の場合、read.tableやread.csvなどのデータを直接抽出することができます。 これは、jsonlite :: fromJSONやXML :: parseXMLなどのアドオンパッケージの関数にも当てはまります。
    • httpRequest は、GET、POST、および複数パートのPOST動詞を実装するHTTPリクエスト用の別の低レベルパッケージです。
  • requestGitHub )は、他のAPIクライアントパッケージを開発するのに便利な高水準パッケージを提供します。
    • httpingGitHub )は、httr呼び出しの前後で、HTTPリクエストにpingと時刻を設定する簡単なツールを提供します。
    • httpcacheGitHub )は、HTTPリクエストをキャッシュするためのメカニズムを提供します。
  • 動的に生成されるウェブページ(結果を表示するためにユーザ対話を必要とするウェブページ)の場合、RSeleniumGitHub )を使用してこれらのインタラクションを自動化し、ページコンテンツを抽出することができます。 これは、JsonWireProtocol を使用してSelenium 2.0 Webdriverのバインディングのセットを提供します。 また、自動化されたアプリケーションテスト、負荷テスト、およびWebスクレイピングにも役立ちます。 rdom (CRANにはない)は、phantomjs を使用してWebページのDOM(Document Object Model)にアクセスします。
  • Webスクレイピングに役立つ高水準の代替パッケージは、一般的なWebスクラップ作業を簡単に表現できるようにmagrittr と連携するように設計されたrvestGitHub )です。
  • ウェブサイトがSSLを使用しない(すなわち、URLに “https”という接頭辞がない)場合、多くのベースRツールを使用してウェブコンテンツをダウンロードすることができます。 download.file()は、リモートファイルをダウンロードするために使用できる汎用関数です。 SSLの場合、downloader のdownload()関数はdownload.file()をラップし、すべて同じ引数をとります。
  • read.table()、read.csv()、およびfriendsを使用して、ファイルがSSL経由でホストされていないと仮定して、表形式のデータセット(例:txt、csvなど)を入力できます。 別の方法として、httr :: GET(またはRCurl :: getURL)を使用して、read.table(text = …)で解析する前にファイルを文字ベクトルとしてRに最初に読み込む方法があります。 ファイルをローカルディレクトリにダウンロードすることもできます。
    • rioGitHub )は、https:// URLから多くの一般的なデータ形式を直接読み取るimport()関数を提供します。
    • repmis 関数source_dat()は、URL(httpまたはhttpsのいずれか)からプレーンテキストデータをロードしてキャッシュできます。 このパッケージには、非公開のDropboxフォルダからプレーンテキストデータをダウンロード/キャッシュするためのsource_Dropbox()と、Excel xlsxシートをダウンロード/キャッシュするためのsource_XlsxData()も含まれています。
  • 認証:Webリソースを使用するには、APIキー、OAuth、ユーザー名:パスワードの組み合わせ、または他の手段による認証が必要です。 さらに、httpコールのヘッダーに認証が必要なWebリソースが存在することもあります。これには少し時間がかかります。
    • APIキーとユーザー名:パスワードコンボは、Webリソース(APIキー:http://api.foo.org/?key=yourkey;ユーザー/パス:http://ユーザー名:パスワード @ api.foo.org)、またはRCurl またはhttr のコマンドで指定することができます。
    • OAuthは最も複雑な認証プロセスであり、httr を使用して最も簡単に行うことができます。
    • OAuth 1.0(linkedin、twitter、vimeo)の3つ、OAuth 2.0(facebook、GitHub、google)の3つのデモをhttrでご覧ください。
    • ROAuth は、OAuthとは別のRインターフェースを提供するパッケージです。
    • OAuthは、httr で簡単にできるので、そこから始めましょう。
    • googleAuthR は、Google Webサービス専用のOAuth 2.0セットアップを提供します。

構造化されたWebデータの解析

ウェブベースのデータの大部分は、プレーンテキスト、HTML、XML、またはJSON(javascriptオブジェクト表記)として構造化されています。 ウェブサービスAPIはますますJSONに依存していますが、XMLはまだ多くのアプリケーションで普及しています。 これらのフォーマットで特に動作するパッケージがいくつかあります。 これらの関数を使用して、安全でないWebページと直接やりとりすることができます。また、ローカルに格納された、またはメモリ内のWebファイルを解析するために使用できます。

 

  • XML / HTML:
    • XMLを扱うための2つのパッケージXMLxml2GitHub )があります。
    • どちらもXPathクエリを含む一般的なXML(およびHTML)解析をサポートしています。
    • xml2 パッケージは、完全には機能しませんが、メモリ管理、クラス(XMLノードとノードセット、ドキュメントなど)、および名前空間に関してユーザーフレンドリーです。
    • 2つのうち、XML だけがXMLノードとドキュメントのデノボ作成をサポートしています。 X
    • XML2RGitHub )パッケージは、XMLをデータフレームに強制するための便利な関数の集まりです。
    • XML の代わりにselectr があります。selectrはCSS3セレクタを解析し、セレクタをXPath 1.0式に変換します。
    • XML パッケージは、xmlとhtmlの解析によく使用されますが、selectrはCSSセレクタをXPathに変換するため、XPathではなくCSSセレクタを使用できます。
    • selectorgadget browser extension は、ページ要素を識別するために使用できます。
    • RHTMLForms は、HTML文書を読み込み、それが含んでいる各フォームの説明と、異なる要素と隠しフィールドを取得します。
    • scrapeR は、HTML文書やXML文書からデータを取り出すための追加ツールを提供します。
    • htmltab は、XML パッケージのXML :: readHTMLTableと同様のHTMLテーブルから構造化情報を抽出しますが、ヘッダーとボディーセルの行と列のスパンを自動的に展開し、ヘッダーと本文行の識別をより詳細に制御しますRテーブル内に表示されます。
  • JSON:
    • JSONの読み書きには、rjsonRJSONIOjsonlite というパッケージがいくつかあります。
    • jsonlite は、RJSONIOyajl という別のパーサが含まれています。
    • jsonlite の使用をお勧めします。
    • Jeroen Ooms http://arxiv.org/abs/1403.2805 でjsonliteについて説明している記事を調べてください。
    • jqr は、高速JSONライブラリjq のバインディングを提供します。
    • jsonvalidateGitHub )は、 “is-my-json-valid” Node.jsライブラリを使用して、スキーマに対してJSONを検証します。
  • RSS / Atom:
    • RSSまたはAtomフィードの解析にfeedeR (CRANにはない)を使用できます。
  • swagger (CRANにはない)を使用して、Swagger.io 形式のドキュメントを提供するWebサービスAPIを操作するための関数を自動的に生成することができます。

URLを操作するためのツール

  • httr :: parse_url()関数を使用して、URLの一部を抽出することができます。 RCurl :: URLencode()およびutils :: URLencode()関数は、URLで使用する文字列をエンコードするために使用できます。 utils :: URLdecode()は元の文字列にデコードします。 urltoolsGitHub )は、URLエンコーディング、デコード、解析、パラメータ抽出を処理することもできます。
  • tldextract パッケージは、ホスト名からトップレベルのドメインとサブドメインを抽出します。 これは、a Python library of the same name の一部です。
  • iptools は、ジオロケーションでの使用を含め、IPv4アドレスの使用を容易にすることができます。
  • urlshorteneRGitHub )は、Bit.ly、Goo.gl、is.gdのURL展開と解析を提供します。 longurl は、longurl.org APIを使用して同様の機能を提供します。
  • gdns (CRANにはない)は、Googleの安全なHTTPベースのDNS解決サービスへのアクセスを提供します。

スクレープされたWebページの内容を操作するためのツール

  • HTML文書の解析には、いくつかのパッケージを使用できます。
    • boilerpipeR は、HTMLファイルからのメインテキストコンテンツの一般的な抽出を提供します。 ボイラパイプJavaライブラリを使用した広告、サイドバー、ヘッダーの削除
    • RTidyHTML は、整形式ではないHTML文書を修正するためにlibtidyライブラリにインタフェースします。 このライブラリは、HTMLドキュメントの一般的なエラーを修正します。
    • W3CMarkupValidator は、HTMLドキュメントを検証するためのW3Cマークアップ検証サービスへのRインターフェイスを提供します。
  • XML文書の場合、XMLSchema パッケージは、XMLスキーマ文書を読み込んで処理してRクラスの定義を作成し、XMLノードをそれらのクラスのインスタンスに変換するための機能をRに用意しています。 RのXMLスキーマによるメタコンピューティングのフレームワークを提供します。
    • xslt は、トランスフォームスタイルシートを使用してXMLデータを変換するためのXSLTエンジンを提供するXML処理ライブラリであるxmlwrapp へのインターフェイスを提供するパッケージです (Dan VeillardのlibxsltトランスレータとSXalan パッケージへのインタフェースであるSxslt の現代的な代替品と見ることができます)。 これは、Webスクレイピングや、XMLマークアップを人間が読める形式や機械で読める形式(HTML、JSON、プレーンテキストなど)に変換するのに便利です。
    • SSOAP は、クライアント側のSOAP(簡易オブジェクトアクセスプロトコル)メカニズムを提供します。 これは、SOAPサーバーが提供するSOAPメソッドを呼び出すための高水準インターフェースを提供することを目的としています。
    • XMLRPC は、HTTPとXMLを使用する比較的単純なリモートプロシージャコールメカニズムであるXML-RPCの実装を提供します。 これは、単一のマシン上のプロセス間の通信、またはR内のWebサービスへのアクセスに使用できます。
  • Rcompression (CRANにはない):R内でメモリ内の圧縮と解凍を実行するためのzlibとbzip2ライブラリへのインタフェース。これは、RCurlを介したWebサービスやHTTP要求などのリモートサーバへのコンテンツの受信や送信に便利です。
  • tm.plugin.webmining :XML(RSS、ATOM)とJSON形式のニュースフィード用の拡張可能なテキスト取得フレームワーク。 現在、Googleブログ検索、Google Finance、Googleニュース、NYTimes記事検索、Reuters News Feed、Yahoo Finance、Yahoo Inplayなどのフィードが実装されています。
  • webshot は、PhantomJS を使用して、ブラウザなしでWebページのスクリーンショットを提供します。 これは、Webサイト(Shinyアプリケーションなど)のテストに役立ちます。

その他の便利なパッケージと関数

  • Javascript:
    • V8GitHub )は、Googleのオープンソースで高性能なJavaScriptエンジンとのインタフェースです。 JavascriptライブラリとNPMパッケージをラップすることができます。
    • SpiderMonkey パッケージは、JavaScriptコードを評価し、JavaScriptオブジェクトを作成し、R内からJavaScript関数とメソッドを呼び出す別の手段を提供します。これは、Rセッション内にJavaScriptエンジンを埋め込むか、FirefoxなどのブラウザにRを埋め込み JavaScriptからRを呼び出し、RからJavaScriptにコールバックします。
  • Email:
    • mailR は、R内から電子メールを送信するApache Commons Emailへのインタフェースです。
    • sendmailR は、単純なSMTPクライアントを提供します。
    • gmailr は、Googleのgmail.com RESTful APIへのアクセスを提供します。
  • その他:
    • webutilsGitHub )は、application / x-www-form-urlencodedやmultipart / form-dataのパーサを含む、Webアプリケーションを開発するためのさまざまな機能が含まれています。
    • mimeGitHub )は、拡張子からファイルのMIMEタイプを推測します。
    • rsdmxGitHub )は、統計データとメタデータ交換(SDMX)フレームワークを介して交換されるデータとメタデータのドキュメントを読み込むためのツールを提供します。 パッケージは現在、SDMX XML標準フォーマット(SDMX-ML)に焦点を当てています。
    • robotstxt (CRANにはない)は、robots.txtファイルの解析と検査のためのR6クラスを提供します。
    • uaparserjsGitHub )は、javacriptの“ua-parser” library を使用してUser-Agent HTTPヘッダーを解析します。

Webおよびサーバーフレームワーク

  • DeployR Open は、Webサービスを介してRを他のアプリケーションに統合するためのサーバーベースのフレームワークです。
  • shiny パッケージは、RでインタラクティブなWebアプリケーションを構築するのを容易にします。
  • 他のWebフレームワークには次のようなものがあります:
    • fieryGitHub )は、 shinyよりも柔軟性はありますが使用するのが難しいです。
    • prairie (CRANにはない)は、magrittr形式の構文を使用し、expressjs の後にモデル化された軽量のWebフレームワークです。
    • rcloud (CRANにはない) は、iPythonのノートブックスタイルのWebベースのRインターフェースを提供します。
    • Rook は、Rookアプリケーションの構築と実行のための仕様と便利なソフトウェアが含まれています。
  • 組み込み統計計算と再現性のある研究のためのopencpu フレームワークは、R、LaTeX、PandocをインタフェースするWeb APIを公開しています。 このAPIは、たとえば、統計機能をシステムに統合し、集中サーバー上でスクリプトやレポートを共有および実行し、Rベースのアプリケーションを構築するために使用されます。
  • R用のいくつかの汎用サーバー/クライアントフレームワークが存在します。
    • Rserve およびRSclient は、TCP / IPまたはローカルソケットインタフェース用のサーバおよびクライアント機能を提供します。
    • httpuv は、R内で直接HTTPとWebSocketリクエストを処理するための低レベルのソケットとプロトコルのサポートを提供します。
    • おそらくhttpuv に置き換わる別の関連パッケージはwebsockets です。
    • servr は、httpuvに基づいて指定されたディレクトリの下でファイルを提供する簡単なHTTPサーバを提供します。
  • いくつかのパッケージは、RコードをWeb APIに変換する機能を提供します。
    • jug は、httpuv を中心に構築されたシンプルなAPIビルダーWebフレームワークです。
    • FastRWeb は、このための基本的なインフラストラクチャがいくつか用意されています。
    • plumber は、既存のRソースコードを装飾してREST APIを作成することができます。
  • WADL パッケージは、Webアプリケーション記述言語(WADL)ドキュメントを処理し、それらのWADLドキュメントに記述されているRESTメソッドにインターフェイスするR関数をプログラムで生成するためのツールが用意されています。 (CRANにはない)
  • RDCOMServer は、RオブジェクトをWindowsの(D)COMオブジェクトとしてエクスポートするメカニズムを提供します。 Rから他のCOMサーバーへのユーザーレベルのアクセスを提供するRDCOMClient パッケージと共に使用できます。 (CRANにはない)
  • rapporter.net は、クラウドにrapport 統計レポートテンプレートをホストして実行するためのオンライン環境(SaaS)を提供します。
  • radiantArchived on CRAN )は、サーバまたはローカルマシンからブラウザで実行されるR用のShinyベースのGUIです。
  • neocities は、Neocities WebホスティングサービスのAPIをラップします。 (CRANにはない)
  • Tiki Wiki CMS / Groupwareフレームワークには、wikiページからRコードを実行するためのRプラグイン(PluginR )があり、収集したWebデータベース(トラッカー)のデータを使用します。 デモ:http://r.tiki.org/ 。 詳細は、useR!2013 presentation です。
  • MediaWiki は、WikiページからRコードを実行するための拡張子(Extension:R )があり、アップロードされたデータを使用します。メーリングリストは利用可能です:R-sig-mediawiki
  • whisker :R.Mustache構文のMustache に基づくロジックレステンプレートの実装については、http://mustache.github.io/mustache.5.html を参照してください。
  • CGIwithR (CRANにはない)は、Rスクリプトを動的Webコンテンツを生成するためのCGIプログラムとして使用することを可能にする。 HTMLフォームおよび動的要求を提出する他のメカニズムを使用して、Webを介してRスクリプトに入力を提供し、そのRスクリプト内で決定されたコンテンツを作成することができます。

Webサービス
クラウドコンピューティングとストレージ

  • Amazon Web Servicesは、コンピューティング、ストレージ、およびインフラストラクチャの一連のツールを提供する、人気のある独自のクラウドサービスです。
  • aws.signature は、AWS APIリクエストシグネチャを生成するための機能を提供します。
    • シンプルストレージサービス(S3)は、インターネットに接続されたあらゆるマシンからコンテンツを保存して取得することができる商用サーバーです。
      • RAmazonS3s3mpi (CRANにはない)は、S3と通信するための基本的なインフラストラクチャを提供します。
      • AWS.toolsGitHub )は、AWSコマンドラインインタフェース(外部システム依存関係)を使用してS3およびEC2と対話します。 CRANバージョンはアーカイブされています。
      • awsConnect (CRANにはない)は、AWSコマンドラインインターフェイスを使用してEC2とS3を制御する別のパッケージで、LinuxとMac OSでのみ使用できます。
    • Elastic Cloud Compute(EC2)は、クラウドコンピューティングサービスです。
      • AWS.toolsとawsConnect (CRANにはない)はどちらもAWSコマンドラインインターフェイスを使用してEC2を制御します。
      • segue (CRANにはない)は、emrlapply()というElastic Map Reduce(EMR)エンジン用のlapply()の並列バージョンを含むEC2インスタンスとS3ストレージを管理するための別のパッケージです。 単純な並列計算を行うために、AmazonのEMRでHadoop Streamingを使用しています。
    • DBREST:RAmazonDBREST は、AmazonのSimple DB APIへのインタフェースを提供します。
    • 現在GitHubで開発中のThe cloudyr project は、外部システムの依存関係を必要とせずに完全なAmazon Web Servicesスイートに統一されたインタフェースを提供することを目指しています。
  • Cloud Storage:
    • googleCloudStorageR は、Google Cloud Storageのインターフェースです。
    • boxrGitHub )は、box.com API 用の軽量で高水準のインターフェースです。
    • rDrop2GitHub ; CRANにはない)は、dir / copy / move / delete操作、アカウント情報(クォータを含む)、Dropboxアカウントからのファイルのアップロードやダウンロードを含むファイル操作のフルセットへのアクセスを提供するDropboxインターフェイスです。
    • backblazerGitHub )は、Backblaze B2ストレージAPIへのアクセスを提供します。
  • Docker:
    • analogsea は、Digital Ocean v2 APIの汎用クライアントです。 さらに、パッケージには、ベースR、RStudioサーバーなど、さまざまなRツールをインストールする機能が含まれています。 このパッケージを使用してリモートドロップレットのドッカーと対話するための改良されたインターフェイスがあります。
  • rcrunch (CRANにはない)は、crunch.io のストレージと分析のインタフェースを提供します。
  • rrefine (CRANにはない)は、OpenRefine (以前のGoogle Refine)データクリーニングサービスのクライアントを提供します。

ドキュメントとコードの共有

  • コード共有:
    • gistrGitHub )は、RのGitHubのgist(gist.github.com )で動作し、新しい要点を作成し、新しいファイルで要点を更新し、ファイルの名前を変更し、ファイルを削除し、要点を取得したり削除したり、 あなたのデフォルトブラウザで要点を開き、要点の埋め込みコードを取得し、要約を一覧表示し、認証されるとレート制限情報を取得します。
    • git2r はgitバージョン管理システムへのバインディングを提供します。
    • rgithub (CRANにはない)は、GitHub.com APIへのアクセスを提供します。どちらもGitHub経由のコードやデータ共有を容易にします。
    • gitlabrGitLab 固有のクライアントです。
  • データアーカイブ:
    • dvnGitHub )は、Dataverse Network APIへのアクセスを提供します。
    • rfigshareGitHub )は、Figshare.com に接続します。
    • dataone は、メンバーノードのデータリポジトリのDataONE network からのデータとメタデータへの読み取り/書き込みアクセスを提供します。
    • dataoneGitHub )は、DataONE リポジトリのクライアントを提供します。
  • Googleドライブ/ Googleドキュメント:
    • driver バ(CRANにはない)は、GoogleドライブAPIのシンクライアントです。
    • RGoogleDocs パッケージは、RCurlとXMLパッケージを使用してGoogleドキュメントAPIへのインタフェースを迅速に開発する例です。
    • RGoogleStorage は、Google Storage APIへのプログラムによるアクセスを提供します。 これにより、RユーザーはGoogleのストレージにアクセスしてデータを保存できます。 コンテンツのアップロードとダウンロード、フォルダ/バケットの作成、一覧表示、削除、オブジェクトやバケットに対するアクセス制御のアクセス許可の設定ができます。
  • Googleスプレッドシート:
    • googlesheetsGitHub )は、タイトル、キー、またはURLで非公開または公開のGoogleスプレッドシートにアクセスできます。 データの抽出またはデータの編集。 スプレッドシートやワークシートの作成、削除、名前の変更、コピー、アップロード、ダウンロード。
    • gsheetGitHub )は共有リンクのみを使用してGoogleスプレッドシートをダウンロードできます。 スプレッドシートは、データフレームとして、またはプレーンテキストとしてダウンロードして手動で解析することができます。
  • imguRGitHub )は、画像ホスティングサービスImgur.com を使用してプロットを共有するためのパッケージです。 knitrには関数型プログラミング文書から画像を読み込む関数imgur_upload()もあります。
  • rscribd (CRANにはない):文書をScribd に公開するためのAPIクライアント。

データ分析および処理サービス

  • Crowdsourcing:
    • Amazon Mechanical Turkは有料のクラウドソーシングプラットフォームであり、簡単に自動化できないタスクを半自動化するために使用できます。
    • MTurkRGitHub )は、Amazon Mechanical TurkリクエスターAPIへのアクセスを提供します。
    • microworkers (CRANにはない)は、Microworkers.comプラットフォームのタスクを配布し、結果を取得することができます。
  • ジオロケーション/ジオコーディング:
    • いくつかのパッケージがジオロケーション/ジオコーディングサービスに接続します。
    • rgeolocateGitHub )は、いくつかのオンラインツールとオフラインツールがあります。
    • rydn (CRANにはない)は、Yahoo DevelopersのネットワークジオロケーションAPIへのインターフェースです。
    • ipapiGitHub )は、ip-api.com APIを使用してIPv4 / 6アドレスやドメイン名の地理的位置を特定するために使用できます。
    • threewords は、3ワードのフレーズとして地球上の3メートル×3メートルの正方形を表すWhat3Words API に接続します。
    • opencageGitHub )は、OpenCage ジオコーディングサービスへのアクセスを提供します。
    • geoparserGitHub )は、Geoparser.io Webサービスとインターフェイスを組み、プレーンテキストから地名を識別します。
    • nominatim (CRANにはない)は、逆ジオコーディングのOpenStreetMap Nominatim API に接続します。
    • PostcodesioR (CRANにはない)は、英国のポストコードルックアップとジオコーディングを提供します。
  • 画像処理:
    • RoogleVision (CRANにはない)は、Google Cloud Vision画像認識サービスへリンクします。
  • サービスとしての機械学習:
    • いくつかのパッケージは、クラウドベースの機械学習サービスへのアクセスを提供します。
    • AzureML は、Microsoft Azureマシン学習サービスとリンクしています。
    • bigmlGitHub )は、BigMLに接続します。
    • ddeploy は、Duke Analytics model deployment API をラップします。
    • indicoioArchived on CRAN )は、Positive / Negative Sentiment分析、政治感情分析、画像特徴抽出、顔面感情認識、顔面特徴抽出、言語検出のラッパーでAPIにhttps://indico.io/ で接続します。
    • clarifaiGitHub )は、Clarifai.com クライアントで、自動画像記述を可能にします。
    • rLTPGitHub )は、ltp-cloud service にアクセスします。
    • googlepredictionapi (CRANにはない)は、Google Prediction API のRクライアントで、クラウドマシン学習ツールのスイートです。
    • RDataCanvasGitHub )は、大規模なデータ分析プラットフォームであるdatacanvas.io 用のモジュールを作成できます。
    • yhatr を使用すると、Yhat REST APIを使用してモデルをデプロイメント、メンテナンス、および呼び出すことができます。
    • datarobot は、Data Robotの予測モデリングプラットフォームと連携します。
    • mscsweblm4rGitHub )は、Microsoft認知サービスWeb言語モデルAPIとインターフェイスします。
    • mscstexta4rGitHub )は、Microsoft認知サービステキスト分析REST APIを使用します。
    • rosetteApi は、Rosette テキスト解析APIにリンクしています。
  • マシン翻訳:
  • ドキュメント処理:
  • マッピング:
    • osmar は、異なるソースからのOpenStreetMapデータにアクセスして共通のR方式でデータを処理し、既存のRパッケージ(spやigraphオブジェクトなど)によって提供される利用可能なインフラストラクチャにデータを変換するためのインフラストラクチャを提供します。
    • osrmGitHub )は、OpenStreetMapから最短のパスと移動時間を提供します。
    • osmplotrGitHub )は、OpenStreetMapからカスタマイズ可能なマップイメージを抽出します。
    • RgoogleMaps は、静的な地図をGoogleサーバーに照会するための快適なRインターフェースを提供し、マップを背景画像として使用してR内のプロットをオーバーレイします。
    • R2GoogleMaps は、Googleマップを使用してデータを表示するRからJavaScriptコードを生成するメカニズムを提供します。
    • placementGitHub )は、Googleマップから運転時間と地理位置サービスを提供します。
    • RKMLDevice は、Keyhole Markup Language(KML)形式のRグラフィックスをGoogle Earth(またはGoogle Maps)で表示できるように作成でき、RKML はユーザーにKMLを生成するための高度な機能を提供します。
    • plotKML は、Google Earthで空間および時空間オブジェクトを視覚化できます。
    • plotGoogleMaps pls SPまたはSPT(STDIF、STFDF)データをGoogleマップ上のHTMLマップマッシュアップとして表示します。
    • ggmap を使用すると、ggplot2を使用してGoogle Maps、OpenStreetMaps、Stamen Maps、CloudMade Mapsの上で空間データとモデルを簡単に視覚化できます。
    • leafletR :オープンソースのJavaScriptライブラリリーフレットを使用して、インタラクティブなWebマップ上に空間データを表示できます。
    • CartoDB (CRANにはない)は、Cartodb.com へのAPIインタフェースを提供します。
    • openaddsGitHub )は、Openaddresses クライアントです。
  • オンライン調査:
    • qualtrics (CRANではなく)は、Qualtrics と対話するための機能を提供します。
    • WufooRGitHub )は、Wufoo.com フォームからデータを取得できます。
    • redcapAPIGitHub )は、Vanderbilt Universityで開発されたオンライン調査とデータベースの構築と管理のためのWebアプリケーションであるREDCap(Research Electronic Data CAPture)データベースに格納されたデータへのアクセスを提供します。
    • formr は、openCPU上に構築されたformr survey frameworkの使用を容易にします。
    • Rexperigen は、Experigen experimental platform のクライアントです。
  • 可視化:
    • Plot.lyは、R(およびPython)を使用してWebでビジュアライゼーションを作成できる会社です。 CRANではなく、開発中here のRパッケージと、a REST API を介したサービスへのアクセスがあります。
    • googleVis は、RチャートツールとGoogleグラフツールの間のインターフェイスを提供します。
    • RUbigraph パッケージは、インタラクティブでダイナミックなグラフを描画するためのUbigraphサーバーへのRインターフェイスを提供します。頂点/ノードとエッジをグラフに追加したり削除したり、図形、色、サイズなどの属性や特性を変更することができます。インタラクティブなJavascript対応のグラフィックスは、データ分析のためのますます有用な出力形式です。
    • ggvis は、RのインタラクティブなWebグラフィックスを簡単に記述できるようにします。ggplot2とshiny のアイデアを融合し、Vegaを使ってWeb上にグラフィックスを描画します。
    • d3Network は、RからD3 JavaScriptネットワーク、ツリー、樹形図、およびSankeyグラフを作成するためのツールを提供します。
    • rCharts (CRANにはない)とclickme (CRANにはない)は、RのインタラクティブなJavascriptチャートを許可します。
    • animint (CRANにはありません)は、clickSelectsとshowSelectedの美しさでggplotのリストを使用してインタラクティブなアニメーションを定義し、CSV / JSON / D3 / JavaScriptを使用してWebブラウザで表示できます。
    • rVega (CRANにはない)はVegaのRラッパーです。
  • その他:
    • genderizeRGitHub )は、genderize.io APIを使用して、テキストベクトルから抽出されたファーストネームからジェンダーを予測します。
    • rrefine は、OpenRefine データクリーニングサービスとの間でインポートおよびエクスポートを行うことができます。

ソーシャルメディアクライアント

  • plusser は、Google+プロフィール、ページ、投稿の検索を容易にするように設計されています。 また、検索機能も備えています。 現在、Google+データにアクセスするにはGoogle+ APIキーが必要です。
  • Rfacebook は、Facebook APIへのインターフェースを提供します。
  • Rflickr パッケージは、Flickr写真管理および共有アプリケーションWebサービスへのインターフェイスを提供します。 (CRANにはない)
  • instaRGitHub )は、Instagram API のクライアントです。
  • Rlinkedin (CRANにはない)は、LinkedIn APIのクライアントです。 AuthはOAuth経由です。
  • SocialMediaMineR は、ソーシャルメディアサイトでのURLの人気に関する情報を返す分析ツールです。
  • tumblRGitHub )は、Tumblr API(https://www.tumblr.com/docs/en/api/v2 )のクライアントです。 Tumblrはマイクロブログのプラットフォームとソーシャルネットワーキングのウェブサイトhttps://www.tumblr.com/ です。
  • Twitter:
    • twitteR は、Twitter Web APIへのインターフェースを提供します。
    • RTwitterAPI (CRANにはない)とrtweet (CRANにはない)は、他のTwitterクライアントです。
    • twitterreport (CRANにはない)は、Twitterデータに基づくレポート生成に重点を置いています。
    • streamR は、ユーザがTwitterのフィルタ、サンプル、ユーザストリームにアクセスし、その出力をデータフレームに解析するための一連の関数を提供します。 OAuth認証がサポートされています。
    • tweet2r は、SQLiteとPostGISのデータベースを対象とした別の方法です。
    • graphTweets は、つぶやきのdata.frameからネットワークグラフを生成します。
    • tweetscores (CRANにはない)は、指定されたTwitterユーザーのための政治的イデオロギー拡大尺度を実装します。

Web Analyticsサービス

  • Googleトレンド:
    • gtrendsR は、Googleトレンドのクエリを実行して表示する機能を提供します。 もう1つのGitHubパッケージ(rGtrends )は廃止されましたが、以前のバージョンのGoogleトレンドをサポートしており、開発者にとってはまだ役立つかもしれません。
    • RGoogleTrends は別の方法を提供します。
  • Google Analytics:
  • オンライン広告:
    • fbRads は、FacebookのマーケティングAPIを通じてFacebook広告を管理できます。
    • RDoubleClick (CRANにはない)は、GoogleのDoubleClick Campaign Manager Reporting APIからデータを取得できます。
    • RSmartlyIOGitHub )は、Smartly.io によって提供されたFacebookとInstagram広告データを読み込みます。
  • その他のサービス:
    • RSiteCatalyst は、Adobe Analytics(Omniture SiteCatalyst)レポートAPIにアクセスするための関数があります。
  • RAdwordsGitHub )は、Google Adwordsデータを読み込むためのパッケージです。
  • webreadrGitHub )は、CommonおよびCombined Web Log形式やAWSログなど、さまざまな一般的な要求ログを処理できます。
  • ApacheLogProcessorGitHub )は、Apache Web Serverのログファイルを処理できます。
  • RMixpanel は、Mixpanel Data Export、Engage、およびJQL APIの多くのエンドポイントへのインターフェイスを提供します。

その他のWebサービス

  • フィットネスアプリ:
  • プッシュ通知:
    • RPushbullet は、コンピュータ、電話、タブレット間で迅速かつ効率的な通知を提供するPushbulletサービス用の使いやすいインターフェイスを提供します。
    • pushoverrGitHub )は、Pushover を使用してモバイルデバイス(iOSとAndroid)とデスクトップにプッシュ通知を送信できます。
  • 参照/参考文献/引用管理:
    • RefManageR は、RefManagerを使用してBibTeXとBibLaTeXの参照をインポートおよび管理します。
    • RMendeley :CRANにアーカイブされたRのMendeley APIの実装これは、新しいMendeley API用に更新されるまで、CRANに一時的にアーカイブされています。
    • rmetadata (CRANにはない)は、ウェブの周りから学術メタデータを得ることができます。
    • rorcidGitHub )は、Orcid.org APIのプログラムインタフェースです。科学者や出版物(DOIなど)の識別に使用できます。
    • rplos は、Public Library of Scienceジャーナルで検索用に提供されるWebサービスメソッドへのプログラムインタフェースです。
    • rpubmed (CRANではなく)は、PubmedおよびPubmed Centralレコードを抽出および処理するためのツールを提供します。
    • europepmcGitHub )は、Europe PubMed Centralサービスに接続します。
    • scholar は、Google Scholarから引用データを抽出する機能を提供しています。複数の学者を比較し、将来のh-インデックス値を予測するための便利機能も提供される。
    • pubmed.mineR は、PubMedからのテキストとXMLのフェッチをサポートするPubMed Abstracts のテキストマイニング用のパッケージです。
    • rdataciteGitHub )は、DataCite に接続します。
    • oaiGitHub )とOAIHarvester は、メタデータ収穫のためのOpen Archives Initiative Protocol(OAI-PMH)標準を使用してメタデータを収集します。
    • JSTORr (CRANにはない)は、JSTORのResearch for Dataサービスからのジャーナル記事の簡単なテキストマイニングを提供します。
    • aRxivGitHub )は、コンピュータサイエンス、数学、物理学、定量的生物学、定量的財務および統計のための電子プレプリントのリポジトリであるarXiv APIのクライアントです。
  • Wikipedia:
    • WikipediRGitHub )は、特にWikipediaなどのWikimediaの「制作」ウィキを対象としたMediaWiki APIのラッパーです。
    • rwikidataWikidataRGitHub )は、無料のナレッジベースであるWikidata.org からデータを要求することができます。
    • wikipediatrendGitHub )は、Wikipediaのページアクセス統計にアクセスできるようにします。
    • WikiSocio はコントリビュータリストとリビジョンデータを取得できます。
  • bigrqueryGitHub ):Googleのbigqueryへのインターフェイス。
  • cymruservices は、Team Cymru のWebセキュリティサービスを照会します。
  • datamart :内部データセットとウェブベースのデータソースを統一的に処理するためのS4インフラストラクチャを提供します。 例としては、dbpedia、eurostat、sourceforgeなどがあります。
  • discgolfGitHub )は、Discourse WebフォーラムプラットフォームのAPIと対話するクライアントを提供します。 このAPIは、Discourseサイト自体のためではなく、Discourseのインストールされたインスタンス用です。
  • factualRFactual.com サーバーAPI用の薄いラッパー。
  • GFusionTables (CRANにはない):Google Fusion Tablesへのインターフェース。 Google Fusion Tablesはクラウド内のデータ管理システムです。 このパッケージには、Fusion Tablesカタログをブラウズする機能、Gusion TablesのdtdストレージからRにデータを取得する機能、RからFusion Tablesにデータをアップロードする機能があります。
  • HIBPwned (CRANにはない)は、Have I Been Pwned のクライアントです。
  • infochimps GitHub ; archived)はinfochimps.com APIサービスのRラッパーです。
  • internetarchive (CRANにはない):インターネットアーカイブメタデータ用のAPIクライアント。
  • jSonarR :クエリを実行し、その結果をdata.framesで返すことで、ユーザがMongoDBにアクセスできるようにします。 jSonarRはjSonar Analytics PlatformとJSON Studio Gateway のデータ処理と変換機能を使用して、JSONを表形式に変換します。
  • livechatR は、LiveChat API のクライアントです。
  • lucr は、Open Exchange Rates を使用して通貨換算を行います。
  • mockaRoo (CRANにはない)は、MockaRoo API を使用して、入力スキーマに基づいて模擬データまたは偽データを生成します。
  • osiGitHub )は、https://api.opensource.org/licenses/ からオープンソースのライセンスデータとメタデータを取得します。
  • randNamesGitHub )は、https://randomapi.com/ APIを使用して、ランダムな名前と個人識別情報を生成します。
  • Rbitcoin は、公開APIと非公開API呼び出しの両方がBitcoinとやり取りできるようにします。
    • rbitcoinchartsapi は、BitCoinCharts.com APIのパッケージです。 彼らのウェブサイトから: “BitcoinchartsはBitcoinネットワークに関連する財務的および技術的データを提供し、このデータはJSONアプリケーションプログラミングインターフェイス(API)を介してアクセスできます。”
  • RblpapiGitHub )は、Bloomberg Finance L.Pのクライアントです。
  • rerddap GitHub ; CRANではなく):OPeNDAP(https://en.wikipedia.org/wiki/OPeNDAP )の特別なケースであるERDDAPインスタンスとやりとりする汎用Rクライアント、または ネットワークデータアクセスプロトコル。 ERDDAPインスタンスを使用するために、ベースURLをスワップアウトすることができます。
  • ripplerestr は、金融取引を行うためのRipple プロトコルへのインタフェースを提供します。
  • restimizeapi は、tradingウェブサイトestimize.com へのインターフェースを提供します。
  • RForcecom :RForcecomはForce.comとSalesforce.comへの接続を提供します。
  • Rgoodreads (CRANにはない)は、Goodreads とやりとりします。
  • RLastFM (CRANにアーカイブされている)は、last.fm APIにインタフェースするためのパッケージです。 CRANにアーカイブされています。
  • ROpenWeatherMap は、ロケーションベースの気象データとOpen Weather Map からの予測のためのクライアントです。
  • RSocrata は、Socrataオープンデータポータルのデータにアクセスします。 soql はSocrataクエリを構築するためのパイプ指向のツールセットです。
  • RStripe は、オンライン決済プロセッサーのStripe へのインターフェースを提供します。
  • RZabbix は、Zabbix network monitoring service API とリンクしています。
  • shopifyr :Eコマースサービスshopifyhttps://help.shopify.com/api のAPIへのインタフェース。
  • slackrGitHub )は、Slack.comメッセージングプラットフォームのクライアントです。
  • SlideShaRe (CRANにはない)は、Slideshareのクライアントです。
  • stackr (CRANにはない):Stack Exchange API の読み取り専用機能の非公式ラッパー。
  • telegramGitHub )は、Telegram Bot API に接続します。
  • tuber (CRANにはない):YouTube APIクライアント。
  • udapi (CRANにはない)は、Urban Dictionaryに接続します。
  • yummlyrGitHub )は、Yummly レシピデータベースへのインターフェイスを提供します。
  • zendeskR :このパッケージは、Zendesk APIのラッパーを提供します。
  • ZillowR は、Zillow不動産サービスのクライアントです。

関連する記事

  • R言語 CRAN Task View:自然言語処理R言語 CRAN Task View:自然言語処理 CRAN Task View: Natural Language Processingの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Fridolin Wild, Performance Augmentation Lab (PAL, Department of Computing and […]
  • R言語 CRAN Task View:機械学習&統計学習R言語 CRAN Task View:機械学習&統計学習 CRAN Task View: Machine Learning & Statistical Learningの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Torsten Hothorn Contact: Torsten.Hothorn at […]
  • R言語 CRAN Task View:空間データの分析R言語 CRAN Task View:空間データの分析 CRAN Task View: Analysis of Spatial Dataの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Roger Bivand Contact: Roger.Bivand at […]
  • R言語 CRAN Task View:ケモメトリックスと計算物理学R言語 CRAN Task View:ケモメトリックスと計算物理学 CRAN Task View: Chemometrics and Computational Physicsの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Katharine Mullen Contact: katharine.mullen at […]
  • R言語 CRAN Task View:心理モデルや手法R言語 CRAN Task View:心理モデルや手法 CRAN Task View: Psychometric Models and Methodsの英語での説明文をGoogle翻訳を使用させていただき機械的に翻訳したものを掲載した。 Maintainer: Patrick Mair Contact: mair at […]
R言語 CRAN Task View:Web技術とサービス

One thought on “R言語 CRAN Task View:Web技術とサービス

Comments are closed.