RでCSVを読み込む方法【初心者向けチュートリアル】
【記事作成者】 酒井 裕麻 (株式会社Bistro 代表取締役社長)
【はじめに】
Rを使ったデータ分析の第一歩として、「CSVファイルの読み込み」は最も基本的かつ重要な操作です。
この記事では、R初心者でもつまずかないように、CSVファイルの読み込み方法を丁寧に解説します。
実際のコード例や注意点も紹介しますので、ぜひ手を動かしながら読み進めてください。
【データ処理に関する記事】
1. CSVファイルとは?
CSV(Comma-Separated Values)ファイルは、データをカンマ区切りで保存したシンプルなテキストファイルです。 ExcelやGoogleスプレッドシートで作成したデータもCSV形式で保存することができ、Rとの相性も抜群です。
2. read.csv()
関数でCSVを読み込む
Rには標準で用意されている read.csv()
関数を使えば、簡単にCSVファイルを読み込むことができます。
# ファイルを読み込んで "data" に格納 data <- read.csv("sample.csv") # データの先頭6行を表示 head(data)
✅ よくあるパラメータ
header = TRUE
:1行目を列名として扱う(デフォルトTRUE)sep = ","
:区切り文字(日本のExcel出力では;
の場合もあり)fileEncoding = "UTF-8"
:ファイルの文字コードを指定(特に日本語環境では重要)
# 日本語を含むCSVを読み込む例(Shift-JIS対応)
data <- read.csv("japanese.csv", fileEncoding = "CP932")
3. ファイルのパス指定に注意
ファイルを読み込む際、Rは「カレントディレクトリ(作業フォルダ)」を基準に探します。
getwd() # 現在の作業ディレクトリを確認 setwd("C:/Users/YourName/Documents") # 作業ディレクトリを変更
または、絶対パスでファイルを指定する方法もあります:
data <- read.csv("C:/Users/YourName/Documents/sample.csv")
4. readr
パッケージを使った読み込み(高速・安定)
Tidyverseの一部である readr
パッケージを使うと、より高速で扱いやすい形式で読み込むことができます。
# パッケージのインストールと読み込み install.packages("readr") library(readr) # read_csv 関数で読み込み data <- read_csv("sample.csv")
read_csv()
はread.csv()
よりもエラーに強く、文字化けも起きにくいです。tibble
形式で読み込まれるため、出力も見やすくなります。
5. まとめ:まずは「読み込める」ことが一歩
Rでの分析は、CSVファイルの読み込みから始まります。 データが正しく読み込めれば、そこから可視化・統計・モデリングへとステップアップしていけます。
R言語を使って様々な統計解析に役立ててみてください。
============================================================================================= 酒井 裕麻 (株式会社Bistro 代表取締役社長) 慶應義塾大学理工学部物理情報工学科卒業後、外資系広告総合代理店である株式会社マッキャンエリクソンに新卒入社 データサイエンティストとしてマーケティングリサーチや顧客データ(CRM)の分析、MMM(Marketing Mix Modeling)の構築など多岐にわたり担当 その後独立をしデータマーケティングカンパニーを起業、大手通信会社、大手銀行、大手IT企業や外資系総合代理店などを主要顧客としサービスを提供している。 =============================================================================================
このコンテンツをシェアする