注意: 質問は複数選択です。すべての正しい答えを選んでください。
または、gosocrative.com で joho2024を入力
オンラインで受けてきた宿題はRパッケージ「 joholearnr
」でもあります
教室内のパソコンに宿題がインストールされているので、ここで受けることも可能になりました:
These packages have more recent versions available.
It is recommended to update all of them
Which would you like to update?
3
を押してからエンターキーを押してください(他のパッケージをアップデートしない)。
install()
を実行したら、一旦RStudioを閉じてから再度開いてください。そうすると、新しいチュートリアル(宿題)が表示されます。再現性を担保するために、RStudioの設定を変更する必要があります。
そうしないと、予想外の(自分が書いたコードに依存しない)結果が得られます。
「Tools」→「Global Options」→「Workspace」
練習として、教科書に掲載されているstudents.csv
ファイルをRに読み込みます。
まず、このリンクからstudents.csv
をデスクトップにダウンロードしてください:
.csv
ファイルについて.csv
は、Comma-separated valuesの略です。
,
)で区切られています。.xlsx
ファイルとの違い
.csv
の中身は単純な文字列なので、直接中身を確認することができます。.xlsx
(または.xls
)ファイルはエクセルのみに対応しています。.xlsx
はエクセルを持っていない方にとって使いにくいので、.csv
を推奨します。.csv
ファイルをRに読み込むtidyverse
パッケージに含まれているので、まずはtidyverse
をロードしましょう。.csv
ファイルを読み込む関数はread_csv()
です。# A tibble: 6 × 5
`Student ID` `Full Name` favourite.food mealPlan AGE
<dbl> <chr> <chr> <chr> <chr>
1 1 Sunil Huffmann Strawberry yoghurt Lunch only 4
2 2 Barclay Lynn French fries Lunch only 5
3 3 Jayendra Lyne N/A Breakfast and lunch 7
4 4 Leon Rossini Anchovies Lunch only <NA>
5 5 Chidiegwu Dunkel Pizza Breakfast and lunch five
6 6 Güvenç Attila Ice cream Lunch only 6
Z:/Desktop/students.csv
はstudents.csv
のパス、つまりそのファイルがどこにあるのかを示す情報です。
/
は日本語の「の」と同じような意味です。.csv
ファイルをRに読み込むこれでRに.csv
ファイルのデータを読み込むことができました。
しかし、データの読み込みからデータの解析の最後まで、すべての作業を一度で終わらせることは現実的ではありません。
ここで一旦作業を停止して、RStudioを閉じましょう。
再度RStudioを開きましょう。
今までの成果はどうなっているのでしょうか?
もっと良いやり方があるはずです…。
これまではRのコマンドを直接コンソールに入力していました。
スクリプト(テキストファイル)にコマンドを保存すると、後々楽になります。
「File」 → 「New File」 → 「RScript」
スクリプトを保存しましょう。
「File」 → 「Save As」 → 場所とファイル名を決めて保存します。
今回はstudents.R
としましょう。
.r
もしくは.R
のファイル拡張子を使用します。スクリプトに記述されているRコードは「これから実行するコマンドのリスト」のようなものです(レシピをイメージしてください)。
Rにそのコマンドを実行するように指示する必要があります。
まずはカーソルを実行したい行に置きます(矢印キーかマウスを使ってください)。
「Run」アイコンをクリックします。
⌘
とEnter
を同時に押すCtrl
とEnter
を同時に押すRStudioを閉じてから、再度スクリプトを開いてコマンドを実行してください。
一々コマンドを入力するよりは便利でしょう?
スクリプトを書くことでデータ解析の作業をかなり楽にしましたが、次にはファイルを整理する必要があります。
ファイルの整理には、RStudioのプロジェクト機能を使用します。
RStudioのプロジェクトとは、データ解析に使用するフォルダーのことです。
このフォルダー内に、特定のデータ解析プロジェクトに必要なファイルを配置します。
「File」 → 「New Project…」 → 「New Directory」 → 「New Project」
今回のプロジェクトはstudents_analysis
と名付け、デスクトップに配置しましょう。
students_analysis
プロジェクトを作成したら、その中にdata
というフォルダーを作成し、students.csv
をdata
に移動してください。
data
が含まれていることを確認できます。RStudioを一旦閉じましょう。
今度は、アプリ一覧からではなく、プロジェクトからRStudioを開きましょう。
students_project
フォルダーを開き、その中のstudents_project.Rproj
ファイルをダブルクリックしてください。
data
やstudents.R
が表示されていることを確認してください。students.csv
を読み込みましょう:Error: 'Z:/Desktop/students.csv' does not exist.
今度はうまくいかない。なぜでしょう?
students.csv
をstudents_project
に移動しました。つまり、もうDesktop
には置いていないため、Desktop
内を探しても見つかりません。students.csv
を読み込むことができるでしょうか?Z:
)から始まります。
/
から始まります。もう一つの方法は「相対パス」と呼ばれるものです。
つまり、Rの作業ディレクトリ(Rが現在入っているフォルダー)から見たパスです。
getwd()
でRの作業ディレクトリを確認できます:
現在、RはDesktop/students_analysis/
に入っていることがわかりました。
したがって、以下のようにデータを読み込むことができます:
RStudioのプロジェクト機能を使うと、.Rprojファイルが含まれるフォルダーが作業ディレクトリになります。
ファイルの場所がすぐにわかり、プロジェクトを別の場所に移動してもコードを変更する必要がありません。
相対パスをおすすめします!
penguins_analysis
というプロジェクトをデスクトップに作成して開いてください。終わったら、再度students_analysis
を開いてください。
penguins
は別の教科書のデータセットです)