R 語言翻轉教室

版本號:v1.0

測試結果: Linux Windows Build status

1. 簡介

這是一個以著重於實作,一個動態的R 語言在地化中文教材。這份教材的內容涵蓋:

  1. 使用R 的基本使用知識
  2. 如何用R 讀取資料與讀取中文
  3. 如何用R 從公開資料中萃取資訊
  4. 如何用R 整理資訊
  5. 如何利用R 將整理好的資訊繪製統計圖表與地圖

這個教材具有挑戰性,每一個關卡的大魔王都有一定的難度。如果你已經有程式語言的基礎或是喜歡自我挑戰,那這份教材很適合同學自學,並且大概會花你12~18小時的時間。

如果你已經有R 語言的基礎,我建議你可以先完成Hello-DataScienceAndR之後,從01-RBasic-07開始學習中文處理與資料處理相關的知識,這段內容我自以為勝過大部分的R 教材。

如果你完全沒有程式的經驗,我建議你可以挑戰看看,但是請儘量善用聊天室(你可以點選右下角的Open Chat或造訪:http://gitter.im/wush978/DataScienceAndR)。如果仍然完全無法理解R 語言的邏輯,就麻煩你先參加其他的實體課程後再回來學習。

這份教材具有以下的特色:

  1. 完整。由於教材是參考CRAN上介紹R 的官方文件:An Introduction to R所撰寫的,同學即使只有使用這份教材學R ,即可獲得所有用R 所需要的所有知識。
  2. 在地化的中文資料處理。教材是特別針對處理台灣的Open Data所設計,所以會涵蓋所有要載入中文資料所需要的知識。網路上雖然已經有很多很棒的R 教材,但是他們通常沒有描述如何處理中文資料。
  3. 。在2012年以後,R 的成長是非常快速的,所以教材會納入許多近年來被R 社群證實很棒的套件們。
  4. 套件的使用與探索。R 的一大優勢就是蓬勃的套件系統。雖然教材中無法介紹所有的套件,但是會教同學如何探索一個第一次接觸的R 套件。
  5. 互動。我們基於R Community貢獻的R 語言套件swirl 所撰寫的互動式學習環境,可以讓同學以最貼近實際使用R 的狀況來學R
  6. 教材設計。每個單元的開始,我們設計大量的操作讓同學是透過用肌肉來記憶R 的指令。並且在單元的最後都擁有來自實務且具有挑戰性的關卡。
  7. 自由。老師們可以很方便與自由地將本教材整合至您的教案之中。有興趣的老師請參考:教師專區

2. 即時動態

    3. 線上體驗區(需參加實體課程)

    請有參加實體課程的同學打開: http://server.datascienceandr.org:28787

    並依照課堂上給的帳號密碼登入。

    有興趣的同學也歡迎聯繫我們(無論是在聊天室或是來信:wush@datascienceandr.org),取得線上體驗的帳號密碼。

    4. 快速安裝區

    同學可以參考以下的上手影片:

    或是依照以下的動作快速設定學習環境:

    1. 安裝R
    2. 安裝Rstudio(Windows 使用者請安裝Rstudio或自備能夠編輯UTF-8 編碼的編輯器,OS X 與Linux使用者可依據自己喜好決定是否使用Rstudio)
    3. 打開R ,執行:source("http://wush978.github.io/R/init-swirl.R")
    4. 輸入library(swirl);swirl()後即進入教學環境。
    5. 進入00-Hello-DataScienceAndR課程檢查你的電腦能不能執行本教材的所有功能,並瞭解本教材所提供的功能。

    有興趣了解安裝細節的同學,請操考:

    安裝上有問題,或是在執行00-Hello-DataScienceAndR不順利的同學請到求助專區取得協助

    5. 互動式學習環境快速上手區

    在輸入swirl()之後,同學即進入R 的互動式學習環境(swirl環境)。請參考以下動作做操作:

    5.1. 1. 進入學習環境

    Imgur

    ps. 如果你之前有進行過swirl的課程,swirl會出現下圖的選項詢問你是否要接關。請根據你的需求作答:

    Imgur

    如不接關,請選取:No. Let me start something new.

    5.2. 2. 選擇課程(Course)

    Imgur

    5.3. 3. 選擇你要進行的單元(Lesson)

    Imgur

    目前主要課程分成以下三塊:

    • 01-RBasic區:講解R 語言的基礎知識與使用方法。所有以下的課程都需要知道RBasic的知識。
    • 02-RDataEngineer區:講解載入資料至R 語言,以及清理、整理資料的所需知識。
    • 03-RVisualization區:介紹R的視覺化功能

    其他的課程,同學可以視自己的興趣決定要不要完成

    • Optional-RProgramming區:介紹R 語言的程式功能。
    • Optional-RDataMining區:介紹R 語言在Data Mining中常用的套件。
    • Optional-RStatistic區:搭配實體課程所使用的swirl課程,不建議同學自行使用

    6. 求助專區

    有問題的朋友,麻煩先註冊一個Github帳號後,可以到以下地方討論:

    7. 緣起

    這個Repository主要是為了準備我在臺大的資料科學課程,幫陳老師講的兩堂R 的課程。課程素材主要就是投影片和swirl。內容則是參考CRAN上介紹R 的官方文件:An Introduction to R。 另外也要感謝社群中所有有參與籌備資料科學愛好者年會2015的同伴。

    8. 課程筆記

    以下連結記載swirl中的課程內容(sha-hash: 4636e186 版本)

    9. 課程投影片

    以下連結是課程中使用的投影片

    10. License

    創用 CC 授權條款
    Data Science and RWush Wu、Chih Cheng Liang和Johnson Hsieh製作,以創用CC 姓名標示-相同方式分享 3.0 台灣 授權條款釋出。

    11. 捐贈

    如果你認為這份教材有確實幫助到你,很歡迎捐贈一元以上的金額並留言給我們。

    了解這份教材對大家的貢獻,是我們開發這套教材的動力。