注意事項

考試期間

  • 請按照平時上課之座位入座。兩台電腦營幕中間應使用隔板(或拿包包)擋著。
  • 於課程網站(http://www.hmwu.idv.tw)下載題目卷。
  • 可參考課本、上課講義(包含電子檔)及其它資料,但不能與別人討論。
  • 可使用計算機、自己的筆記型電腦及平板電腦,不可使用手機。
  • 全程可上網查詢,但不能用通訊軟體FB/LINE等討論
  • 程式設計題,若程式碼直接複製(或照抄)講義上的以不給分為原則。
  • 有問題者,請舉手發問。勿與同學交談
  • 程式直接寫在本Rmd檔。經knit編譯,產生.html檔,需印出R程式碼及執行結果。
  • 不按照規定作答者,酌量扣分。
  • 程式請隨時存檔,避免突然意外發生,程式檔不見。

上傳答題檔案

  • 於教師網站首頁登入[作業考試上傳區],帳號: r1092。密碼: xxx
  • 選取「正確的」資料夾上傳,若傳錯,請最終要上傳一份正確的的答題檔案。
  • 請上傳「學號-姓名-R-MidtermExam.Rmd」、「學號-姓名-R-MidtermExam.html」。 (學號及姓名,改成自己)
  • 若上傳檔案格式錯誤,內容亂碼,空檔等等問題。請自行負責。
  • 若要重覆上傳(第2次以上),請在檔名最後加「-2」、「-3」,例如: 「學號-姓名-R-MidtermExam.Rmd」等等。
  • 上傳兩次(含)以上 、格式不合等等酌量扣分。
  • 如果上傳網站出現「You can modify the html file, but please keep the link www.wftpserver.com at least.」, 請將滑鼠移至「網址列」後,按「Enter」即可。若再不行,請換其它瀏覽器(IE/Edge/Firefox/Chrome)。
  • 有問題者,請FB私訊老師。
  • 總分共120分。

其它事項

  • 若有題目不會寫、或只會寫一半、或結果是有錯的,導致knit無法編譯產生文件, 則可以「不執行有錯的程式碼」,但必需列印此段程式碼。助教會依照狀況部份給分。






1 簡易資料處理、以ggplot2做基礎繪圖

diabetes.csv」為一記錄糖尿病的資料集,其變數解釋如下:

1.1 讀入資料 (5分)

讀入資料集「diabetes.csv」 (命名為diabetes), 使用xtable套件,印出資料前後各5筆資料及其結構。(指令提示: xtable)

# your source code here
# your source code here

1.2 資料型態轉換 (5分)

判斷變數sex, edu, a1cgp是否為factor類別? 若不是,請轉換成factor類別變數, 其中edu為有順序的factor類別變數。(要求: 需將上述三變數中的類別編碼轉回文字,例如: 性別 (sex): 1轉為女生, 2轉為男生)。更改完後再印出資料結構。(指令提示: sapplyfactor)

# your source code here

1.3 資料處理 (10分)

印出哪些編號 (id)的紀錄具有遺失值(NA)? 刪除具有NA的紀錄,並將剩餘之完整資料另存成一R資料框(命名為diabetes.complete),其資料維度為何? 印出前10筆紀錄。(指令提示: applyis.na)

# your source code here
# your source code here

1.4 索引圖 (10分)

繪出diabetes.omplete中連續變數的索引圖(id除外)。(要求: (1)請六張圖一頁(3 by 2); (2) 需加標題名(“索引圖”)及座標名(\(x\)軸名為index, \(y\)軸名為變數名); (3) 圖上點之顏色以性別(sex)的類別為依據; (4) 圖上點之符號型狀以嚴重度 (a1cgp)的類別為依據。)(指令提示: lapplysapplyis.numericmarrangeGrob)

# your source code here

1.5 盒形圖 (10分)

各依照變數sex, edua1cgp之類別, 繪出diabetes.omplete中,膽固醇 (ldl)之盒形圖。 (要求: (1)請三張圖並列一頁; (2) 需加標題及座標名)

# your source code here

1.6 散佈圖 (10分)

繪出diabetes.omplete中,兩個並列的散佈圖(\(x\) vs \(y\)): (1) 體重 (wt) vs 膽固醇 (ldl); (2) 收縮壓 (sbp) vs 舒張壓 (dbp)。圖上點之顏色以性別(sex)的類別為依據; (4) 圖上點之符號型狀以嚴重度 (a1cgp)的類別為依據。

# your source code here



2 畫激勵函數 (20分)

深度學習(deep learning)領域中常使用的激勵函數(activation function) (https://en.wikipedia.org/wiki/Activation_function)有以下三種, 請用ggplot2 套件畫出它們的圖形。 \[ \mbox{Sigmoid or logistic function (sigmoid)}: f(x) = \frac{1}{1+e^{-x}}, x \] \[ \mbox{Hyperbolic tangent function (tanh)}: f(x) = \frac{e^x-e^{-x}}{e^x+e^{-x}} \] \[ \mbox{Rectified linear unit function (Relu)}: f(x) = xI(x \geq 0) \]

# your source code here



3 股票月成交資訊

有民國100年5家半導體公司股票月成交資訊紀錄於資料檔(stock-data.txt)中。

3.1 讀入資料 (5分)

請讀入此資料並使用xtable套件,印出資料前5筆資料及其結構。

# your source code here
# your source code here

3.2 資料型態轉換 (10分)

請將資料中的「成交筆數」、「成交金額」及「成交股數」轉成數值型變數後, 請使用xtable套件,印出資料前5筆資料及其結構。

# your source code here
# your source code here

3.3 線圖 (30分)

請繪出以下三家公司之線圖。(要求: (1) \(x\)軸標記為月份英文簡記。(2) \(y\)軸的範圍為0~500)

# your source code here



4 格式 (5分)

有成功編譯出正確的 「學號-姓名-R-MidtermExam.pdf」及「學號-姓名-R-MidtermExam.doc」,並上傳。 以下數學式是測試MikTeX/LaTeX,請勿刪。這是常態分佈的機率密度函數: \[ f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{\frac{(x-\mu)^2}{2\sigma^2}} \]