2010年9月8日

千里馬日記20100908-2

20100908

Analysis of Environmental Data by Dr. Kevin McGarigal
(Tue, Thu 9.30-10.45 am)

指定教材是Ecological Models and Data in R, by Benjamin M. Bloker

1.introduction

本章廣泛地概覽生態研究的哲學和技術, 若你對哲學不耐煩, 請直接跳到1.4節(哈哈!)
在生態研究中, 統計工具是用來結合模式(models)和資料(data)的, 有了統計之後, 我們不只可以回答"在不同處理下會有多少比例的種子長出不同的根?"的問題, 也可以回答像"本研究結果和理論是否一致?"或"我們有證據說種子和種子之間有變異存在嗎?"等問題.
Sandin和Pacala (2005)對珊瑚礁魚類的經典研究,證實這些魚類的群聚會吸引掠食者(predators)造訪或攻擊, 這種研究可以透過相關性分析或迴歸分析來進行, 但資料必須滿足常態分布或線性關係等條件; Sandin和Pacala用了更有力的方法, 他們建立模式(models), 而且他們用realistic binomial和Poisson probability distribution來描述資料的變異性, 而非常態分布.

(既然他叫我跳到1.4, 我就跳吧)

統計結果有3種: 頻率(frequentist), 貝氏機率(Bayesian)和或然率(likelihood-based).
頻率如Fisher, Neyman, Pearson; likelihood通常是估算最大或然率(maximum likelihood estimation) <--根本看不懂; Bayesian也是一種或然率, 經wiki得知是機率中的機率, 比如驗血的正確率有90%, 陰性和陽性的比例是99.5:0.5, 那某甲驗出來是陽性的機率是多少? 即使如此, 書裡寫的仍不是很懂.

若說頻率統計指的是一個真實狀態(true state), 那Bayesian就是實驗結果的事實(truth)....天啊太玄了 >"<

1.5. R的優缺點

1.6. 模式建立過程

1.7. R的補充

自立自強求生補充: 台大計中電子報[范素瑋/生態學與演化生物學所博士候選人]

千里馬日記20100908-1

20100830


整個研究的概念架構,是立基於台灣的非都市土地劃有明確的分區(亦即zoning),原則上這些分區決定了土地使用(以land cover types, LCTs表示之)的方向,在各水庫集水區(watershed)範圍內,便間接對水庫的水質造成影響,因此希望透過本研究,瞭解現行法規對土地使用的影響,以及在此一制度下所形成的土地使用現況對於水質的影響.
由於土地使用對水質影響中,堪稱最明顯又最重要的是營養污染,因此本研究以營養鹽為水質變項.
1. study 1
study 1的目的是瞭解既有的保護區劃設,對於水質是否造成影響,也就是單純地著眼於空間法令對水質的影響,不去討論保護區的空間特性;以美國麻州的河川和州定保護區為對象,就像昨天報告的,以測點上游河川所流經的保護區長度和比例,探討有沒有劃設及不同劃設目的下,河川中的總氮濃度是否有差異

之所以著眼於總氮(TP)是因為文獻中提到的,相較於磷可能來自清潔劑,氮的來源相對單純,就是農耕用的肥料,所以和土地使用的關係是最密切的,而且它也是優養化指數中的3個指標之一(另外兩個是水中的葉綠素II濃度和水質透明度,水質透明度不是污染物,而葉綠素來源也不盡然與土地使用相關)
自變項除了保護區長度和比例外,還會考慮空間尺度,這是為了便於落實管理措施,例如500公尺內的保護區影響大於整個上游的保護區時,那就可以把管理集中在較小範圍內;不過這方面的分析有一毎大的隱憂,就是現在已經只有32個樣點了,並不是每個樣點往上游走500公尺都會有保護區座落其間,樣本可能會少到無法做這個分析
昨天有提到怕內容不夠周全,老師有建議往上推到法規,而不是往下做各保護區的空間特性(但這可以成為另一個獨立的題目,意洽);我想可以由聯邦政府和州政府的層次,討論不同類型的保護區是否受不同法規約束,我會再想想看
2. study 2
study 2是論文計畫書的主體,以台灣21座主要水庫中的14座為基地,把zoning,LCTs和兩者之間的差異量化,Jack比較注重的是LCTs對水質的影響,我希望zoning和LCTs之間的差異也放進來,另外,Jack還建議做兩個尺度:集水區全區和水域周邊某個寬度的廊道

其實這裡有一個問題,就是這塊地到底可以或不可以長怎樣,是”編定的使用地”決定的(例如建築用地就會規定建蔽率是多少),而不是"劃定的使用分區"決定的(例如本研究將沿用的山坡地保育區,鄉村區等);這些用詞可能有些人不太熟,總之台灣的鄉村土地決定一塊地怎麼用的規定有兩層,比如某某村裡一塊地可能被劃定為鄉村區(第1層: 使用分區,或簡稱分區),而且又編定為建築用地(第2層: 使用地,或簡稱用地),它能不能蓋房子以及蓋多大蓋多高,其實是第2層的規定決定的
在我旳paper裡,一開始我是兩者都有提到,可能也寫得不清楚啦,Jack說我應該要(1)把法規用語概念化,而不是把台灣的法規名詞翻成英文,(2)無論都市或鄉村,分區代表的是一種經過環境調查後,人們訂定一個目的,並勾勒出一個理想的資源分配和使用的狀態(不管它的目的是為了用光資源或保護資源),我想知道的是這個理想狀態到底有沒有達到,不管有沒有,現況的影響是什麼?如果沒有,那其落差所造成的影響又是什麼?
所以我後來只把第1層的規定放進來,也就是分區的劃定,包括了特定農業、一般農業、鄉村、森林、山坡地保育、風景、國家公園、河川、特定專用等10種zoning (總共11種,但本研究範圍內沒有工業區),把它們分為3大類:都市、農業、森林,之後LCTs數化也是只分這3類,有些情況像一大片農地上星布一些農舍,就會全部類化成農業,包括其間的道路,不會細分
LCTs的比例不用說,就是用數化類化好的圖層去計算;要討論zoning和LCTs之間的落差,技術上應該可行,就是把兩個圖層merge起來,14座水庫分別去計算zoning和LCTs不相符的部分(應該有都變農、都變森、農變都、農變森、森變都、森變農等6種)所佔比例
Jack認為只要算PLAND就夠了,我也同意,但總覺得有其他指數也可以和空間法規連得起來XDDD 這先不管啦!應該還是先跑PLAND吧,也就是各種類型的面積比例;整體而言,study比較沒有具體的技術問題,大概就是昨天老師說的,有沒有回答到研究問題,不過我想朝向修改研究問題的方向著手

20100907
開學後第1次跟JACK咪聽,因為目前忙著搞GIS,沒什麼具體進度,倒是Mass river那篇的data和分析方法讓我滿擔心的,我問他去找McGarigal好不好,他給了我一個麻州水資源研究中心的人名,要我去找她^^