三、問答題
1.簡述相關分析的步驟。
答:可繪制散點,發(fā)現(xiàn)有直線趨勢,進而計算相關系數(shù)r,以描述兩變量的線性關系。
2.簡述兩組比較的四格表資料χ2檢驗的條件。
答:當n>40,且所有T≥5時,用χ2檢驗的基本公式或四格表專用公式。
當n>40,但有1
若n≤40,或T≤1時,需用確切概率計算法。
3.舉例說明對合計率標準化的基本思想。
答:兩人群發(fā)病率、死亡率、出生率、病死率等的比較,?紤]人群性別、年齡等構成的影響,需對率進行標準化。率標準化法的基本思想就是采用統(tǒng)一的標準人口構成,以消除人口構成不同對人群總率的影響,使算得標準化率具有可比性。
4.欲研究廣州市正常成年男子的血糖情況,在廣州市隨機抽取了200名正常成年男子進行調查,以此為例說明(敘述)同質、變異、變量、變量值、總體與樣本這幾個概念。
答:同質是指具有某些相同的特征,如本例中廣州市、正常成年、男子等幾個特征;這些同質個體的全部就構成了總體;每個個體間的差異如身高、血糖值不同就是變異;從總體中隨機抽取的個體組成一個樣本,如本例中的200人;他們的測量指標是變量,如血糖;每個個體的測量值叫變量值,如張三的血糖值。
5.舉例說明變異系數(shù)適用于哪兩種形式的資料,作變異程度的比較?
答:(1)度量衡單位不同的多組資料的變異度的比較。例如,欲比較身高和體重何者變異度大,由于度量衡單位不同,不能直接用標準差來比較,而應用變異系數(shù)比較。
(2)比較均數(shù)相差懸殊的多組資料的變異度。例如,3歲兒童與20歲成年人身高差異的比較。
6.用兩種方法檢查已確診的乳腺癌患者120名,結果如下:
甲法 乙法
+ - 合計
+ 40 32 72
- 20 28 48
合計 60 60 120
試解釋表中數(shù)字32,20的意義。對該資料,可以進行哪些方面的統(tǒng)計分析?(不必計算)
答:32為甲法檢查為陽性而乙法檢查為陰性,20為甲法檢查為陰性而乙法檢查為陽性?梢赃M行配對設計下兩組頻數(shù)分布的χ2檢驗和分類變量的關聯(lián)性分析
7.舉例簡要說明隨機區(qū)組設計資料秩和檢驗的編秩方法。
答:隨機區(qū)組設計資料秩和檢驗的編秩方法為將每個區(qū)組的數(shù)據(jù)由小到大分別編秩,遇相同數(shù)據(jù)取平均秩次,按處理因素求秩和。
8.某地有5000名六年級小學生,欲通過隨機抽樣調查他們的平均身高。請簡述可以采用的抽樣方法之一及抽樣步驟。
答:根據(jù)α、β、γ和σ求出樣本例數(shù)N,按生長環(huán)境進行分層,如城鎮(zhèn),農村。每層內再按性別采用完全隨機抽樣或按學生班級整群抽樣。
9.簡述應用相對數(shù)時的注意事項。
答:(1)構成比與率應用時不能相互混淆。
(2)樣本含量太小時,不宜計算相對數(shù)
(3)對各組觀察例數(shù)不等的幾個率,不能直接相加求其總率
(4)在比較相對數(shù)時應注意資料的可比性
10.估計樣本例數(shù)的意義何在?需要確定哪些前提條件?
答:樣本含量估計充分反映了"重復"的基本原則,過小過大都有其弊端。
樣本含量過小,所得指標不穩(wěn)定,用以推斷總體的精密度和準確度差;檢驗的功效低,應有的差別不能顯示出來,難以獲得正確的研究結果,結論也缺乏充分的依據(jù)。
樣本含量過大,會增加實際工作的困難,浪費人力、物力和時間?赡芤敫嗟幕祀s因素,從而影響數(shù)據(jù)的質量。
實驗所需的樣本含量取決于以下4個因素:
(1)假設檢驗的第Ⅰ類錯誤的概率α
(2)假設檢驗的第Ⅱ類錯誤的概率β
(3)容許誤差δ
(4)總體標準差σ或總體概率π
相關推薦:過來人導航:執(zhí)考十三步,陪你一直到領證