Phương pháp nghiên cứu khoa học - Bài 20: Thống kê phân tích biến số định lượng với Stata

doc 27 trang hapham 9900
Bạn đang xem 20 trang mẫu của tài liệu "Phương pháp nghiên cứu khoa học - Bài 20: Thống kê phân tích biến số định lượng với Stata", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • docphuong_phap_nghien_cuu_khoa_hoc_bai_20_thong_ke_phan_tich_bi.doc

Nội dung text: Phương pháp nghiên cứu khoa học - Bài 20: Thống kê phân tích biến số định lượng với Stata

  1. Thống kê phân tích biến số định lượng với Stata Sơ lược lí thuyết về so sánh 2 trung bình Kiểm định t dùng để so sánh 2 trung bình của của biến số định lương cĩ phân phối bình thường. Kiểm định t gồm cĩ (a) Kiểm định t bắt cặp để so sánh trung bình trước và sau khi can thiệp trên một nhĩm và (b) kiểm định t khơng bắt cặp để so sánh trung bình của 2 nhĩm độc lập. Cĩ hai loại kiểm định t khơng bắt cặp (khi so sánh trung bình của 2 nhĩm độc lập). Kiểm định t cĩ giả định 2 phương sai bằng nhau và kiểm định t khơng cĩ giả định phương sai bằng nhau. Hai loại kiểm định này cĩ chung nguyên lí nhưng khác nhau trong cách tính tốn độ tự do (của kiểm định t) và cách tính sai số chuẩn. Kiểm định t khơng bắt cặp giả định 2 phương sai bằng nhau Kiểm định t khơng bắt cặp giả định 2 phương sai bằng nhau dùng để so sánh trung bình của 2 nhĩm độc lập và địi hỏi 2 giả định. - Các giá trị của biến số của cả 2 dân số cĩ phân phối bình thường - Ðộ lệch chuẩn ở 2 nhĩm dân số là bằng nhau. Nếu chúng ta kí hiệu: x1 : giá trị trung bình ở nhĩm 1 x2 : giá trị trung bình ở nhĩm 2 n1 : cỡ mẫu của nhĩm 1 n2 : cỡ mẫu của nhĩm 2 2 s1 : phương sai ở nhĩm 1 2 s2 : phương sai ở nhĩm 2 Chúng ta cĩ thể xác định độ tự do, sai số chuẩn và giá trị của thống kê t theo cơng thức sau: - Độ tự do của kiểm định t: df = n1 + n2 - 2 se s 1/ n 1/ n - Sai số chuẩn: p 1 2 với 2 2 (n1 1)s1 (n2 1)s2 s p (n1 1) (n2 1) x x x x t 1 2 1 2 se - Giá trị thống kê t: s p 1/ n1 1/ n2 Sau khi tính được giá trị thống kê t, người ta tra bảng phân phối t với (n1 +n1 - 2) độ tự do và tính được xác suất p. Thơng thường nếu p <0,05 người ta bác bỏ giả thuyết H0. Kiểm định t khơng bắt cặp khơng cĩ giả định 2 phương sai bằng nhau Kiểm định t khơng bắt cặp giả định 2 phương sai bằng nhau dùng để so sánh trung bình của 2 nhĩm độc lập và chỉ địi hỏi 1 giả định. - Các giá trị của biến số của cả 2 dân số cĩ phân phối bình thường Nếu chúng ta kí hiệu:
  2. x1 : giá trị trung bình ở nhĩm 1 x2 : giá trị trung bình ở nhĩm 2 n1 : cỡ mẫu của nhĩm 1 n2 : cỡ mẫu của nhĩm 2 2 s1 : phương sai ở nhĩm 1 2 s2 : phương sai ở nhĩm 2 Chúng ta cĩ thể xác định độ tự do, sai số chuẩn và giá trị của thống kê t theo cơng thức sau: - Độ tự do của kiểm định t (theo cơng thức của Satterthwaite): 2 2 2  s1 s2 n1 n2 d. f .  s 4 s 4 1 2 n 2 (n 1) n 2 (n 1) 1 1 2 2  s 2 s 2 se 1 2 - Sai số chuẩn: n1 n2 x x x x t 1 2 1 2 se s 2 s 2 1 2 - Giá trị thống kê t: n1 n2 Sau khi tính được giá trị thống kê t, người ta tra bảng phân phối t với độ tự do phù hợp (như tính tốn ở trên) và tính được xác suất p. Thơng thường nếu p <0,05 người ta bác bỏ giả thuyết H0. Kiểm định t bắt cặp Giả sử để so sánh hiệu quả của thuốc A và thuốc B trong cải thiện thể tích thở ra gắng sức trong 1 giây đầu tiên (FEV1) người ta cho các bệnh nhân tham gia nghiên cứu dùng thuốc A (hay thuốc B) trong một thời gian và cuối thời gian này đo lường FEV1 của bệnh nhân (gọi là FEV1A). Sau đĩ cho lại đổi cho bệnh nhân dùng thuốc B (hay thuốc A) trong một khoảng thời gian và cuối thời gian này lại đo lường FEV1 của bệnh nhân (gọi là FEV1B). Thiết kế nghiên cứu này được gọi là thử nghiệm lâm sàng bắt chéo. Chúng ta lưu ý các đặc điểm sau khi phân tích thống kê cho các nghiên cứu cĩ cùng loại thiết kế này. - Trong nghiên cứu này cĩ 2 biến số đo lường trên cùng dân số: FEV1A và FEV1B - Các giá trị của biến số FEV1A và FEV1B là của cùng một bệnh nhân nên hiệu số (FEV1A - FEV1B) cũng là biến số của bệnh nhân đĩ. Và nếu khơng cĩ sự khác biệt về hiệu quả của 2 loại thuốc, trung bình của hiệu số này bằng 0. - Khi đĩ kiểm định so sánh hiệu quả của thuốc A và thuốc B cũng  kiểm định so sánh giá trị trung bình của FEV1A và FEV1B  kiểm định hiệu số (FEV1A - FEV1B)=0 - Phép kiểm định này được gọi là kiểm định t bắt cặp. Kiểm định t bắt cặp là trường hợp đặc biệt của kiểm định t một mẫu. Tĩm lại kiểm định t bắt cặp là kiểm định được sử dụng khi thiết kế nghiên cứu cho một
  3. đối tượng (hay 2 đối tượng rất giống nhau) được thử nghiệm 2 loại thuốc khác nhau. Kiểm định phi tham số Nếu phân phối khơng phải là bình thường (thí dụ như bị lệch dương), cĩ thể sử dụng phép biến đổi (thường là biến đổi log) để đưa phân phối về bình thường hoặc dùng test phi tham số. Kiểm định phi tham số cĩ ưu điểm là khơng địi hỏi giả định về phân phối của biến số định lượng nhưng cĩ khuyết điểm là khơng thể ước lượng được tham số, đĩ là như khơng thể ước lượng khoảng tin cậy 95% hiệu số của trung bình giữa 2 nhĩm. Sơ lược lí thuyết về so sánh các trung bình của 3 nhĩm. Khi chúng ta cần so sánh trung bình của nhiều nhĩm, chúng ta khơng thể dùng nhiều kiểm định t để so sánh từng cặp của nhĩm vì như vậy chúng ta sẽ làm tăng nguy cơ của sai lầm loại 1. Phương pháp thích hợp để được dùng cho trường hợp này được gọi là test ANOVA. Test ANOVA (phân tích phương sai) được xem như là sự tổng quát hĩa của test t (test t dùng cho 2 nhĩm và test ANOVA dùng cho 2 hay nhiều hơn các nhĩm). Ðiều kiện để test ANOVA hợp lệ là các giá trị cĩ phân phối bình thường và phương sai của các nhĩm xấp xỉ nhau. Trong kết xuất của test ANOVA, chúng ta thấy cĩ sự hiện diện của thống kê F (thống kê Fisher). Trong trường hợp chỉ cĩ 2 nhĩm, thống kê F chính xác bằng bình phương của thống kê t và 2 phương pháp cho ra cùng một mức ý nghĩa. ến BPT BPT BPT : : : định thứ Đúng danh Đúng lượn Đúng tự địnhKiể g m định Khơnχ2 Phân Kiể g BPTphối m đồng bình: Đúng định nhất phânthườ phi ≤ 2 Trên Phư phốing 3 tha bìnhnhĩ m số ơng Đúng nhĩ thườm m sai đồng ng Khơn Phư g nhấtĐồng ơng đồng nhất Đồng sai nhất nhất đồng nhấtKiể Kiể AN m m OV định định A Hình 1.t Giải thuật lựa chọn kiểm định phùt hợp cho biến số phụ thuộc là biến định lượng PS khơ ng đồn g nhất
  4. Thực hành 1- Mở tập tin ivf_v2. Chúng ta hãy khởi động Stata. Mở tập tin ivf_v2.dta bằng cách sử dụng menu File :: Open hay nhấp vào nút cơng cụ Open file (Use), nằm ở vị trí thứ hai của thanh cơng cụ. Khi đĩ hộp thoại Use New Data sẽ hiện ra. Nhấp vào mũi tên bên phải hộp Look in để chọn ổ đĩa thích hợp và dùng con chuột nhấp vào các thư mục để chọn thư mục cĩ chứa số liệu. Khi gập tập tin số liệu ivf_v2.dta, nhấp đúp vào tên tập tin này để mở tập tin (hoặc nhấp vào tập tin này để tên tập tin rơi vào hộp File Name rồi sau đĩ nhấp vào nút lệnh Open để mở tập tin). Cần nhớ nhấp vào nút cơng cụ Stata Log nằm vị trí thứ tư từ trái ở trên thanh cơng cụ nếu muốn lưu trữ lại tồn bộ kết quả phân tích sẽ được thực hiện. 2. Sau khi mở tập tin, cần cĩ thơng tin gì trước khi phân tích số liệu: Trước khi phân tích số liệu, nhà nghiên cứu (hay chuyên viên thống kê) cần đọc lại đề cương nghiên cứu, đặc biệt là số liệu (biến số và số các bản ghi), mục tiêu và thiết kế nghiên cứu. Giả sử chúng ta cĩ thơng tin về nghiên cứu như sau: MRC Working Party on Children Conceived by In Vitro Fertilisation. Births in Great Britain resulting from assisted conception, 1978-87. BMJ 1990;300:1229-33. Births in Great Britain resulting from assisted conception, 1978-87. MRC Working Party on Children Conceived by In Vitro Fertilisation. OBJECTIVE To describe the characteristics at birth of children conceived by in vitro fertilisation (IVF) or by gamete intrafallopian transfer (GIFT) and to assess whether they differ from those of children conceived naturally. DESIGN Survey of children resulting from IVF or GIFT and comparison of their characteristics at birth with national statistics. SETTING England, Scotland, and Wales from 1978 to 1987. SUBJECTS 1267 Pregnancies conceived by IVF or GIFT, which resulted in 1581 liveborn or stillborn children. MAIN OUTCOME MEASURES Sex ratio, multiplicity, gestational age at birth, birth weight, stillbirth rate, perinatal and infant mortality, and prevalence of congenital malformations. RESULTS The ratio of male to female births was 1.07:1; 23% (249/1092) of the deliveries were multiple births compared with 1% for natural conceptions; 24% (278) of 1015 deliveries were preterm compared with 6% in England and Wales; 32% (406) of 1269 babies weighed less than 2500 g compared with 7% in England and Wales. The high percentage of preterm deliveries and of low birthweight babies was largely, but not entirely, due to the high frequency of multiple births. The rate of stillbirth, perinatal mortality, and infant mortality were twice the national average, these excesses being due to the high frequency of multiple births. One or more major congenital malformations were detected during the first week of life in 35 (2.2%) of 1581 babies. This figure is comparable with population based estimates of the prevalence of congenital malformations. The types of malformations reported varied, and the number of each specific type was small. The health of the children was not evaluated beyond the perinatal period. CONCLUSIONS Multiple pregnancies often result from assisted conception and are the main determinant of the outcome of the pregnancies and of the health of the children at the time of birth. Congenital malformations are comparatively
  5. rare, so larger numbers of children need to be studied before firm conclusions can be drawn. The pooling of data from different countries is recommended. PMID: 2354290 [PubMed - indexed for MEDLINE] Số liệu này bao gồm những biến số về những đứa trẻ sinh một của những bà mẹ được thụ thai trong ống nghiệm (in-vitro fertilisation). Nghiên cứu này đã được báo cáo trong tạp chí BMJ (1990;300:1229-1233). Tập tin này bao gồm 641 đứa trẻ và gồm 8 biến số cĩ chi tiết như sau: STT Tên biến Giải thích tiếng Anh Giải thích tiếng Việt identity number of mother and 1 Maso Mã số baby 2 tuoime maternal age in years Tuổi của mẹ (năm tuổi) Tăng huyết áp thai kì 1= cĩ 0 = 3 tang_ha hypertension 1=yes, 0=no khơng 4 tuoithai gestational age in weeks Tuổi thai (tính theo tuần) 5 gioi sex of baby 1=male, 0=female Giới tính của trẻ 1=trai 0=gái 6 tlsosinh birth weight in gms Trọng lượng sinh tính theo grams. Occupation of mother (1= self employed; 2=blue collar Nghề nghiệp mẹ (1= nghề tự do; 7 nghenghiep worker; 3=white collar 2=cơng nhân; 3=viên chức) worker) maternal age groups(0=<30; Tuổi của mẹ phân nhĩm (0=<30; 8 nhomtuoi 1=30-34;2=35-39;3=40+) 1=30-34; 2=35-39; 3=40+) gestational category (1= <37 Sinh non (1: dưới 37 tuần; 0: đủ 9 sinhnon tuần; 0=37+tuần) tháng – trên 37 tuần thai) Việc nhận biết số liệu cũng cĩ thể thực hiện bằng cách sử dụng lệnh describe (nhấn phím F3). Điều này đặc biệt cĩ ích nếu các biến số và giá trị của biến số đã được dán nhãn đầy đủ. Trong nghiên cứu này, tác giả muốn xác định tác động của tăng huyết áp của mẹ và tuổi thai lên trọng lượng thai. 3. Như vậy trong các biến số kể trên, biến nào là biến độc lập, biến nào là biến số phụ thuộc, biến số này là gây nhiễu. Hướng dẫn: Bảng số liệu viewivf này cĩ chứa những biến số khác nhau. Trong bảng sau hãy xác định tính chất của từng biến số bằng cách khoanh trịn vào lựa chọn thích hợp. Biến số Thang đo biến số Quan hệ - Nhị giá - Danh định - Độc lập - Phụ thuộc tuoime - Thứ tự - Định lượng - Gây nhiễu
  6. - Nhị giá - Danh định - Độc lập - Phụ thuộc tang_ha - Thứ tự - Định lượng - Gây nhiễu - Nhị giá - Danh định - Độc lập - Phụ thuộc tuoithai - Thứ tự - Định lượng - Gây nhiễu - Nhị giá - Danh định - Độc lập - Phụ thuộc gioi - Thứ tự - Định lượng - Gây nhiễu - Nhị giá - Danh định - Độc lập - Phụ thuộc tlsosinh - Thứ tự - Định lượng - Gây nhiễu - Nhị giá - Danh định - Độc lập - Phụ thuộc nghenghiep - Thứ tự - Định lượng - Gây nhiễu - Nhị giá - Danh định - Độc lập - Phụ thuộc nhomtuoi - Thứ tự - Định lượng - Gây nhiễu - Nhị giá - Danh định - Độc lập - Phụ thuộc sinhnon - Thứ tự - Định lượng - Gây nhiễu 4. Trước khi phân tích số liệu cần thực hiện thao tác số liệu và các thống kê mơ tả. Thực hiện lại các bước thao tác số liệu và thống kê mơ tả như ở chương trước 5. Hãy so sánh trọng lượng của trẻ nam và trẻ nữ Hướng dẫn: Theo giải thuật được trình bày ở đầu chương, để so sánh trọng lượng (biến phụ thuộc cĩ phân phối bình thường) ở 2 nhĩm trước tiên chúng ta cần phải xem phương sai của 2 nhĩm cĩ bằng nhau hay khơng. Nếu phương sai 2 nhĩm tương đương chúng ta cĩ thể sử dụng t-test thơng thường (t-test phương sai đồng nhất). Nếu phương sai 2 nhĩm khơng tương đương, chúng ta phải sử dụng t-test phương sai khơng đồng nhất hay kiểm định phi tham số. Kiểm định 1: So sánh 2 phương sai Để so sánh trung bình của một biến định lượng ở hai hay nhiều nhĩm, chúng ta sử dụng menu Statistics :: Summaries, tables, & tests :: Classical tests of hypothesis :: Group variance comparison test.
  7. Sau khi cửa sổ sdtest – Two sample test of variance hiện ra tiến hành 5 bước sau: Bước 1: đặt con trỏ vào hộp văn bản Variable name Bước 2: đưa con trỏ vào cửa sổ Variables và nhấp vào biến tlsosinh để đưa biến này vào hộp văn bản Variable name Bước 3: đặt con trỏ vào hộp văn bản Group name variable Bước 4: đưa con trỏ vào cửa sổ Variables và nhấp vào biến gioi để đưa biến này vào hộp văn bản Group name variable.
  8. Bước 5: Nhấp vào nút lệnh OK. Kết quả được trình bày như sau: . sdtest tlsosinh, by(gioi) Variance ratio test Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] + gai | 315 3044.127 35.421 628.6603 2974.434 3113.819 trai | 326 3211.279 36.88521 665.9798 3138.715 3283.843 + combined | 641 3129.137 25.78336 652.7827 3078.507 3179.767 Ho: sd(gai) = sd(trai) F(314,325) observed = F_obs = 0.891 F(314,325) lower tail = F_L = F_obs = 0.891 F(314,325) upper tail = F_U = 1/F_obs = 1.122 Ha: sd(gai) sd(trai) P F_U = 0.3032 P > F_obs = 0.8482 Với giá trị p = 0,3032 chúng ta khơng thể bác bỏ giả thuyết Ho: độ lệch chuẩn của nhĩm trẻ trai bằng độ lệch chuẩn của nhĩm trẻ gái. Vì vậy chúng ta cĩ thể sử dụng kiểm định t phương sai đồng nhát như ở bước 2. Kiểm định 2: So sánh 2 trung bình sử dụng t-test phương sai đồng nhất. Để so sánh trung bình của một biến định lượng ở hai hay nhiều nhĩm, chúng ta sử dụng menu Statistics :: Summaries, tables, & tests :: Classical tests of hypothesis :: Group mean comparison test
  9. Cửa sổ ttest- group mean comparision tests hiển ra. Tiến hành các bước sau: Bước 1: đặt con trỏ vào hộp văn bản Variable name Bước 2: đưa con trỏ vào cửa sổ Variables và nhấp vào biến tlsosinh để đưa biến này vào hộp văn bản Variable name Bước 3: đặt con trỏ vào hộp văn bản Group name variable Bước 4: đưa con trỏ vào cửa sổ Variables và nhấp vào biến gioi để đưa biến này vào hộp văn bản Group name variable.
  10. Bước 5: Nhấp vào nút lệnh OK. . ttest tlsosinh, by(gioi) Two-sample t test with equal variances - Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] + - gai | 315 3044.127 35.421 628.6603 2974.434 3113.819 trai | 326 3211.279 36.88521 665.9798 3138.715 3283.843 + - combined | 641 3129.137 25.78336 652.7827 3078.507 3179.767 + - diff | -167.1522 51.18935 -267.6718 - 66.63249 - Degrees of freedom: 639 Ho: mean(gai) - mean(trai) = diff = 0 Ha: diff 0 t = -3.2654 t = -3.2654 t = -3.2654 P |t| = 0.0012 P > t = 0.9994 Trả lời: Trẻ trai cĩ trọng lượng sơ sinh trung bình là 3211.28 gram, của trẻ gái là 3044.13 gram. Với giá trị t = 3,2654 và mức ý nghĩa (p-value) là 0.0012 chúng ta kết luận cĩ sự khác biệt về trọng lượng sơ sinh giữa trẻ trai và trẻ gái (p=0.0012). 6. Hãy so sánh trọng lượng sơ sinh của con bà mẹ tăng huyết áp và bà mẹ khơng tăng huyết áp. Hướng dẫn: Theo giải thuật được trình bày ở đầu chương, để so sánh trọng lượng (biến phụ thuộc cĩ phân phối bình thường) ở 2 nhĩm trước tiên chúng ta cần phải xem phương sai của 2 nhĩm mẹ tăng huyết áp và mẹ khơng tăng huyết áp cĩ bằng nhau hay khơng. Nếu phương sai 2 nhĩm tương đương chúng ta cĩ thể sử dụng t-test thơng thường (t-test phương sai đồng nhất). Nếu phương sai 2 nhĩm khơng tương đương, chúng ta phải sử dụng t-test phương sai khơng đồng nhất hay kiểm định phi tham số. Kiểm định 1: So sánh 2 phương sai Để so sánh trung bình của một biến định lượng ở hai hay nhiều nhĩm, chúng ta sử dụng menu Statistics :: Summaries, tables, & tests :: Classical tests of hypothesis :: Group variance comparison test. Sau khi cửa sổ sdtest - Group variance comparison test chúng ta đưa biến tlsosinh vào hộp văn bản Variable name và biến tang_ha vào hộp văn bản Group name variable rồi nhấp vào nút lệnh OK. Kết quả được trình bày như sau:
  11. . sdtest tlsosinh, by( tang_ha ) Variance ratio test - Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] + - Ha bt | 552 3191.531 25.58435 601.0962 3141.276 3241.786 Ha tang | 89 2742.157 86.17222 812.9471 2570.908 2913.406 + - combined | 641 3129.137 25.78336 652.7827 3078.507 3179.767 - Ho: sd(huyet ap) = sd(huyet ap) F(551,88) observed = F_obs = 0.547 F(551,88) lower tail = F_L = F_obs = 0.547 F(551,88) upper tail = F_U = 1/F_obs = 1.829 Ha: sd(1) sd(2) P F_U = 0.0003 P > F_obs = 1.0000 Kết quả cho thấy giá trị p = 0,0003 cĩ nghĩa là phương sai của trọng lượng lúc sinh của 2 nhĩm khơng đồng nhất. Vì vậy chúng ta khơng thể dùng t-test phương sai đồng nhất mà phải sử dụng t-test phương sai khơng đồng nhất (kiểm định 2A) hay kiểm định phi tham số (kiểm định 2B). Kiểm định 2A: so sánh 2 trung bình t-test phương sai khơng đồng nhất Để so sánh trung bình của một biến định lượng ở hai hay nhiều nhĩm, chúng ta sử dụng menu Statistics :: Summaries, tables, & tests :: Classical tests of hypothesis :: Group mean comparison test (xem lại câu 4) và biến tlsosinh vào hộp văn bản Variable name; biến tang_ha vào hộp văn bản Group name variable của cửa sổ ttest- group mean comparison. Cần lưu ý đánh dấu vào hộp kiểm Unequal variances rồi nhấp vào nút OK.
  12. Kết quả trình bày như sau: . ttest tlsosinh, by(tang_ha) unequal Two-sample t test with unequal variances Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] + ha bt | 552 3191.531 25.58435 601.0962 3141.276 3241.786 ha tang | 89 2742.157 86.17222 812.9471 2570.908 2913.406 + combined | 641 3129.137 25.78336 652.7827 3078.507 3179.767 + diff | 449.3735 89.88999 271.1197 627.6273 Satterthwaite's degrees of freedom: 104.069 Ho: mean(ha bt) - mean(ha tang) = diff = 0 Ha: diff 0 t = 4.9991 t = 4.9991 t = 4.9991 P |t| = 0.0000 P > t = 0.0000 Trả lời: Con bà mẹ bị tăng huyết áp cĩ trọng lượng sơ sinh trung bình là 2742 gram, ở con của bà mẹ khơng tăng huyết áp là 3192 gram. Sự khác biệt này cĩ ý nghĩa thống kê với p<0,0001.
  13. Kiểm định 2B: so sánh 2 trung bình với phép kiểm phi tham số Mann-Whitney Thực hiện kiểm định phi tham số tổng sắp hạng Mann-Whitney (Mann-Whitney rank sum test) bằng dụng menu Statistics :: Summaries, tables, & tests :: Non-parametric test of hypotheses :: Mann-Whitney two-sample ranksum test. Sau đĩ cửa sổ ranksum - Mann-Whitney two-sample statistic hiện ra. Tiến hành các bước sau: Bước 1: đặt con trỏ vào hộp văn bản Variable name Bước 2: đưa con trỏ vào cửa sổ Variables và nhấp vào biến tlsosinh để đưa biến này vào hộp văn bản Variable name Bước 3: đặt con trỏ vào hộp văn bản Group name variable Bước 4: đưa con trỏ vào cửa sổ Variables và nhấp vào biến tang_ha để đưa biến này vào hộp văn bản Group name variable.
  14. Bước 5: Nhấp vào nút lệnh OK. Kết quả như sau: . ranksum tlsosinh, by( tang_ha ) Two-sample Wilcoxon rank-sum (Mann-Whitney) test tang_ha | obs rank sum expected + ha bt | 552 185203 177192 ha tang | 89 20558 28569 + combined | 641 205761 205761 unadjusted variance 2628348.00 adjustment for ties -144.78 adjusted variance 2628203.22 Ho: tlsosinh(tang_ha==ha bt) = tlsosinh(tang_ha==ha tang) z = 4.941 Prob > |z| = 0.0000 7. Hãy so sánh trọng lượng sơ sinh của trẻ sinh ra từ con của các nhĩm nghề nghiệp khác nhau của người mẹ. Hướng dẫn: Để so sánh trung bình của một biến định lượng ở nhiều nhĩm, chúng ta phải sử dụng phương pháp phân tích ANOVA một chiều. Sử dụng menu Statistics :: ANOVA/MANOVA :: oneway analysis of variance
  15. Do chúng ta muốn phân tích tác động của yếu tố nghề nghiệp mẹ (nghenghiep) lên trọng lượng sinh của trẻ (tlsosinh) khi cửa sổ oneway hiện lên, ta tiến hành các bước sau: Bước 1: đặt con trỏ vào hộp văn bản Response variable Bước 2: đưa con trỏ vào cửa sổ Variables và nhấp vào biến tlsosinh để đưa biến này vào hộp văn bản Response Variable. Bước 3: đặt con trỏ vào hộp văn bản Factor Bước 4: đưa con trỏ vào cửa sổ Variables và nhấp vào biến nghenghiep để đưa biến này vào hộp văn bản Factor. Bước 5: Đánh dấu vào hộp kiểm Produce summary table để thể hiện thống kê mơ tả trọng lượng sơ sinh trung bình ở các nhĩm nghề nghiệp Bước 6: Đánh dấu vào hộp kiểm Scheffe để cĩ kiểm định so sánh trọng lượng trung bình ở từng cặp đơi nghề nghiệp khác nhau Bước 7: Nhấp vào nút lệnh OK
  16. Trên cửa sổ Output, trên cùng thống kê mơ tả của số liệu về trọng lượng sơ sinh theo nhĩm tuổi của mẹ: nghe nghiep | me - 1=tu | do, 2=cong | Summary of trong luong so sinh nhan, | (gram) 3=vien chuc | Mean Std. Dev. Freq. + tu do | 2981.4135 643.76283 104 cong nhan | 3118.084 646.69338 238 vien chuc | 3189.3177 654.19649 299 + Total | 3129.1373 652.78265 641 Con bà mẹ nghề nghiệp tự do cĩ trọng lượng trung bình là 2981 gram, của bà mẹ với nghề nghiệp là 3118 gram, của bà mẹ với nghề nghiệp viên chức là là 3190 gram. Chúng ta biết kiểm định ANOVA cĩ thể sử dụng để kiểm định sự khác biệt về trung bình của nhiều nhĩm, nhưng trước tiên chúng ta hãy kiểm tra các điều kiện của phân tích ANOVA là (a) biến số phụ thuộc cĩ phân phối bình thường - điều này đã được xác nhận từ đồ thị của trọng lượng sơ sinh và (b) phương sai của biến phụ thuộc ở các nhĩm bằng nhau - điều này cũng được xác nhận qua thống kê Bartlett với p-value là 0,973. Analysis of Variance Source SS df MS F Prob > F Between groups 3381483.56 2 1690741.78 4.00 0.0187 Within groups 269338638 638 422160.875 Total 272720122 640 426125.19 Bartlett's test for equal variances: chi2(2) = 0.0558 Prob>chi2 = 0.973 Vì vậy trong trường hợp này kiểm định ANOVA là cĩ giá trị. Ta đọc kết quả của bảng
  17. ANOVA. Chúng ta cĩ được giá trị F = 0.0187 và mức ý nghĩa (p-value) là 0.9723 chúng ta kết luận khơng cĩ sự khác biệt về trọng lượng sơ sinh ở con của những bà mẹ cĩ nghề nghiệp khác nhau. Với kết luận này chúng ta cĩ thể kết luận là cĩ ít nhất cĩ 1 cặp đơi (2 nhĩm) nghề nghiệp của mẹ cĩ sự khác biệt về trọng lượng con nhưng chúng ta khơng biết là sự khác biệt này ở cặp đơi nghề nghiệp nào. Để biết cặp đơi nào cĩ sự khác biệt ta xem kết xuất của so sánh sau kiểm định (post-hoc test) của Scheffe: Comparison of trong luong so sinh (gram) by nghe nghiep me - 1=tu do, 2=cong nhan, 3=vien chuc (Scheffe) Row Mean-| Col Mean | tu do cong nha + cong nha | 136.671 | 0.202 | vien chu | 207.904 71.2337 | 0.020 0.451 Kết quả của kiểm định Scheffe được trình bày theo bảng và ở mỗi ơ của bảng cĩ 2 con số: con số ở trên thể hiện sự khác biệt về trọng lượng của nghề nghiệp của hàng so với nghề nghiệp của cột và giá trị ở dưới thể hiện giá trịi p (mức ý nghĩa) của sự khác biệt này. Dựa vào giá trị p, cĩ thể kết luận cĩ sự khác biệt về trọng lượng sơ sinh của con 2 nhĩm nghề nghiệp viên chức và tự do (giá trị p=0,020) và nhĩm nghề nghiệp viên chức cĩ trọng lượng trung bình cao hơn nhĩm nghề nghiệp tự do là 207,9 gram. Nhắc lại lí thuyết về Tương quan và ước lượng Tương quan là số đo mức độ hai biến số định lượng cùng thay đổi với nhau. Cĩ nhiều loại hệ số tương quan, nhưng chúng đều cĩ giá trị từ -1 đến 1. Nếu chúng cĩ giá trị dương cĩ nghĩa là hai biến số đồng biến với nhau, nếu chúng cĩ giá trị âm nghĩa là hai biến số nghịch biến. Giá trị tuyệt đối của hệ số tương quan càng gần một nghĩa là hai biến số cĩ liên hệ chặt với nhau và vai trị của sai số ngẫu nhiên sẽ ít hơn. Nếu hệ số tương quan cĩ giá trị bằng zero cĩ nghĩa là hai biến số độc lập và khơng quan hệ gì với nhau. Khi trị tuyệt đối của hệ số tương quan bằng một cĩ nghĩa là hồn tồn khơng cĩ sai số ngẫu nhiên. Bình phương của hệ số tương quan (r2) thể hiện tỉ lệ các biến thiên của biến số phụ thuộc cĩ thể được giải thích bằng biến số độc lập. Loại hệ số tương quan được sử dụng phổ biến nhất là hệ số tương quan Pearson r: (x x)(y y) r  i i 2 2 (xi x) (yi y) Lí giải ý nghĩa của hệ số tương quan: - Hệ số tương quan luơn luơn nằm trong đoạn [-1,1] - Hệ số tương quan r dương chứng tỏ hai biến số là đồng biến; hệ số tương quan r âm chứng tỏ hai biến số là nghịch biến; hệ số tương quan bằng zero nếu hai biến khơng liên hệ. - Trị số tuyệt đối của hệ số tương quan r nĩi lên mức độ liên quan giữa hai biến số. Nếu trị tuyệt đối của r bằng 1 (r=1 hay r=-1), quan hệ hồn tồn tuyến tính nghĩa là tất cả các
  18. điểm nằm trên đường hồi quy (Hình 9.2 d và 9.2f). Nếu trị tuyệt đối của r nhỏ hơn 1 sẽ cĩ các điểm số liệu phân tán chung quanh đường hồi quy. - Bình phương của hệ số tương quan (r 2) thể hiện tỉ lệ biến thiên của biến số phụ thuộc được giải thích bằng sự biến thiên của biến số độc lập (nếu mối liên hệ này là nhân quả) - Nếu r=0, khơng cĩ mối liên hệ tuyến tính giữa hai biến số. Ðiều này cĩ nghĩa là (1) khơng cĩ mối liên hệ gì giữa hai biến số hoặc (2) mối liên hệ giữa hai biến số khơng phải là tuyến tính. - Theo quy ước, quan hệ với r từ 0,1 đến 0,3 là quan hệ yếu, từ 0,3 đến 0,5 quan hệ trung bình và trên 0,5 là quan hệ mạnh. Ðiều quan trọng là sự tương quan giữa hai biến số cho thấy sự liên hệ nhưng khơng nhất thiết cĩ nghĩa là cá quan hệ 'nhân quả'. Để kiểm định hệ số tương quan Pearson cĩ thực sự khác 0 hay khơng, kiểm định t cĩ thể được sử dụng n 2 t r 1 r 2 cĩ phân phối student với n-2 độ tự do. Hồi quy Hồi quy là một mơ hình tốn học mơ tả sự biến đổi của một biến số này theo những biến số khác. Một phương trình hồi quy cĩ thể cĩ dạng như sau: cân nặng (kg) = 6,85 + 0,18 x tháng tuổi (phương trình hồi quy tính cân nặng của trẻ từ 9 đến 40 tháng tuổi theo tháng tuổi) theo phương trình này người ta gọi: cân nặng: biến số phụ thuộc tháng tuổi: biến số độc lập 6,85: hệ số của hằng số (Constant), hay cịn gọi là điểm chặn (intercept) 0,18: hệ số (Coeficient) của biến số tháng tuổi hay cịn gọi là độ dốc (Slope) của đường hồi quy 9. Vẽ phân tán đồ (scattergram) giữa của biến số tuổi thai (tuoithai) và trọng lượng thai (tlsosinh). Hướng dẫn: sử dụng menu Graphics :: Overlaid twoway graph để hiện ra cửa sổ twoway – Twoway graphs
  19. Trên cửa sổ twoway – Twoway graphs, nhập tên biến số phụ thuộc vào hộp Y-axis variable và tên biến số độc lập vào hộp X-axis variable sau đĩ nhấp OK để xem biểu đồ phân tán. Cách làm cụ thể từng bước như sau: Bước 1: Trên hộp combo Type chọn Scatter Bước 2: Đặt tên biến số độc lập (tuoithai) vào ơ văn bản X Bước 3: Đặt tên biến số phụ thuộc (tlsosinh) vào ơ văn bản Y Bước 4: Nhấp nút lệnh OK Cĩ thể cho đồ thị phân tán. Tuy nhiên chúng ta cĩ thể thêm các tùy chọn để thực hiện các yêu cầu sau: Bổ sung tiêu đề “trọng lượng trẻ sơ sinh (gam)" cho trục tung Cho các giá trị trục y từ 500 đến 5000 gram và chia các khoảng 500 gram. Bổ sung tiêu đề “tuoi thai (tuan tuoi)" cho trục hồnh
  20. Cho các giá trị của trục x từ 24 tuần tuổi đến 42 tuần tuổi và chia làm các khoảng 4 tuần Bằng cách trong cửa sổ Trên cửa sổ twoway – Twoway graphs thực hiện các bước: Trên thẻ Plot 1: Bước 1: Trên hộp combo Type chọn Scatter Bước 2: Đặt tên biến số độc lập (tuoithai) vào ơ văn bản X Bước 3: Đặt tên biến số phụ thuộc (tlsosinh) vào ơ văn bản Y Trên thẻ Y-Axis: Bước 4: Trên hộp văn bản Title gõ "Trong luong tre so sinh (gam)" Bước 5: Trên hộp văn bản Rule gõ quy tắc "500(500)5000" Bước 6: Trên hộp combo Angle chọn "Horizontal" Trên thẻ X-Axis: Bước 7: Trên hộp văn bản Title gõ "Tuoi thai (tuan)" Bước 8: Trên hộp văn bản Rule gõ quy tắc "24(2)42" Và nhấp vào nút lệnh OK. Trả lời: Cĩ sự tương quan thuận tuyến tính giữa trọng lượng sơ sinh và tuổi thai. Mối tương quan này khá chặt do đám mây cĩ tính chất đi lên (khi nĩ đi về phải) và cĩ đường kính bé nhỏ hơn nhiều so với đường kính lớn. 10. Hãy xác định hệ số tương quan giữa trọng lượng sơ sinh (tlsosinh), tuổi thai (tuoithai) và tuổi của mẹ (tuoime) Hướng dẫn: Sử dụng menu Statistics :: Summaries, tables, & tests :: Summary statistics :: Pairwise correlations.
  21. Khi đĩ hộp thoại pwcorr – Pairwise correlations of variables sẽ hiện ra.
  22. Tiến hành các bước sau: Bước 1: Nhấp con trỏ chuột vào hộp văn bản Variables Bước 2: Đưa con trỏ chuột vào cửa sổ Variables và nhấp vào các biến tlsosinh, biến tuoithai và biến tuoime để tên 3 biến này xuất hiện ở hộp văn bản Variables. Bước 3: Đánh dấu vào hộp kiểm Print significance level for each entry Bước 4: Đánh dấu vào hộp kiểm Significance level for displaying with a star. Bước 5: Nhấp vào nút lệnh OK để xem kết quả. . pwcorr tlsosinh tuoithai tuoime, sig star(5) | tlsosinh tuoithai tuoime + tlsosinh | 1.0000 | | tuoithai | 0.7376* 1.0000 | 0.0000 | tuoime | 0.0337 0.0151 1.0000 | 0.3941 0.7026 Trả lời: Chương trình cho kết quả hệ số tương quan của trọng lượng thai với trọng lượng thai là 1, giữa trọng lượng thai và tuổi thai là 0.7376 (giá trị p=0,0000), giữa trọng lượng thai và tuổi của mẹ là 0,0337 (giá trị p = 0,3941). Như vậy cĩ sự tương quan mạnh cĩ ý nghĩa thống kê giữa trọng lượng thai và tuổi thai trong khi đĩ sự tương quan giữa trọng lượng thai và tuổi mẹ rất yếu và khơng cĩ ý nghĩa thống kê. Do cĩ sự liên hệ cĩ ý nghĩa thống kê (giá trị p <0,05) giữa trọng lượng thai và tuổi thai nên giá trị của hệ số tương quan được đánh dấu sao (*). 11. Hãy xây dựng phương trình hồi quy của trọng lượng thai theo tuổi thai. Hướng dẫn: Sử dụng phương pháp hồi quy đơn bằng cách nhấp vào menu "Statistics :: Linear regression and related :: Linear regression" để hiện ra hộp thoại regress – Linear regression
  23. Nhập tên biến số phụ thuộc vào hộp Dependent variable và tên biến số độc lập vào hộp Independent variable rồi nhấn OK để tiếp tục. Kết quả được trình bày như sau: . regress tlsosinh tuoithai Source | SS df MS Number of obs = 641 + F( 1, 639) = 762.25 Model | 148354317 1 148354317 Prob > F = 0.0000 Residual | 124365805 639 194625.673 R-squared = 0.5440 + Adj R-squared = 0.5433 Total | 272720122 640 426125.19 Root MSE = 441.16 tlsosinh | Coef. Std. Err. t P>|t| [95% Conf. Interval] + - tuoithai | 206.6412 7.484572 27.609 0.000 191.9439 221.3386 _cons | -4865.245 290.0814 -16.772 0.000 -5434.873 -4295.617 Trả lời: Hệ số tương quan bình phương R-squared = 0.544 = 54.4% nĩi lên tuổi thai cĩ thể giải thích cho 54.4% sự thay đổi về trọng lượng sơ sinh. Bảng ANOVA cho biết cĩ tổng các sai lệch của bình phương trọng lượng sơ sinh 272.720.122 (272.7 triệu) mà phương trình hồi quy cĩ thể giải thích cho 148.3 triệu của sự sai lệch này (như vậy cịn 124.4 triệu tổng bình phương sai lệch chưa được giải thích gọi là Residual Sum of
  24. Square và giá trị 0.45 chính là giá trị 148.3/272.7). Mức ý nghĩa được trình bày trong bảng ANOVA cho biết mức ý nghĩa của phương trình. Dựa vào bảng các hệ số chúng ta cĩ thể xây dựng phương trình hồi quy như sau: Trọng lượng sơ sinh = -4865.245 + 206.641 x tuổi thai (tính theo tuần). Mức ý nghĩa (P-value) của biến số tuổi thai (Gestational age) là kết quả của kiểm định ý nghĩa của biến số này trong phương trình cĩ thực sự khác khơng hay khơng. Hệ số (coefficient) của biến số độc lập nĩi lên sự thay đổi của biến số phụ thuộc khi biến số độc lập thay đổi một đơn vị. Trong phương trình này (với biến số độc lập là TUOITHAI và biến số phụ thuộc là TLSOSINH) chúng ta cĩ thể lí giải nếu đứa trẻ lớn hơn 1 tuần tuổi trọng lượng lúc sanh của nĩ sẽ tăng thêm 206.641 gram. 12. Hãy xây dựng phương trình hồi quy của trọng lượng thai theo tuổi thai, giới tính của trẻ và huyết áp cao của mẹ. Hướng dẫn: Sử dụng phương pháp hồi quy đơn bằng cách nhấp vào menu "Statistics :: Linear regression and related :: Linear regression" để hiện ra hộp thoại regress – Linear regression Nhập tên biến số phụ thuộc (tlsosinh) vào hộp Dpendent variable và tên các biến số độc lập (tuoithai gioi tang_ha) vào hộp Idependent variables, rồi nhấn OK để tiếp tục. Khi đĩ hộp thoại chẩn đốn sẽ hiện ra. Tuy nhiên nếu chúng ta khơng quan tâm đến việc chẩn đốn các vấn đề trong phương trình hồi quy chúng ta hãy nhấp vào nút Cancel. . regress tlsosinh tuoithai gioi tang_ha Source | SS df MS Number of obs = 641 + F( 3, 637) = 275.43
  25. Model | 153998584 3 51332861.4 Prob > F = 0.0000 Residual | 118721538 637 186376.04 R-squared = 0.5647 + Adj R-squared = 0.5626 Total | 272720122 640 426125.19 Root MSE = 431.71 tlsosinh | Coef. Std. Err. t P>|t| [95% Conf. Interval] + tuoithai | 201.4248 7.541441 26.71 0.000 186.6157 216.2339 gioi | 167.8167 34.17884 4.91 0.000 100.6999 234.9335 tang_ha | -142.14 50.8685 -2.79 0.005 -242.0302 - 42.24979 _cons | -4729.048 294.1447 -16.08 0.000 -5306.659 - 4151.438 Trả lời: Chúng ta tìm được r 2 (R-squared) là 0.5647 cho thấy phương trình hồi quy giải thích được 56.47% sự biến thiên của trọng lượng thai và điều này cho thấy mơ hình cĩ cả giới tính và tăng huyết áp giải thích tốt hơn so với mơ hình chỉ cĩ tuổi thai (r2=0.54). Chúng ta cũng cĩ thể viết được phương trình hồi quy theo kết quả ở trên: Trọng lượng thai = -4729.048 + tuổi thai x 201.425 - tăng huyết áp x 142.14 + giới x 167.817 10. Bạn cĩ gợi ý gì để trình bày phương trình hồi quy một cách dễ hiểu hơn đối với người khơng chuyên về thống kê. Hướng dẫn: Bởi vì người khơng chuyên về thống kê hay người chưa được làm quen với phương pháp mã hố sẽ khơng biết làm sao để nhân tăng huyết áp với 142.14 hay giới với 167,817. Chúng ta nhớ lại quy ước của tập tin này: Biến tăng huyết áp (tang_ha) cĩ giá trị =0 nếu mẹ khơng bị tăng huyết áp Biến giới tính (gioi) cĩ giá trị =0 nếu trẻ là trẻ gái a) Do đĩ phương trình hồi quy đối với trẻ gái cĩ mẹ khơng tăng huyết áp là: Trọng lượng thai = -4729.048 + tuổi thai x 201.425 (a) b) Ở trẻ trai với mẹ khơng tăng huyết áp, trọng biến số phụ thuộc của phương trình hồi quy sẽ tăng lên 167,817 gram nên phương trình hồi quy sẽ là Trọng lượng thai = -4561.23 + tuổi thai x 201.425 (b) c) Ở trẻ gái với mẹ bị tăng huyết áp, trọng biến số phụ thuộc của phương trình hồi quy sẽ sẽ giảm đi 142,14 gram so với phương trình (a) nên phương trình hồi quy cho nhĩm này là Trọng lượng thai = -4871.19 + tuổi thai x 201.425 d) Ở trẻ trai với mẹ bị tăng huyết áp, trọng biến số phụ thuộc của phương trình hồi quy sẽ sẽ giảm đi 142,14 gram so với phương trình (b) nên phương trình hồi quy cho nhĩm này là
  26. Trọng lượng thai = -4703.37 + tuổi thai x 201.425 Do các mức ý nghĩa (p-value) của biến số đều nhỏ hơn 0.05 nên tất cả các biến số độc lập của mơ hình đều cĩ ý nghĩa thống kê và khơng nên loại bỏ khỏi mơ hình. 13. Xét hai mơ hình trọng lượng thai = tuổi thai + tăng huyết áp mẹ + giới tính (cho hệ số của biến số tuổi t hai là 201.4) trong khi đĩ mơ hình trọng lượng thai = tuổi thai (chohệ số của biến số tuổi thai là 206.6). Hệ số trong mơ hình nào là phù hợp hơn để đánh giá sự tăng trưởng của trọng lượng thai. Trả lời: Chúng ta cĩ thể giả định yếu tố tăng huyết áp của mẹ là yếu tố gây nhiễu. Do tăng huyết áp của mẹ cĩ thể làm giảm trọng lượng của con và trong tăng huyết áp của mẹ phổ biến hơn ở nhĩm sanh thiếu tháng nên ở đứa trẻ sinh sớm 1 tuần bị mất trọng lượng là 206.6 gram nhưng điều này là cả do tác động của sanh non và cả tác động do tăng huyết áp ở một số bà mẹ. Tuy nhiên ở nhĩm khơng bị tăng huyết áp trẻ sanh non một tuần chỉ bị mất cĩ 201.4 gram và do đĩ con số 201.4 là phù hợp hơn để đánh giá sự tăng trưởng của trọng lượng thai. Trên thực tiễn do con số 201.4 rất gần với con số 206.6 nên cĩ thể bỏ qua tác động gây nhiễu của tăng huyết áp của mẹ lên tốc độ phát triển thai. 14. Sử dụng kiểm định t chúng ta phát hiện trọng lượng trẻ con các bà mẹ bị tăng huyết áp thấp hơn con những người khơng tăng huyết áp là 449.37 gram. Trong khi mơ hình của trọng lượng sinh theo tuổi thai, tăng huyết áp mẹ và giới tính cho hệ số của biến tăng huyết áp là 142.14 gram. Hãy lí giải những số liệu này? Trả lời: Cả hai con số 449.37 và 142.14 đều nĩi lên sự khác biệt do tình trạng tăng huyết áp của mẹ nhưng con số 449.37 là con số khác biệt thơ và con số 142.14 là con số khác biệt cĩ hiệu chỉnh theo tháng tuổi và giới tính. Dựa vào nhận xét trên ta cĩ giải thích những con số này như sau: con các bà mẹ bị tăng huyết áp cĩ trọng lượng nhẹ con những người khơng tăng huyết áp là 449.37 gram và điều này do tác động của cả tăng huyết áp, tuổi thai (và cả tác động của giới tính nhưng giả sử chúng ta biết rằng tác động gây nhiễu cao giới tính là khơng đáng kể). con các bà mẹ bị tăng huyết áp cĩ trọng lượng nhẹ con những người khơng tăng huyết áp là 142.14 gram và điều này do tác động của cả tăng huyết áp khi khơng xét đến tác động của tuổi thai. Như vậy tác động do sinh thiếu tháng là 449.37-142.14 = 307.23 g Cơ chế 142.14g khác Cao huyết Trọng 449.37g áp mẹ lượng con Sinh thiếu tháng Như vậy % tác động do cơ chế sinh thiếu tháng trong tổng số tác động của tăng huyết áp mẹ lên trọng lượng của con là:
  27. tác động thô - tác động hiệu chỉnh 449.37 142.14 307.22 0.68 68% tác động thô 449.37 449.37 Chúng ta cĩ thể xem xét tác động của cơ chế sinh thiếu tháng trong khi so sánh trọng lượng sơ sinh của 2 nhĩm mẹ tăng huyết áp và mẹ khơng tăng huyết áp bằng cách so sánh tuổi thai trung bình giữa 2 nhĩm. Nhĩm cĩ mẹ bị tăng huyết áp cĩ tuổi thai trung bình là 37.3 tuần trong khi đĩ nhĩm mẹ khơng bị tăng huyết áp cĩ tuổi thai trung bình là 38.9 và sự khác biệt về tuổi thai là 1.6 tuần. Sự khác biệt về tuổi thai sẽ giải thích cho khoảng 200 gram/tuần x 1.6 =320 gram trọng lượng sơ sinh.