1. Trang chủ >
  2. Giáo Dục - Đào Tạo >
  3. Cao đẳng - Đại học >

Mô tả số liệu với Stata 8.0 for Windows

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.93 MB, 167 trang )


Log nằm vị trí thứ tư từ trái ở trên thanh công cụ

để bắt đầu log kết quả (begin log). Máy

tính sẽ hiện ra hộp thoại Begin Logging Stata Output để chúng ta chọn tên tập tin (File name)

và thư mục lưu (Save In) của tập tin log.



Thí dụ chúng ta muốn lưu tập tin log với tên là ivf_v.smcl vào thư mục c:\data; chúng ta nhập

vào các thông tin như trên.

2. Khảo sát các biến số của tập tin và nghiên cứu mục tiêu nghiên cứu để phân loại biến số

Hướng dẫn: Để xem liệt kê các biến số chúng ta có thể nhấn phím chức năng F3 hay sử dụng

menu (nhấp vào menu Data :: Describe data :: Describe variable in memory) để xem các biến

số của số liệu



Chúng ta có thể xem danh sách các biến số liệt kê ở sau:

110



. describe

Contains data from C:\DATA\ivf_v.dta

obs:

641

vars:

size:



7

20,512 (99.8% of memory free)



15 Aug 2006 15:27



------------------------------------------------------------------------------storage display

value

variable name

type

format

label

variable label

------------------------------------------------------------------------------maso

tuoime



float

float



tangha



float



%9.0g

%9.0g

%9.0g



ma so

tuoi me (nam)

tang huyet ap thai ki - 1=tang

ha, 0=khong tang ha



tuoithai

gioi



float

float



%9.0g

%9.0g



tuoi thai (tuan)

gioi tinh tre - 1=trai, 0=gai



tlsosinh

nghenghiep



float

float



%9.0g

%9.0g



trong luong so sinh (gram)

nghe nghiep me - 1=tu do,



2=cong nhan, 3=vien chuc

------------------------------------------------------------------------------Sorted by:



maso



Giả sử từ đề cương nghiên cứu chúng ta biết đây là tập tin của số liệu 641 đứa trẻ được sinh từ

bà mẹ thụ thai trong ống nghiệm (in-vitro fertilisation) với mục tiêu nghiên cứu là xem tuổi thai

và tăng huyết áp trong thai kì có ảnh hưởng lên trọng lượng thai hay không. Cách lí giải số liệu

được minh họa

STT Tên biến



Ý nghĩa của biến



Phân loại biến số:

(Độc lập hay Phụ thuộc) –

(Định tính hay định lượng)



1



Maso



Mã số



2



Tuoime



Tuổi của mẹ (năm tuổi)



3



Tangha



Tăng huyết áp thai kì 1= có

0= không



4



Tuoithai



Tuổi thai (tính theo tuần)



5



Gioi



Giới tính của trẻ 1=trai 0=gái



6



Tlsosinh



Trọng lượng sinh tính theo

grams



7



Nghenghiep Nghề nghiệp của mẹ 1=tự do

2=công nhân 3=viên chức



3. Làm thế nào để xem số liệu

Hướng dẫn: Có thể xem số liệu bằng 2 cách:

- Dùng nút lệnh Data Browser

(vị trí 11 tính từ bên trái của thanh công cụ)

- Dùng menu Data :: Data browser (read-only editor)



111



Sử dụng Data Browser cho phép nhìn số liệu trong lưới (như các ô của chương trình Excel)

nhưng nó không cho phép in số liệu. Muốn nhìn số liệu ra của sổ kết xuất (output) để sau đó in

ra hãy sử dụng menu Data:: Describe Data :: List data.

4. Hãy thực hiện thống kê mô tả tất cả các biến số trong bộ số liệu này:

Hướng dẫn: trước tiên chúng ta phải xác định biến số nào là biến số định lượng và biến số nào là

biến số định tính. Sau đó thực hiện thống kê mô tả cho các biến số: đối với biến định lượng, thực

hiện lệnh summarize để để có trung bình và độ lệch chuẩn, đối với biến định tính thực hiện lệnh

tab1 để có bảng phân phối tần suất của các biến số.

Trong bộ số liệu này có các biến tuoime, tuoithai, tlsosinh là biến định lượng. Để mô tả

biến số này chúng ta sử dụng menu Statistics :: Summaries, tables, & tests :: Summary

Statistics.



Sau khi hộp thoại Summarize hiện ra, thực hiện các bước sau:

Bước 1: Đặt con trỏ vào hộp văn bản Variables

Bước 2: Di chuyển con trỏ vào cửa sổ Variables, và nhấp vào các biến cần mô tả thống kê

(tuoime, tuoithai, tlsosinh) để tên các biến này xuất hiện trên hộp văn bản Variables

Bước 3: Nhấp vào nút lệnh OK



112



Kết quả được trình bày nhưu sau:

. summarize tuoime tuoithai tlsosinh

Variable |

Obs

Mean

Std. Dev.

Min

Max

-------------+-------------------------------------------------------tuoime |

641

33.97192

3.87046

23

43

tuoithai |

641

38.68725

2.329931

24.69

42.35

tlsosinh |

641

3129.137

652.7827

630

4650



Các biến số định tính bao gồm tang_ha (tăng huyết áp), gioi (giới tính của trẻ), nghenghiep

(nghề nghiệp của mẹ). Để tóm tắt các biến số định tính này (tang_ha, gioi, nghenghiep) chúng ta

sử dụng menu Statistics :: Summaries, tables & test :: Tables :: Multiple one-way tables.



113



Các bước thực hiện gồm:

- Bước 1: đưa con trỏ vào hộp văn bản categorical variable(s)

- Bước 2: đưa con trỏ vào cửa sổ Variables và nhấp vào các biến tang_ha, gioi, nghenghiep để

đưa các tên biến này vào hộp văn bản Categorical variables(s)

- Bước 3: nhấp nút lệnh OK để hoàn tất

. tab1 tang_ha gioi nghenghiep

-> tabulation of tang_ha

tang huyet |

ap thai ki |

- 1=tang |

ha, 0=khong |

tang ha |

Freq.

Percent

Cum.

------------+----------------------------------0 |

552

86.12

86.12

1 |

89

13.88

100.00

------------+----------------------------------Total |

641

100.00

-> tabulation of gioi

gioi tinh |

tre - |

1=trai, |

0=gai |

Freq.

Percent

Cum.

------------+----------------------------------0 |

315

49.14

49.14

1 |

326

50.86

100.00

------------+----------------------------------Total |

641

100.00

-> tabulation of nghenghiep



114



nghe nghiep |

me - 1=tu |

do, 2=cong |

nhan, |

3=vien chuc |

Freq.

Percent

Cum.

------------+----------------------------------1 |

104

16.22

16.22

2 |

238

37.13

53.35

3 |

299

46.65

100.00

------------+----------------------------------Total |

641

100.00



5. Các tóm tắt số liệu như trên là đạt yêu cầu. Tuy nhiên việc mã hoá các giá trị của biến số

khiến cho việc đọc bảng bảng tần suất của biến số danh định (như gioi và nghenghiep) bị khó

khăn (nhất là cho những người không trực tiếp làm thống kê hay phải đọc lại kết quả sau một

khoảng thời gian dài). Do đó những người làm thống kê chuyên nghiệp luôn luôn thực hiện ghi

chú (dán nhãn) cho các biến số định tính. Hãy thực hiện việc dán nhãn số liệu.

Hướng dẫn:

Việc dán nhãn cho các giá trị mã hóa là việc làm tốn công nhưng nó giúp phân biệt người làm

thống kê chuyên nghiệp và người làm thống kê không chuyên nghiệp. Mặc dù tốn công nhưng

lợi ích do nó đem lại vượt qua công sức bỏ ra vì vậy chúng ta cần phải thực hiện việc dán nhãn

này.

Việc dán nhãn giá trị biến số được thực hiện qua 2 bước: tạo nhãn (define label value) và dán

nhãn cho giá trị (Assign value label to variable).

- Tạo nhãn sex, tang_ha, nhãn nghenghiep

Để tạo nhãn sử dụng menu Data :: Labels & Notes :: Define value label. Cửa sổ Define value

label sẽ được hiện ra.



Giả sử chúng ta muốn tạo nhãn sex theo quy tắc 1 =nam và 2=nữ, các bước cụ thể như sau:

-Bước 1: nhấp vào nút lệnh Define để hiện ra hộp nhập liệu Define new lable

115



- Bước 2: gõ sex vào hộp văn bản Label name

- Bước 3: nhấp vào nút lệnh OK khi đó hộp nhập liệu Add value sẽ hiện ra

- Bước 4: Nhập 1 vào hộp văn bản value

- Bước 5: nhập nam vào hộp văn bản Text

- Bước 6: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add Value

biến mất

- Bước 7: Nhấp vào nhãn sex trong hộp văn bản Defien label names

- Bước 8: Nhấp vào nút lệnh Add để hộp nhập liệu Add value sẽ hiện ra

- Bước 9: Nhập 0 vào hộp văn bản value

- Bước 10: nhập nữ vào hộp văn bản Text

- Bước 11: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add

Value biến mất



Sau đó có thể nhấp vào nút lệnh Close (của hộp thoại Define value labels) để thoát ra hay nhấp

vào nút lệnh Define (của hộp thoại Define value labels) để tiếp tục tạo nhãn tang_ha.



Các bước cụ thể để tạo nhãn tang_ha gồm:

-Bước 1: nhấp vào nút lệnh Define để hiện ra hộp nhập liệu Define new lable

- Bước 2: gõ tang_ha vào hộp văn bản Label name

- Bước 3: nhấp vào nút lệnh OK khi đó hộp nhập liệu Add value sẽ hiện ra

116



Cần lưu ý: tên nhãn có thể khác với tên biến (thí du như trường hợp trên ta đặt tên nhãn là sex

trong khi tên biến là giới) hoặc tên nhãn có thể trùng với tên biến (thí dụ ta có thể đặt tên nhãn là

tang_ha cho biến tăng ha).



- Bước 4: Nhập 1 vào hộp văn bản value

- Bước 5: nhập huyet ap tang vào hộp văn bản Text

- Bước 6: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add Value

biến mất

- Bước 7: Nhấp vào nhãn tang_ha trong hộp văn bản Define label names



- Bước 8: Nhấp vào nút lệnh Add để hộp nhập liệu Add value sẽ hiện ra

117



- Bước 9: Nhập 0 vào hộp văn bản value

- Bước 10: nhập huyet ap bt vào hộp văn bản Text

- Bước 11: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add

Value biến mất

Để tiếp tục tạo nhãn nghenghiep ta nhấp vào nút lệnh Define (của hộp thoại Define value

labels).



-Bước 1: nhấp vào nút lệnh Define để hiện ra hộp nhập liệu Define new lable

- Bước 2: gõ nghenghiep vào hộp văn bản Label name

- Bước 3: nhấp vào nút lệnh OK khi đó hộp nhập liệu Add value sẽ hiện ra



- Bước 4: Nhập 1 vào hộp văn bản value

118



- Bước 5: nhập tu do vào hộp văn bản Text

- Bước 6: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add Value

biến mất



- Bước 7: Nhấp vào nhãn nghenghiep trong hộp văn bản Define label names

- Bước 8: Nhấp vào nút lệnh Add để hộp nhập liệu Add value sẽ hiện ra

- Bước 9: Nhập 2 vào hộp văn bản value

- Bước 10: nhập cong nhan vào hộp văn bản Text

- Bước 11: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add

Value biến mất



119



- Bước 12: Ở hộp Define label names vẫn tiếp tục chọn nhãn nghenghiep, nhấp vào nút lệnh

Add để hộp nhập liệu Add value sẽ hiện ra

- Bước 13: Nhập 3 vào hộp văn bản value

- Bước 14: nhập vien chuc vào hộp văn bản Text

- Bước 15: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add

Value biến mất. Ta có kết quả như sau:



- Bước 16: Để hoàn tất việc tạo nhãn ta nhấn vào nút lệnh Close

Dán nhãn giá trị (Assign value label) cho các biến gioi, tang_ha, và nghenghiep

Sau khi dã tạo được nhãn, chúng ta hãy dán nhãn giá trị cho biến số bằng cách dùng menu

Data :: Labels & Notes :: Assign value label to variable

120



Xem Thêm
Tải bản đầy đủ (.doc) (167 trang)

×