Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.93 MB, 167 trang )
Log nằm vị trí thứ tư từ trái ở trên thanh công cụ
để bắt đầu log kết quả (begin log). Máy
tính sẽ hiện ra hộp thoại Begin Logging Stata Output để chúng ta chọn tên tập tin (File name)
và thư mục lưu (Save In) của tập tin log.
Thí dụ chúng ta muốn lưu tập tin log với tên là ivf_v.smcl vào thư mục c:\data; chúng ta nhập
vào các thông tin như trên.
2. Khảo sát các biến số của tập tin và nghiên cứu mục tiêu nghiên cứu để phân loại biến số
Hướng dẫn: Để xem liệt kê các biến số chúng ta có thể nhấn phím chức năng F3 hay sử dụng
menu (nhấp vào menu Data :: Describe data :: Describe variable in memory) để xem các biến
số của số liệu
Chúng ta có thể xem danh sách các biến số liệt kê ở sau:
110
. describe
Contains data from C:\DATA\ivf_v.dta
obs:
641
vars:
size:
7
20,512 (99.8% of memory free)
15 Aug 2006 15:27
------------------------------------------------------------------------------storage display
value
variable name
type
format
label
variable label
------------------------------------------------------------------------------maso
tuoime
float
float
tangha
float
%9.0g
%9.0g
%9.0g
ma so
tuoi me (nam)
tang huyet ap thai ki - 1=tang
ha, 0=khong tang ha
tuoithai
gioi
float
float
%9.0g
%9.0g
tuoi thai (tuan)
gioi tinh tre - 1=trai, 0=gai
tlsosinh
nghenghiep
float
float
%9.0g
%9.0g
trong luong so sinh (gram)
nghe nghiep me - 1=tu do,
2=cong nhan, 3=vien chuc
------------------------------------------------------------------------------Sorted by:
maso
Giả sử từ đề cương nghiên cứu chúng ta biết đây là tập tin của số liệu 641 đứa trẻ được sinh từ
bà mẹ thụ thai trong ống nghiệm (in-vitro fertilisation) với mục tiêu nghiên cứu là xem tuổi thai
và tăng huyết áp trong thai kì có ảnh hưởng lên trọng lượng thai hay không. Cách lí giải số liệu
được minh họa
STT Tên biến
Ý nghĩa của biến
Phân loại biến số:
(Độc lập hay Phụ thuộc) –
(Định tính hay định lượng)
1
Maso
Mã số
2
Tuoime
Tuổi của mẹ (năm tuổi)
3
Tangha
Tăng huyết áp thai kì 1= có
0= không
4
Tuoithai
Tuổi thai (tính theo tuần)
5
Gioi
Giới tính của trẻ 1=trai 0=gái
6
Tlsosinh
Trọng lượng sinh tính theo
grams
7
Nghenghiep Nghề nghiệp của mẹ 1=tự do
2=công nhân 3=viên chức
3. Làm thế nào để xem số liệu
Hướng dẫn: Có thể xem số liệu bằng 2 cách:
- Dùng nút lệnh Data Browser
(vị trí 11 tính từ bên trái của thanh công cụ)
- Dùng menu Data :: Data browser (read-only editor)
111
Sử dụng Data Browser cho phép nhìn số liệu trong lưới (như các ô của chương trình Excel)
nhưng nó không cho phép in số liệu. Muốn nhìn số liệu ra của sổ kết xuất (output) để sau đó in
ra hãy sử dụng menu Data:: Describe Data :: List data.
4. Hãy thực hiện thống kê mô tả tất cả các biến số trong bộ số liệu này:
Hướng dẫn: trước tiên chúng ta phải xác định biến số nào là biến số định lượng và biến số nào là
biến số định tính. Sau đó thực hiện thống kê mô tả cho các biến số: đối với biến định lượng, thực
hiện lệnh summarize để để có trung bình và độ lệch chuẩn, đối với biến định tính thực hiện lệnh
tab1 để có bảng phân phối tần suất của các biến số.
Trong bộ số liệu này có các biến tuoime, tuoithai, tlsosinh là biến định lượng. Để mô tả
biến số này chúng ta sử dụng menu Statistics :: Summaries, tables, & tests :: Summary
Statistics.
Sau khi hộp thoại Summarize hiện ra, thực hiện các bước sau:
Bước 1: Đặt con trỏ vào hộp văn bản Variables
Bước 2: Di chuyển con trỏ vào cửa sổ Variables, và nhấp vào các biến cần mô tả thống kê
(tuoime, tuoithai, tlsosinh) để tên các biến này xuất hiện trên hộp văn bản Variables
Bước 3: Nhấp vào nút lệnh OK
112
Kết quả được trình bày nhưu sau:
. summarize tuoime tuoithai tlsosinh
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------tuoime |
641
33.97192
3.87046
23
43
tuoithai |
641
38.68725
2.329931
24.69
42.35
tlsosinh |
641
3129.137
652.7827
630
4650
Các biến số định tính bao gồm tang_ha (tăng huyết áp), gioi (giới tính của trẻ), nghenghiep
(nghề nghiệp của mẹ). Để tóm tắt các biến số định tính này (tang_ha, gioi, nghenghiep) chúng ta
sử dụng menu Statistics :: Summaries, tables & test :: Tables :: Multiple one-way tables.
113
Các bước thực hiện gồm:
- Bước 1: đưa con trỏ vào hộp văn bản categorical variable(s)
- Bước 2: đưa con trỏ vào cửa sổ Variables và nhấp vào các biến tang_ha, gioi, nghenghiep để
đưa các tên biến này vào hộp văn bản Categorical variables(s)
- Bước 3: nhấp nút lệnh OK để hoàn tất
. tab1 tang_ha gioi nghenghiep
-> tabulation of tang_ha
tang huyet |
ap thai ki |
- 1=tang |
ha, 0=khong |
tang ha |
Freq.
Percent
Cum.
------------+----------------------------------0 |
552
86.12
86.12
1 |
89
13.88
100.00
------------+----------------------------------Total |
641
100.00
-> tabulation of gioi
gioi tinh |
tre - |
1=trai, |
0=gai |
Freq.
Percent
Cum.
------------+----------------------------------0 |
315
49.14
49.14
1 |
326
50.86
100.00
------------+----------------------------------Total |
641
100.00
-> tabulation of nghenghiep
114
nghe nghiep |
me - 1=tu |
do, 2=cong |
nhan, |
3=vien chuc |
Freq.
Percent
Cum.
------------+----------------------------------1 |
104
16.22
16.22
2 |
238
37.13
53.35
3 |
299
46.65
100.00
------------+----------------------------------Total |
641
100.00
5. Các tóm tắt số liệu như trên là đạt yêu cầu. Tuy nhiên việc mã hoá các giá trị của biến số
khiến cho việc đọc bảng bảng tần suất của biến số danh định (như gioi và nghenghiep) bị khó
khăn (nhất là cho những người không trực tiếp làm thống kê hay phải đọc lại kết quả sau một
khoảng thời gian dài). Do đó những người làm thống kê chuyên nghiệp luôn luôn thực hiện ghi
chú (dán nhãn) cho các biến số định tính. Hãy thực hiện việc dán nhãn số liệu.
Hướng dẫn:
Việc dán nhãn cho các giá trị mã hóa là việc làm tốn công nhưng nó giúp phân biệt người làm
thống kê chuyên nghiệp và người làm thống kê không chuyên nghiệp. Mặc dù tốn công nhưng
lợi ích do nó đem lại vượt qua công sức bỏ ra vì vậy chúng ta cần phải thực hiện việc dán nhãn
này.
Việc dán nhãn giá trị biến số được thực hiện qua 2 bước: tạo nhãn (define label value) và dán
nhãn cho giá trị (Assign value label to variable).
- Tạo nhãn sex, tang_ha, nhãn nghenghiep
Để tạo nhãn sử dụng menu Data :: Labels & Notes :: Define value label. Cửa sổ Define value
label sẽ được hiện ra.
Giả sử chúng ta muốn tạo nhãn sex theo quy tắc 1 =nam và 2=nữ, các bước cụ thể như sau:
-Bước 1: nhấp vào nút lệnh Define để hiện ra hộp nhập liệu Define new lable
115
- Bước 2: gõ sex vào hộp văn bản Label name
- Bước 3: nhấp vào nút lệnh OK khi đó hộp nhập liệu Add value sẽ hiện ra
- Bước 4: Nhập 1 vào hộp văn bản value
- Bước 5: nhập nam vào hộp văn bản Text
- Bước 6: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add Value
biến mất
- Bước 7: Nhấp vào nhãn sex trong hộp văn bản Defien label names
- Bước 8: Nhấp vào nút lệnh Add để hộp nhập liệu Add value sẽ hiện ra
- Bước 9: Nhập 0 vào hộp văn bản value
- Bước 10: nhập nữ vào hộp văn bản Text
- Bước 11: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add
Value biến mất
Sau đó có thể nhấp vào nút lệnh Close (của hộp thoại Define value labels) để thoát ra hay nhấp
vào nút lệnh Define (của hộp thoại Define value labels) để tiếp tục tạo nhãn tang_ha.
Các bước cụ thể để tạo nhãn tang_ha gồm:
-Bước 1: nhấp vào nút lệnh Define để hiện ra hộp nhập liệu Define new lable
- Bước 2: gõ tang_ha vào hộp văn bản Label name
- Bước 3: nhấp vào nút lệnh OK khi đó hộp nhập liệu Add value sẽ hiện ra
116
Cần lưu ý: tên nhãn có thể khác với tên biến (thí du như trường hợp trên ta đặt tên nhãn là sex
trong khi tên biến là giới) hoặc tên nhãn có thể trùng với tên biến (thí dụ ta có thể đặt tên nhãn là
tang_ha cho biến tăng ha).
- Bước 4: Nhập 1 vào hộp văn bản value
- Bước 5: nhập huyet ap tang vào hộp văn bản Text
- Bước 6: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add Value
biến mất
- Bước 7: Nhấp vào nhãn tang_ha trong hộp văn bản Define label names
- Bước 8: Nhấp vào nút lệnh Add để hộp nhập liệu Add value sẽ hiện ra
117
- Bước 9: Nhập 0 vào hộp văn bản value
- Bước 10: nhập huyet ap bt vào hộp văn bản Text
- Bước 11: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add
Value biến mất
Để tiếp tục tạo nhãn nghenghiep ta nhấp vào nút lệnh Define (của hộp thoại Define value
labels).
-Bước 1: nhấp vào nút lệnh Define để hiện ra hộp nhập liệu Define new lable
- Bước 2: gõ nghenghiep vào hộp văn bản Label name
- Bước 3: nhấp vào nút lệnh OK khi đó hộp nhập liệu Add value sẽ hiện ra
- Bước 4: Nhập 1 vào hộp văn bản value
118
- Bước 5: nhập tu do vào hộp văn bản Text
- Bước 6: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add Value
biến mất
- Bước 7: Nhấp vào nhãn nghenghiep trong hộp văn bản Define label names
- Bước 8: Nhấp vào nút lệnh Add để hộp nhập liệu Add value sẽ hiện ra
- Bước 9: Nhập 2 vào hộp văn bản value
- Bước 10: nhập cong nhan vào hộp văn bản Text
- Bước 11: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add
Value biến mất
119
- Bước 12: Ở hộp Define label names vẫn tiếp tục chọn nhãn nghenghiep, nhấp vào nút lệnh
Add để hộp nhập liệu Add value sẽ hiện ra
- Bước 13: Nhập 3 vào hộp văn bản value
- Bước 14: nhập vien chuc vào hộp văn bản Text
- Bước 15: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add
Value biến mất. Ta có kết quả như sau:
- Bước 16: Để hoàn tất việc tạo nhãn ta nhấn vào nút lệnh Close
Dán nhãn giá trị (Assign value label) cho các biến gioi, tang_ha, và nghenghiep
Sau khi dã tạo được nhãn, chúng ta hãy dán nhãn giá trị cho biến số bằng cách dùng menu
Data :: Labels & Notes :: Assign value label to variable
120