Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (538.43 KB, 72 trang )
58
Trong một cuộc điều tra, các kết quả trả lời cho dạng câu hỏi mở (ví dụ: tại sao bạn lại
hút thuốc) có thể đợc phân loại từ trớc theo một phạm vi nào đó, phụ thuộc vào một số khả
năng trả lời. Tuy nhiên, chúng ta luôn luôn phải có một số các dạng trả lời khác nh "loại
khác, xin chỉ rõ...", dạng trả lời này chỉ có thể đợc phân loại sau khi đã điều tra. Các dạng
trả lời này cần đợc liệt kê vào một bảng các dạng trả lời khác nhau. Một số câu trả lời không
thể đa vào một dạng nhất định nào đó thì ta có thể đa vào một dạng trả lời riêng biệt "khác".
Tuy nhiên dạng này không nên vuợt quá 5% số câu trả lời thu đợc.
Đối với các biến dạng số, số liệu thờng đợc thu thập mà không cần bất cứ một sự phân
loại nào trớc. Bởi vì chúng ta sẽ luôn luôn tìm thấy đợc khoảng và sự phân tán của các giá
trị khác nhau của biến dạng số khi chúng ta thu thập số liệu (ví dụ: khoảng cách từ nhà đến
trạm y tế), việc phân loại các biến dạng số luôn luôn đợc thực hiện sau khi chúng ta đã thu
thập số liệu.
3.2. Mã hóa số liệu
Khi xử lý và phân tích số liệu, một việc làm mang lại rất nhiều thuận lợi đó là việc mã
hóa các số liệu thu đợc.Việc làm này càng mang lại hiệu quả cao hơn nếu chúng ta xử lý và
phân tích số liệu trên máy tính.
Mã hóa số liệu là một phơng pháp dùng để chuyển đổi số liệu thu đợc từ cuộc điều tra
sang một dạng ký hiệu phù hợp cho việc phân tích
Đối với việc phân tích số liệu trên máy tính, mỗi một loại của một biến thờng đợc gán
cho một con số, ví dụ: câu trả lời là "có" có thể mã là 1, "không" mã là 2, "không trả lời" là
9.
Các mã cần đợc đa vào phiếu điều tra (hoặc bảng kiểm). Khi chúng ta hoàn thành mã
hóa cho phiếu điều tra, đối với mỗi câu hỏi, nên chèn các ô trống vào phía bên phải của
trang. Các ô này sẽ không dành cho ngời đi phỏng vấn. Chúng chỉ đợc điền vào sau đó
trong quá trình xử lý số liệu. Nhớ rằng cần có đủ các ô trống cho số lợng các chữ số.
Chú ý:
Nếu bạn có ý định xử lý số liệu bằng máy tính, bạn phải tham vấn những ngời có kinh
nghiệm trớc khi hoàn tất bộ câu hỏi.
Đồng thời, nếu việc xử lý số liệu đợc tiến hành bằng tay với bảng tổng hợp số liệu, thì
việc mã hóa số liệu cũng là rất cần thiết.
Các qui ớc mã hóa:
Các câu trả lời giống nhau cần thiết phải có cùng một mã số, việc làm này sẽ làm giảm
thiểu các sai sót khi mã hóa.
Ví dụ:
Có (hoặc dơng tính)
Không (âm tính)
Không biết
mã là 1
mã là 2
mã là 9
59
Mã đối với các câu hỏi mở
Việc mã hóa đối với các câu hỏi mở chỉ có thể thực hiện đợc sau khi chúng ta đã có đủ số
liệu điều tra. Các câu hỏi trả lời có số lợng trùng lặp lớn cần đợc mã hóa. Các câu hỏi này
cũng có thể đợc mã hóa theo kiểu các câu hỏi gần giống nhau sẽ đợc đa vào cùng một loại,
do đó nó sẽ giới hạn đợc số lợng các loại. Nếu có quá nhiều loại khác nhau thì rất khó khăn
khi tiến hành phân tích các số liệu đó có ý nghĩa.
Cuối cùng bạn cần thiết phải ghi nhớ rằng, ngời chịu trách nhiệm sẽ tiến hành các công việc
trên máy tính cần phải đợc tham gia vào nghiên cứu ngay từ lúc đầu, ví dụ ngay sau khi bộ
câu hỏi và những bảng giả đợc hoàn tất.
3.3. Bảng tổng hợp số liệu.
Nếu số liệu đợc xử lý bằng tay: một việc làm rất thông thờng và hiệu quả là tồng hợp
các số liệu thô vào một bảng đợc gọi là Bảng tổng hợp số liệu để cho việc phân tích đợc dễ
dàng hơn. Trong bảng số liệu đó, tất cả các câu trả lời của mọi đối tợng nghiên cứu riêng rẽ
đều tổng hợp bằng tay.
Ví dụ:
Đối tợng
số
một bảng tổng hợp số liệu
Q1: Tuổi
(năm)
Q2: Giới
Nam
1
2
3
...
Tổng
cộng
30
41
23
Nữ
Q4: Hút thuốc
Có
Không
Q5: Số
điếu thuốc
Không
trả lời
10
15-20
Số liệu sẽ dễ dàng đếm kiểm hơn từ bảng tổng hợp số liệu so với từ câu hỏi điều tra.
Các số liệu sẽ đợc tính toán từ các số liệu cơ bản (nh giới, chỗ ở) và cho tất cả các biến độc
lập nh (hút thuốc/không hút thuốc trong ví dụ).
Khi chúng ta nhận thấy việc tổng hợp các số liệu vào bảng gặp nhiều khó khăn, chúng
ta có thể phân tích mà không cần đến bảng này. Việc tổng hợp số liệu bằng tay cũng là một
điều cần thiết nếu nh bạn muốn quay trở lại với các số liệu thô để tạo ra một số bảng phân
tích số liệu của các biến khác nhau nhng lại có liên quan với nhau.
Chú ý:
Trong nghiên cứu so sánh (phân tích), bạn cần phải có các bảng tổng hợp số liệu khác
nhau cho 2 hoặc 3 nhóm mà bạn đang so sánh (ví dụ: nhóm sử dụng và không sử dụng dịch
vụ KHHGĐ).
60
Trong điều tra cắt ngang, việc sử dụng nhiều bảng tổng hợp số liệu phụ thuộc vào
hoàn cảnh và các mục tiêu nghiên cứu và bạn có muốn so sánh hai hoặc nhiều nhóm với
nhau không.
Quá trình điền vào bảng tổng hợp phải đợc tiến hành một cách rất cẩn thận để tránh
những sai sót không đáng có. Bạn cần thiết phải kiểm tra lại tất cả những số liệu liên quan
đến các đơn vị nghiên cứu. Nếu điều này không đợc tiến hành, những sai sót trong quá trình
nghiên cứu sẽ xuất hiện dựa trên các số bị sai đó. Trong bảng tổng hợp số liệu của chúng ta,
nên đặt đủ những mục "không trả lời" hay "mất số liệu" để có thể ớc lợng luôn đợc tổng số.
Trong trờng hợp mẫu nghiên cứu nhỏ, chúng ta có thể phân tích số liệu bằng tay. Các
bớc thực hiện sau có thể giúp ta đảm bảo đợc sự chính xác và tốc độ:
a. Nếu chỉ có một ngời duy nhất tiến hành phân tích số liệu, hãy sử dụng sắp xếp bằng tay.
Nếu có hai ngời cùng làm, hãy sử dụng một trong hai cách sắp xếp bằng tay hoặc đếm đánh
dấu tay (tally counting).
b. Sắp xếp bằng tay chỉ có thể sử dụng nếu số liệu của mỗi một vấn đề đợc ghi trên các
trang, bảng riêng biệt.
c. Để tiến hành việc sắp xếp bằng tay, các bớc cơ bản nh sau:
- làm từng câu hỏi một
- chia các phiếu hỏi vào các chồng khác nhau theo từng khả năng trả lời cho câu hỏi
đó (ví dụ: Nam/nữ, đến khám bệnh viện /TTYT/thày lang)
- đếm số lợng các phiếu hỏi trong các chồng đó.
d. Các đếm đánh dấu đợc thực hiện theo các bớc sau:
- một thành viên đọc các thông tin trong khi đó ngời kia ghi lại theo dạng đánh dấu (ví
dụ: "III" thể hiện 3 đối tợng hoặc IIII thể hiện 5 đối tợng mang một biến nào đó).
- việcđếm đánh dấu không nên tiến hành cho trên 2 biến cùng một lúc (ví dụ: giới và
sử dụng các loại dịch vụ y tế là đủ).
Nếu cần thiết phải thu thông tin về ba biến (ví dụ: giới, thời gian đến TTYT và chẩn
đoán), hãy tiến hành sắp xếp bằng tay cho câu hỏi đầu tiên sau đó đếm đánh dấu cho hai
câu còn lại.
e. Sau khi tiến hành việc sắp xếp bằng tay hoặc đếm đánh dấu, kiểm tra tổng số các đối tợng/ câu trả lời của mỗi một câu hỏi để đảm bảo rằng chúng ta không bỏ sót câu nào hoặc
làm trùng.
Chú ý:
Những nhà nghiên cứu thờng cho rằng việc xử lý số liệu bằng tay là một công việc rất
dễ dàng và do đó không hớng dẫn nhân viên của họ làm theo một quy trình đúng dắn. Và
hậu quả là rất nhiều thời gian lao động đã bị lãng phí cho việc tìm kiếm lỗi do việc đếm hai
lần, phân lớp sai hoặc bỏ sót.
3.4. Phân tích số liệu bằng máy tính
Trớc khi bạn quyết định sử dụng máy tính để phân tích số liệu, bạn cần phải chắc
chắn rằng điều đó sẽ giúp bạn tiết kiệm đợc thời gian hoặc giúp bạn nâng cao chất lợng của
việc phân tích số liệu. Lu ý rằng việc nhập số liệu vào áy tính cũng tốn thời gian và tiền bạc.
Chúng ta không nên sử dụng máy tính để phân tích số liệu nếu nh cỡ mẫu của chúng ta là
61
nhỏ và số lợng biến rất lớn. Cỡ mẫu càng lớn thì sử dụng máy tính phân tích càng có lợi.
Bạn cũng cần phải để ý chuẩn bị trang thiết bị và chuyên môn cần thiết cho việc phân tích
số liệu bằng máy tính.
Việc phân tích số liệu bằng máy tính bao gồm một số bớc nh sau:
- Chọn chơng trình máy tính phù hợp.
- Nhập số liệu
- Kiểm tra chất lợng số liệu
- Lập chơng trình tính toán (nếu cần)
- Đa ra các kết quả
3.4.1. Chọn một chơng trình máy tính cần thiết.
Hiện nay chúng ta có rất nhiều các chơng trình máy tính có thể sử dụng trong việc xử
lý và phân tích số liệu. Một số chơng trình đợc nhiều ngời sử dụng nhất hiện nay là:
- Epi info (phiên bản 6), một chơng trình rất thông dụng cho việc nhập và phân tích số
liệu, nó cũng có cả chức năng soạn thảo văn bản rất thuận tiện trong việc soạn bộ câu hỏi
(sản phẩm hợp tác của Trung tâm kiểm soát và Khống chế Bệnh tật -CDC Atlanta, Mỹ và
Tổ chức Y tế thế giới).
- SPSS, một phần mềm thống kê dùng cho các khoa học xã hội (của hãng SPSS Inc)....
Nếu bạn dự định sử dụng máy tính, bạn nên tham khảo ý kiến của những ngời có kinh
nghiệm trong vấn đề này để chọn lựa một phần mềm thích hợp nhất đối với số liệu của bạn.
Lu ý rằng Epi info là một phần mềm công cộng, không thu tiền bản quyền còn đối với các
chơng trình khác bạn đều phải trả tiền cho việc sử dụng.
3.4.2. Nhập số liệu.
Để nhập số liệu vào máy tính bạn cần phải lập một khuôn dạng cho việc nhập số liệu
máy tính, phụ thuộc vào chơng trình mà bạn đang sử dụng.
Sau khi hoàn thành khung nhập số liệu, chúng ta tiến hành mã hóa các thông tin thu
thập đợc (vídụ: nam: 1, nữ: 2). Trong quá trình nhập số liệu, các thông tin có thể sẽ đợc
nhập vào máy tính dới dạng các mã tơng ứng (ví dụ: nếu đối tợng đầu tiên (đợc xác định là
0001) - là nam giới (mã là 1) tuổi 25, số liệu sẽ đợc nhập vào là 001 125).
Chú ý là chúng ta có thể thuê nhập số liệu, việc này có thể sẽ khá nhanh và không đắt.
Các nhân viên y tế, những ngời không làm quen với công việc này có thể sẽ làm tiến độ
chậm đi hoặc sẽ có những sai sót khi nhập số liệu.
3.4.3. Kiểm tra
Trong quá trình nhập số liệu, các sai sót có thể xảy ra. Máy tính có thể đa in ra các số
liệu hệt nh những gì đợc nhập vào máy, do đó chúng ta cần kiểm tra để phát hiện ra những
sai sót có thể (ví dụ: những dòng dài quá hoặc quá ngắn, các khoảng trống không cần thiết,
những ký tự chữ có trong phần mã kiểu số, sai mã).
Ví dụ:
- Mã 3-8 trong phần giới tính
- Xuất hiện mã số đối tợng lớn hơn 250 trong khi đó chúng ta chỉ có 250 đối tợng.
62
Nếu có thể, nên tiến hành việc kiểm tra bằng máy tính bằng cách thêm một số lệnh
điều kiện để xác định các sai sót.
Ví dụ: Chúng ta có thể sử dụng các lệnh của máy tính để in ra các đối tợng có giá trị
giới mã là 3- 8.
3.4.4. Lập chơng trình
Nếu bạn có ngời chuyên về máy tính giúp bạn trong việc xử lý số liệu thì bạn cần phải
có sự trao đổi rất cụ thể với họ. Không nên giao hoàn toàn việc phân tích số liệu cho một
chuyên gia máy tính. Bạn, với t cách là một nghiên cứu viên cần phải nói với nhân viên máy
tính các vấn đề sau:
- Tên của các biến trong bộ câu hỏi.
- Vị trí của các biến đó trong mối quan hệ với các chủ đề (ví dụ: khuôn dạng số liệu).
- Cần phân tích bao nhiêu đối tợng và sẽ so sánh những nhóm nào.
- Liệu có biến nào cần thiết phải mã hóa lại hoặc tính toán hay không; và
- Cần phải lập bảng tần số biến nào và bảng chéo so sánh những biến nào.
Để có thể sử dụng đợc một số các chơng trình máy tính đã đề cập ở trên và đa ra đợc
một số các lệnh thích hợp, bạn cần phải đợc trang bị một số đào tạo cơ bản.
3.4.5. Đa ra kết quả
Máy tính có thể làm đợc rất nhiều kiểu phân tích khác nhau và in các kết quả ra giấy.
Tuy nhiên chính bạn phải là ngời quyết định sẽ dùng các bảng biểu, đồ thị hay các kiểm
định thống kê nh thế nào cho thích hợp đối với bản báo cáo của mình.
4.. Phân tích số liệu
4.1. Biến số
Biến số là một đặc tính của ngời, vật, sự việc, hiện tợng có thể nhận các giá trị khác
nhau. Khi nó đợc ngời nghiên cứu lựa chọn để quan sát, đo lờng trong quá trình nghiên cứu
thì nó là các biến số nghiên cứu. Biến số có thể là tiêu thức của đối tợng nghiên cứu, có thể
là các yếu tố bên ngoài nh môi trờng tự nhiên, xã hội ảnh hởng đến đối tợng nghiên cứu.
Giá trị của biến số thờng khác nhau giữa các cá thể trong cùng một quần thể, giữa các lần
quan sát. Thông qua việc quan sát, đo lờng các biến số này, ngời nghiên cứu mới có đợc các
số liệu để phân tích, báo cáo. Đối lập với biến số là các hằng số. Các hằng số không thay
đổi trong mọi điều kiện, ví dụ nh vận tốc ánh sáng là 1 hằng số.
4.2. Phân loại biến số
Biến số có thể đợc phân ra theo 2 nhóm chính:
4.2.1. Các biến định lợng (quantitative variable):
Khi giá trị của 1 biến đợc biểu thị bằng các con số:
Ví dụ:
+ Cân nặng: biểu thị bằng kilogram, gram...
+ Chiều cao: biểu thị bằng centimet, mét...
Tùy theo bản chất của các số đo, biến định lợng có thể đợc chia ra 2 nhóm:
- Biến liên tục (continuous): Khi các số đo có thể mang giá trị thập phân (giá trị của nó
có thể là liên tục trên một trục số).
63
Ví dụ: Cân nặng, hàm lợng đờng huyết, tuổi
- Biến rời rạc (discrete): Khi các số đo chỉ mang các giá trị là các số nguyên, không có
giá trị thập phân.
Ví dụ: Số giờng bệnh trong 1 bệnh viện, số ngời trong 1 nhóm.
4.2.2. Các biến định tính (qualitative variable):
Khi giá trị của biến đợc biểu thị bằng các chữ hoặc ký hiệu đợc xếp vào các nhóm
khác nhau (category).
Ví dụ:
+ Trình độ văn hóa: biểu thị bằng cấp học, lớp học hoặc mức độ mù chữ, biết chữ...
+ Mức độ kiến thức: tốt, khá, trung bình, kém
+ Biến về ho: có ho, không ho; ho khan, ho có đờm, ho ra máu...
Cũng nh với biến định lợng, tùy theo bản chất cách sắp xếp các giá trị trong 1 biến
định tính mà ngời ta chia ra 2 loại:
- Biến danh mục (nominal): Khi các loại, nhóm của biến không cần sắp xếp theo một
trật tự nhất định.
Ví dụ: Nơi ở hiện tại của các đối tợng nghiên cứu là 1 biến địa d. Nó có thể là Hà Nội,
Hải Phòng, Nghệ An, Nam Định, Thái Bình... Việc sắp xếp tên các địa d này không cần
phải theo một trật tự nào và cách sắp xếp đó không ảnh hởng đến việc phân tích và trình bày
số liệu sau này.
- Biến nhị phân (binominal): là 1 loại biến định tính đặc biệt rất hay gặp trong y học.
Biến này chỉ có 2 loại.
Ví dụ: Biến cao huyết áp: có hay không; biến hút thuốc lá: có hút, không hút; biến giới
tính: nam, nữ.
- Khi biến có nhiều hơn 2 loại, biến nhiều loại.
Ví dụ: Màu da ( trắng, đen , vàng )
Tình trạng hôn nhân ( độc thân, có vợ có chồng, ly thân , ly dị, goá ).
* Biến thứ hạng (ordinal): Khi các loại, nhóm của biến đợc sắp xếp theo một trật tự
nhất định.
Ví dụ: Biến trình độ văn hóa của các bệnh nhân lao mới nhập viện có thể có các loại:
mù chữ, văn hóa cấp I, cấp II, cấp III, đại học, sau đại học. Các loại của biến này khi sắp
xếp phải theo thứ tự tăng dần hoặc giảm dần chứ không tùy tiện nh với biến danh mục.
* Chú ý:
- Trong 1 số trờng hợp, các loại, nhóm trong 1 biến định tính đợc ký hiệu bởi các con
số nhng nó vẫn không phải là 1 biến định lợng vì bản chất nó không có giá trị đo lờng mà
chỉ có ý nghĩa nh các ký hiệu.
Ví dụ: biến về mức độ suy dinh dỡng có thể ký hiệu là thể nhẹ, vừa, nặng hoặc biểu
thị dới dạng độ 1, độ 2, độ 3.
- Một biến có thể là định lợng nhng cũng có thể là định tính tùy theo cách ký hiệu:
Ví dụ: Khi biến huyết áp tối đa của đối tợng nghiên cứu biểu thị bằng số đo mmHg,
thì nó là một biến định lợng, nhng khi nó biểu thị dới dạng mức độ cao huyết áp (không
cao, cao, rất cao) thì nó lại là một biến định tính.
- Các biến định lợng và định tính cuối cùng đều có thể chuyển sang dạng biến nhị
phân nếu nh chúng ta có đợc 1 mốc để chuyển dạng (cut off point).
Ví dụ: Huyết áp tối đa (mmHg) là 1 biến định lợng, có thể chuyển sang 1 biến thứ
hạng (gồm các nhóm: < 90mmHg; 90 - 140mmHg; 141 - 180 mmHg; > 180 mmHg) và sau
đó có thể chuyển sang 1 biến nhị phân: có cao huyết áp (khi > 140 mmHg) và không cao
huyết áp (khi < 140mmHg).