Phương pháp chọn mẫu theo cụm

Phương pháp chọn mẫu theo cụm

Phương pháp chọn mẫu trong nghiên cứu xã hội

Phương pháp chọn mẫu, trong thực tế, có thể chính xác hơn khảo sát tổng thể. Số phần tử bạn cần thu thập ít hơn, đồng nghĩa với việc bạn tốn nhiều thời gian hơn để thiết kế và thử nghiệm các phương pháp thu thập dữ liệu. Việc thu thập ít phần tử hơn cũng có nghĩa là bạn có thể thu thập thông tin chi tiết hơn.

Ngoài ra, nếu bạn định sử dụng yếu tố con người để thu thập dữ liệu (chẳng hạn phỏng vấn) thì bạn có thể sử dụng những nhân viên có trình độ cao hơn, nhiều thời gian cho việc thu thập dữ liệu từ những trường hợp khó khăn hơn. Khi dữ liệu của bạn đã được thu thập, bạn có thể dành thời gian tương ứng cho việc kiểm ra, kiểm định dữ liệu về độ chính xác trước khi phân tích.

Với một số câu hỏi nghiên cứu, chúng ta có thể thu thập dữ liệu từ toàn bộ tổng thể vì tổng thể đó có kích thước vừa phải. Tuy nhiên, bạn không nên giả định rằng một cuộc khảo sát tổng thể sẽ nhất thiết đem lại những kết quả hữu ích hơn việc thu thập dữ liệu từ một mẫu đại diện cho tổng thể vì lí do sau đây

+ Việc khảo sát toàn bộ tổng thể là điều không thực tế đối với bạn.

+ Giới hạn về ngân sách cản trở việc khảo sát toàn bộ tổng thể của bạn.

+ Những giới hạn thời gian cản trở việc khảo sát toàn bộ tổng thể của bạn

+ Bạn thu thập tất cả dữ liệu nhưng cần kết quả một cách nhanh chóng.

Làm thế nào để chọn mẫu chính xác trong nghiên cứu thị trường liên quan đến khách hàng?

Sau đây tôi xin chia sẻ một số phương pháp chọn mẫu trong nghiên cứu thị trường về xã hội học.

  1. Lấy mẫu theo xác xuất hay còn gọi là lấy mẫu đại diện

+ Lấy mẫu ngẫu nhiên

Chọn mẫu ngẫu nhiên (hay chọn mẫu xác suất) là phương pháp chọn mẫu mà khả năng được chọn vào tổng thể mẫu của tất cả các đơn vị của tổng thể đều như nhau. Đây là phương pháp tốt nhất để ta có thể chọn ra một mẫu có khả năng đại biểu cho tổng thể. Vì có thể tính được sai số do chọn mẫu, nhờ đó ta có thể áp dụng được các phương pháp ước lượng thống kê, kiểm định giả thuyết thống kê trong xử lý dữ liệu để suy rộng kết quả trên mẫu cho tổng thể chung.

Tuy nhiên ta khó áp dụng phương pháp này khi không xác định được danh sách cụ thể của tổng thể chung (ví dụ nghiên cứu trên tổng thể tiềm ẩn); tốn kém nhiều thời gian, chi phí, nhân lực cho việc thu thập dữ liệu khi đối tượng phân tán trên nhiều địa bàn cách xa nhau,…

+ Lấy mẫu hệ thống

Trước tiên lập danh sách các đơn vị của tổng thể chung theo một trật tự quy ước nào đó, sau đó đánh số thứ tự các đơn vị trong danh sách. Đầu tiên chọn ngẫu nhiên 1 đơn vị trong danh sách ; sau đó cứ cách đều k đơn vị lại chọn ra 1 đơn vị vào mẫu,…cứ như thế cho đến khi chọn đủ số đơn vị của mẫu. Ví dụ : Dựa vào danh sách bầu cử tại 1 thành phố, ta có danh sách theo thứ tự vần của tên chủ hộ, bao gồm 240.000 hộ. Ta muốn chọn ra một mẫu có 2000 hộ. Vậy khoảng cách chọn là : k= 240000/2000 = 120, có nghĩa là cứ cách 120 hộ thì ta chọn một hộ vào mẫu.

+ Lấy mẫu phân tầng

Trước tiên phân chia tổng thể thành các tổ theo 1 tiêu thức hay nhiều tiêu thức có liên quan đến mục đích nghiên cứu (như phân tổ các DN theo vùng, theo khu vực, theo loại hình, theo quy mô,…). Sau đó trong từng tổ, dùng cách chọn mẫu ngẫu nhiên đơn giản hay chọn mẫu hệ thống để chọn ra các đơn vị của mẫu. Đối với chọn mẫu phân tầng, số đơn vị chọn ra ở mỗi tổ có thể tuân theo tỷ lệ số đơn vị tổ đó chiếm trong tổng thể, hoặc có thể không tuân theo tỷ lệ. Ví dụ : Một toà soạn báo muốn tiến hành nghiên cứu trên một mẫu 1000 doanh nghiệp trên cả nước về sự quan tâm của họ đối với tờ báo nhằm tiếp thị việc đưa thông tin quảng cáo trên báo. Toà soạn có thể căn cứ vào các tiêu thức : vùng địa lý (miền Bắc, miền Trung, miền Nam) ; hình thức sở hữu (quốc doanh, ngoài quốc doanh, công ty 100% vốn nước ngoài,…) để quyết định cơ cấu của mẫu nghiên cứu.

+ Lấy mẫu theo cụm

Trước tiên lập danh sách tổng thể chung theo từng khối (như làng, xã, phường, lượng sản phẩm sản xuất trong 1 khoảng thời gian…). Sau đó, ta chọn ngẫu nhiên một số khối và điều tra tất cả các đơn vị trong khối đã chọn. Thường dùng phương pháp này khi không có sẵn danh sách đầy đủ của các đơn vị trong tổng thể cần nghiên cứu. Ví dụ : Tổng thể chung là sinh viên của một trường đại học. Khi đó ta sẽ lập danh sách các lớp chứ không lập danh sách sinh viên, sau đó chọn ra các lớp để điều tra.

+ Chọn mẫu nhiều giai đoạn

Phương pháp trên thường áp dụng đối với tổng thể chung có quy mô quá lớn và địa bàn nghiên cứu quá rộng. Việc chọn mẫu phải trải qua nhiều giai đoạn (nhiều cấp). Trước tiên phân chia tổng thể chung thành các đơn vị cấp I, rồi chọn các đơn vị mẫu cấp I. Tiếp đến phân chia mỗi đơn vị mẫu cấp I thành các đơn vị cấp II, rồi chọn các đơn vị mẫu cấp II…Trong mỗi cấp có thể áp dụng các cách chọn mẫu ngẫu nhiên đơn giản, chọn mẫu hệ thống, chọn mẫu phân tầng, chọn mẫu cả khối để chọn ra các đơn vị mẫu. Ví dụ :Muốn chọn ngẫu nhiên 50 hộ từ một thành phố có 10 khu phố, mỗi khu phố có 50 hộ. Cách tiến hành như sau : Trước tiên đánh số thứ tự các khu phố từ 1 đến 10, chọn ngẫu nhiên trong đó 5 khu phố. Đánh số thứ tự các hộ trong từng khu phố được chọn. Chọn ngẫu nhiên ra 10 hộ trong mỗi khu phố ta sẽ có đủ mẫu cần thiết.

  1. Lấy mẫu không theo xác xuất

Chọn mẫu phi ngẫu nhiên (hay chọn mẫu phi xác suất) là phương pháp chọn mẫu mà các đơn vị trong tổng thể chung không có khả năng ngang nhau để được chọn vào mẫu nghiên cứu. Chẳng hạn : Ta tiến hành phỏng vấn các bà nội trợ tới mua hàng tại siêu thị tại một thời điểm nào đó ; như vậy sẽ có rất nhiều bà nội trợ do không tới mua hàng tại thời điểm đó nên sẽ không có khả năng được chọn‎. Việc chọn mẫu phi ngẫu nhiên hoàn toàn phụ thuộc vào kinh nghiệm và sự hiểu biết về tổng thể của người nghiên cứu nên kết quả điều tra thường mang tính chủ quan của người nghiên cứu. Mặt khác, ta không thể tính được sai số do chọn mẫu, do đó không thể áp dụng phương pháp ước lượng thống kê để suy rộng kết quả trên mẫu cho tổng thể chung. ‎Các phương pháp chọn mẫu phi ngẫu nhiên:‎

+ Chọn mẫu thuận tiện

 ‎Có nghĩa là lấy mẫu dựa trên sự thuận lợi hay dựa trên tính dễ tiếp cận của đối tượng, ở những nơi mà nhân viên điều tra có nhiều khả năng gặp được đối tượng. Chẳng hạn nhân viên điều tra có thể chặn bất cứ người nào mà họ gặp ở trung tâm thương mại, đường phố, cửa hàng,.. để xin thực hiện cuộc phỏng vấn. Nếu người được phỏng vấn không đồng ý thì họ chuyển sang đối tượng khác. Lấy mẫu thuận tiện thường được dùng trong nghiên cứu khám phá, để xác định ý nghĩa thực tiễn của vấn đề nghiên cứu; hoặc để kiểm tra trước bảng câu hỏi nhằm hoàn chỉnh bảng; hoặc khi muốn ước lượng sơ bộ về vấn đề đang quan tâm mà không muốn mất nhiều thời gian và chi phí.‎

+ Chọn mẫu phán đoán

 ‎Là phương pháp mà phỏng vấn viên là người tự đưa ra phán đoán về đối tượng cần chọn vào mẫu. Như vậy tính đại diện của mẫu phụ thuộc nhiều vào kinh nghiệm và sự hiểu biết của người tổ chức việc điều tra và cả người đi thu thập dữ liệu. Chẳng hạn, nhân viên phỏng vấn được yêu cầu đến các trung tâm thương mại chọn các phụ nữ ăn mặc sang trọng để phỏng vấn. Như vậy không có tiêu chuẩn cụ thể “thế nào là sang trọng” mà hoàn toàn dựa vào phán đoán để chọn ra người cần phỏng vấn.‎

+ Chọn mẫu định ngạch

 ‎Đối với phương pháp này, trước tiên ta tiến hành phân tổ tổng thể theo một tiêu thức nào đó mà ta đang quan tâm, cũng giống như chọn mẫu ngẫu nhiên phân tầng, tuy nhiên sau đó ta lại dùng phương pháp chọn mẫu thuận tiện hay chọn mẫu phán đoán để chọn các đơn vị trong từng tổ để tiến hành điều tra. Sự phân bổ số đơn vị cần điều tra cho từng tổ được chia hoàn toàn theo kinh nghiệm chủ quan của người nghiên cứu. Chẳng hạn nhà nghiên cứu yêu cầu các vấn viên đi phỏng vấn 800 người có tuổi trên 18 tại 1 thành phố. Nếu áp dụng phương pháp chọn mẫu định ngạch, ta có thể phân tổ theo giới tính và tuổi như sau:chọn 400 người (200 nam và 200 nữ) có tuổi từ 18 đến 40, chọn 400 người (200 nam và 200 nữ) có tuổi từ 40 trở lên. Sau đó nhân viên điều tra có thể chọn những người gần nhà hay thuận lợi cho việc điều tra của họ để dễ nhanh chóng hoàn thành công việc.

Chọn mẫu là một khâu quan trọng vì mẫu chính là đối tượng tác động đến mục tiêu nghiên cứu, vì vậy nên cân nhắc trước khi ra quyết định chọn mẫu khảo sát để trả lời đúng câu hỏi bạn mong muốn sau khảo sát.

Bài tiếp theo: Trong nghiên cứu số lượng mẫu, cần khảo sát bao nhiêu để thể hiện được toàn bộ tổng thể

Trong lấy mẫu theo cụm (Cluster sampling), các nhóm đối tượng lý tưởng được sắp xếp hỗn độn một cách tự nhiên trong nhóm, và được chọn một cách ngẫu nhiên. Không giống như phương pháp lấy mẫu theo lớp, với các nhóm được sắp xếp đồng nhất và chỉ một vài đối tượng được chọn ngẫu nhiên từ mỗi nhóm, trong phương pháp lấy mẫu theo cụm, mỗi nhóm được phân bổ một cách hỗn độn và toàn bộ đối tượng trong nhóm trở thành một phần của mẫu. Trong khi lấy mẫu theo lớp có sự đồng nhất trong mỗi lớp và hỗn độn giữa các lớp, lấy mẫu theo cụm có sự hỗn độn trong mỗi lớp.

Ví dụ

Lấy mẫu theo cụm một cấp

Một ủy ban với số lượng thành viên từ các phòng ban khác nhau có mức độ hỗn độn cao. Từ số lượng thành viên trong ủy ban đó, một vài người được chọn ngẫu nhiên, và nó được coi là một trường hợp lấy mẫu theo nhóm một cấp.

Lấy mẫu theo nhóm hai cấp

Nếu từ mỗi nhóm đã được ngẫu nhiên trước đó, một vài đối tượng được chọn ngẫu nhiên sử dụng phương pháp lấy mẫu ngẫu nhiên đơn giản hoặc bất kỳ phương pháp xác suất nào khác thì đó được coi là trường hợp lấy mẫu theo cụm hai tầng.

Lấy mẫu theo cụm nhiều tầng

Một mẫu dạng cụm có thể là một mẫu nhiều cấp, nếu sự lựa chọn các đối tượng trong một mẫu có sự tác động ở nhiều cấp. Có nghĩa là nếu một bài khảo sát toàn quốc về sản phẩm bảo hiểm từ một công ty bảo hiểm được đưa ra, nó sẽ cần việc xây dựng các cụm ở nhiều cấp.

Ở cấp đầu tiên, các cụm được hình thành từ các thành phần cơ bản của cộng đồng và các công ty cá nhân. Cấp tiếp theo đó là một nhóm các công ty được chọn ngẫu nhiên từ các nhóm đã hình thành trước đó. Ở cấp thứ ba, vị trí các công ty được lựa chọn để thu thập thông tin sẽ được chọn ngẫu nhiên. Vì vậy trong phương pháp lấy mẫu nhiều cấp, đầu tiên ta sẽ hoàn thành việc lấy mẫu từ đơn vị ban đầu, sau đó mỗi đơn vị ban đầu sẽ được lấy mẫu lần hai và rồi lần thứ ba cho tới khi kết thúc toàn bộ đối tượng mẫu.