Measure of Variation là gì

Hệ số biến thiên (tiếng Anh: Coefficient of variation, viết tắt: CV) là một thước đo thống kê độ phân tán của các dữ liệu trong một chuỗi dữ liệu so với giá trị trung bình.

Measure of Variation là gì

Hình minh họa. Nguồn: Digitalvidya.com

Khái niệm

Hệ số biến thiên, tiếng Anh gọi là coefficient of variation, viết tắt là CV.

Hệ số biến thiên là một thước đo thống kê độ phân tán của các dữ liệu trong một chuỗi dữ liệu so với giá trị trung bình.

Hệ số biến thiên là tỉ lệ của độ lệch chuẩn (standard deviation) so với giá trị trung bình (mean). Nó là một thống kê hữu ích trong việc so sánh mức độ biến thiên của chuỗi dữ liệu này với chuỗi dữ liệu khác, cho dù giá trị trung bình của chúng rất khác nhau.

Hiểu rõ hơn về hệ số biến thiên

Hệ số biến thiên cho thấy mức độ biến thiên của dữ liệu trong một mẫu tương quan với giá trị trung bình của tổng thể. Trong tài chính, hệ số biến thiên giúp nhà đầu tư xác định được mức độ dao động hay rủi ro phải chịu để có lợi nhuận kì vọng của khoản đầu tư.

Trường hợp lí tưởng nhất là khi hệ số biến thiên, hay tỉ lệ của độ lệch chuẩn so với giá trị trung bình, thấp. Việc này có nghĩa là tỉ lệ rủi ro trên lợi nhuận hợp lí. Lưu ý là nếu lợi nhuận kì vọng nằm ở mẫu số bằng 0 hoặc âm thì hệ số biến thiên có thể sẽ sai.

Hệ số biến thiên sẽ hữu ích khi sử dụng tỉ lệ rủi ro trên lợi nhuận làm cơ sở để quyết định đầu tư. Ví dụ, một nhà đầu tư ngại rủi ro sẽ xem xét những tài sản có độ dao động trong quá khứ thấp và mức sinh lời cao khi so tương quan với toàn thị trường hay ngành của nó. Ngược lại, những nhà đầu tư ưa mạo hiểm thường tìm cơ hội đầu tư vào những tài sản có độ dao động trong quá khứ cao.

Công thức của hệ số biến thiên

Hệ số biến thiên = Độ lệch chuẩn / Giá trị trung bình

Measure of Variation là gì

Ví dụ về việc sử dụng hệ số biến thiên khi quyết định đầu tư

Một nhà đầu tư ngại rủi ro mong muốn đầu tư vào một quĩ đầu tư. Anh ấy chọn được ba quĩ đầu tư A, B, C. Sau đó anh ấy phân tích số liệu về lợi nhuận và độ dao động của các quĩ này trong vòng 15 năm qua. Anh ấy cho rằng trong tương lai dài hạn, những quĩ này sẽ đem lại kết quả tương tự như vậy. Thông tin anh ấy phân tích được từ ba quĩ này là:

- Quĩ A có lợi nhuận hàng năm là 5,47% và độ lệch chuẩn là 14,68%. Hệ số biến thiên của quĩ A là 2,68.

- Quĩ B có lợi nhuận hàng năm là 6,88% và độ lệch chuẩn là 21,31%. Hệ số biến thiên của quĩ B là 3,09.

- Quĩ C có lợi nhuận hàng năm là 7,16% và độ lệch chuẩn là 19,46%. Hệ số biến thiên của quĩ C là 2,72.

Dựa vào số liệu trên, nhà đầu tư này quyết định đầu tư vào quĩ A hoặc quĩ C vì tỉ lệ rủi ro trên lợi nhuận khá giống nhau và tốt hơn so với quĩ B.

(Theo Investopedia)

Thiên Cơ

Khi phân tích, các nhà thống kê rất quan tâm đến một tiêu chí gọi là độ biến động (variability), hay độ rộng (spread) của tập dữ liệu. Những số đo phổ biến nhất để đo lường tiêu chí này là khoảng phần tư (IQR), phương sai (variance) và độ lệch chuẩn (standard deviation).

Khoảng giá trị (range)

Khoảng giá trị là sự chênh lệch giữa giá trị lớn nhất và giá trị nhỏ nhất trong một tập giá trị. Ví dụ, có dãy số sau: 1, 3, 4, 5, 5, 6, 7, 11.  Đối với dãy này, khoảng giá trị là 11-1 (bằng 10).

Khoảng phần tư / Khoảng tứ phân vị (Interquartile Range)

Đây là thước đo dựa trên việc chia một tập dữ liệu thành 4 phần bằng nhau.

Ba điểm mốc chia tập dữ liệu thành 4 phần được ký hiệu lần lượt là Q1, Q2 và Q3.

  • Q1 là giá trị “ở giữa” của nửa đầu tập dữ liệu “đã được sắp xếp”
  • Q2 chính là trung vị của tập dữ liệu
  • Q3 là giá trị “ở giữa” của nửa cuối tập dữ liệu “đã được sắp xếp”

IQR là khoảng giữa Q1 và Q3.

Ví dụ, ta có dãy số sau: 1, 2, 3, 4, 5, 6, 7, 8.

Measure of Variation là gì

Q2 là trung vị của toàn bộ tập dữ liệu. Trong ví dụ này, ta có tổng số giá trị là chẵn, vì vậy trung vị là trung bình của 2 giá trị ở giữa. Do đó Q2 = (4+5)/2 = 4,5. Q1 là giá trị chính giữa của nửa dữ liệu đầu tiên. Nửa dữ liệu đầu tiên có tổng số giá chị là chẵn nên Q1 là trung bình của 2 giá trị ở giữa, Q1 = (2+3)/2 = 2,5. Q3 là giá trị giữa của nửa dữ liệu thứ hai. Tương tự như Q1, Q3= (6+7)/2 = 6,5. IQR = Q3-Q1 = 6,5 – 2,5 = 4.

Phương sai (Variance)

Trong một tổng thể, phương sai là trung bình cộng của bình phương độ lệch của các giá trị so với trung bình của tổng thể. Phương sai được tính bằng công thức sau.

Trong đó là phương sai của tổng thể, là trung bình của tổng thể,  là thành phần thứ của tổng thể, và là số thành phần của tổng thể.

Các quan sát từ một mẫu ngẫu nhiên có thể được sử dụng để ước lượng phương sai của tổng thể. Trong trường hợp này, công thức tính phương sai có sự khác biệt một chút so với công thức áp dụng cho Tổng thể.

Trong đó  là phương sai của mẫu, là trung bình của mẫu,  là phần tử thứ của mẫu, và là số thành phần của mẫu. Ta thấy, so với công thức phương sai của tổng thể, công thức này ta đã chia tổng thu được cho . Mục đích của việc này là nhằm tránh thành kiến trong việc đánh giá phương sai của tổng thể. Nếu bạn cần ước lượng phương sai của một tổng thể mà bạn không biết rõ số lượng mà chỉ có một mẫu ngẫu nhiên, thì đây là công thức bạn cần sử dụng.

Độ lệch chuẩn (standard deviation)

Độ lệch chuẩn là căn bậc hai của phương sai. Do đó, công thức của độ lệch chuẩn của tổng thể là:

Trong đó là độ lệch chuẩn của của tổng thể, là trung bình của tổng thể. là phần tử thứ của tổng thể, và là số thành phần của tổng thể.

Tương tự, độ lệch chuẩn của mẫu được tính bằng công thức:

Trong đó, là độ lệch chuẩn của mẫu, là trung bình của mẫu, là thành phần thứ của mẫu, và là tổng số thành phần của mẫu

Tác động của việc thay đổi đơn vị

Đôi khi, các nhà nghiên cứu phải thay đổi đơn vị (phút sang giờ, feet thành mét …).

  • Nếu bạn cộng thêm một hằng số vào mỗi giá trị, khoảng cách giữa các giá trị không thay đổi. Kết quả là, tất cả các số đo độ biến động như (khoảng giá trị, khoảng phần tư, độ lệch chuẩn, và phương sai) vẫn giữ nguyên.
  • Nếu bạn nhân mỗi giá trị với một hằng số khoảng giá trị, khoảng phần tư, độ lệch chuẩn cũng được nhân với bấy nhiêu lần. Tuy nhiên phương sai bị tác động lớn hơn. Nó nhân phương sai với bình phương của hằng số đó.