Phân Tích Tương Quan Là Gì

     

Phân tích tương quan Pearson r (cung cấp cho một hệ số đối sánh tương quan Pearson, được cam kết hiệu là r) là thước đo độ mạnh mẽ của mối links tuyến tính giữa hai biến. Về cơ bản, sự đối sánh Pearson nỗ lực vẽ một đường cân xứng nhất trải qua dữ liệu của hai biến chuyển và hệ số đối sánh Pearson, r, cho biết thêm khoảng cách tất cả các điểm tài liệu này đến đường phù hợp nhất này (tức là các điểm tài liệu này giỏi như ráng nào với quy mô / con đường mới tương xứng nhất).

Bạn đang xem: Phân tích tương quan là gì

1. Bao giờ sử dụng?

Phân tích đối sánh tương quan Pearson, r, có thể được sử dụng làm ước lượng mẫu cho đối sánh tương quan dân số, ρ (rho). Nó là 1 trong những chỉ số không có thứ nguyên về quan hệ tuyến tính giữa hai biến đổi ngẫu nhiên, giá chỉ trị bằng 0 có nghĩa là không có mối quan hệ tuyến tính giữa các biến và giá trị bởi 1 cho biết mối quan tiền hệ tuyến đường tính trả hảo. Nếu như mối đối sánh tương quan là âm, có nghĩa là giá trị tăng trên một thay đổi được kết hợp với giá trị giảng trên biến hóa kia. Quý giá của r tất cả thể biến đổi giữa −1 cùng +1 bất kể kích thước đo lường của hai biến.

Tương quan tiền Pearson, r, nên được coi là một thống kê thể hiện (descriptive statistic) lúc một nhà nghiên cứu muốn định lượng mức độ của quan hệ tuyến tính giữa những biến. Một đối sánh tham số sẽ tương thích bất cứ khi nào các phép đo định lượng được thực hiện đồng thời trên hai hoặc các biến, mối quan hệ giữa hai đổi thay là tuyến tính và cả hai biến chuyển đều được phân phối chuẩn. Những mối đối sánh phải luôn được soát sổ trước khi triển khai các phân tích nhiều biến tinh vi hơn, chẳng hạn như phân tích yếu tố (factor analysis) hoặc đối chiếu thành phần bao gồm (principal component analysis). Cường độ của mối quan hệ tuyến tính thân hai phát triển thành số có thể khó reviews từ biểu vật dụng phân tán và thông số tương quan hỗ trợ một bản tóm tắt gọn gàng hơn. Mặc dù nhiên, sẽ không khôn ngoan nếu cố gắng tính toán mối tương quan khi biểu đồ vật phân tán biểu thị một quan hệ phi đường tính rõ ràng. Lúc 1 nhà nghiên cứu suy xét cả mức khoảng chừng rộng và ý nghĩa của một mối đối sánh tương quan thì r được sử dụng theo phong cách suy diễn như một cầu lượng của mối tương quan dân số, ρ (rho).

Công thức tính hệ số đối sánh tương quan Pearson trong hai đổi thay x cùng y trường đoản cú n chủng loại như sau:

*

2. đưa thuyết vô hiệu hóa và suy đoán thống kê

Khi mong lượng size của mối đối sánh dân số, bạn có thể muốn kiểm soát xem nó có chân thành và ý nghĩa thống kê hay không. Trả thuyết vô hiệu hóa là H0: ρ = 0, nghĩa là, đổi thay X không tương quan tuyến tính với biến hóa Y. đưa thuyết thay thế là H1: ρ ≠ 0. Mang thuyết vô hiệu là 1 trong những phép kiểm soát xem có ngẫu nhiên mối quan liêu hệ cụ thể nào giữa những biến X với Y rất có thể phát sinh một cách tình cờ hay không. Cung cấp mẫu của r là không chuẩn khi tương quan dân số lệch khỏi 0 và khi độ lớn mẫu bé dại (n Fisher’s z.

3. Các giả định thống kê

Trong một số trong những sách thống kê giành cho các nhà kỹ thuật xã hội, tín đồ ta xác minh rằng để sử dụng mối đối sánh tương quan Pearson, cả hai vươn lên là phải bao gồm phân phối chuẩn, nhưng trong các văn phiên bản khác, nó nói rằng phân phối của tất cả hai biến phải đối xứng (symmetrical) và đơn phương (unimodal) cơ mà không tốt nhất thiết bắt buộc chuẩn. Những chủ ý này gây hoang mang lo lắng lớn cho các nhà nghiên cứu và phân tích và cần được làm rõ. Giả dụ thống kê đối sánh chỉ được áp dụng cho mục tiêu mô tả thì không cần thiết phải sử dụng các giả định chuẩn chỉnh về bề ngoài (form) của triển lẵm dữ liệu. Những giả định duy nhất được yêu ước là:

các phép đo định lượng (mức khoảng hoặc mức xác suất của phép đo) được thực hiện đồng thời trên hai hoặc nhiều trở thành ngẫu nhiên. Có nghĩa là hai biến nên được đo lường và tính toán trên thang đo khoảng chừng hoặc tỷ lệ. Tuy nhiên, cả hai biến không cần phải được đo lường và thống kê trên và một thang đo (ví dụ, một biến có thể là phần trăm và một hoàn toàn có thể là khoảng).các phép đo bắt cặp cho mỗi đối tượng (ví dụ, mọi cá nhân tham gia) là độc lập. Ví dụ, các bạn đã thu thập thời gian ôn tập (tính bằng giờ) và công dụng thi (đo từ 0 mang đến 100) trường đoản cú 100 sinh viên được rước mẫu tự dưng tại một trường đại học (tức là bạn có hai trở nên liên tục: “thời gian ôn tập” và “kỳ thi hiệu suất”). Mọi người trong số 100 sinh viên sẽ có một quý hiếm về thời gian ôn tập (ví dụ: “sinh viên số 1” vẫn học vào “23 giờ”) và hiệu quả bài kiểm soát (ví dụ: “sinh viên số 1” đạt “81/100”). Vì chưng đó, bạn sẽ có 100 giá trị được ghép nối.

Các kết quả thu được sẽ miêu tả mức độ mà quan hệ tuyến tính được áp dụng cho tài liệu mẫu.

Ngoài ra, buộc phải nhận xét bình an về việc áp dụng r. Đây chưa hẳn là mọi giả định nghiêm ngặt nhưng giữa những tình huống nghiên cứu điển hình lúc r hoặc là phải được lý giải một biện pháp thận trọng, hoặc không nên sử dụng.

Khi phương không đúng của hai thước đo khôn xiết khác nhau, thường liên quan đến những phạm vi không giống nhau hoặc hoàn toàn có thể là một phạm vi số lượng giới hạn cho một biến, thì mối đối sánh mẫu vẫn bị hình ảnh hưởng. Ví dụ: giả dụ một biến đổi bị tiêu giảm phạm vi, (một phần của phạm vi điểm số ko được sử dụng hoặc không phù hợp) thì điều này sẽ có xu hướng làm giảm (thấp hơn) mối đối sánh giữa hai biến.Khi có các giá trị nước ngoài lệ, r yêu cầu được phân tích và lý giải một bí quyết thận trọng.Khi các quan gần cạnh được mang từ một tổ không đồng bộ (heterogeneous). Nếu tốt nhất, dữ liệu nên là đồng độc nhất vô nhị (homoscedasticity). Đồng độc nhất vô nhị trong tương quan tức là các phương không nên dọc theo mặt đường của sự phù hợp nhất vẫn tựa như khi dịch chuyển dọc theo đường. Nếu những phương sai rất khác nhau thì tất cả phương sai thay đổi (hay nói một cách khác heteroscedasticity). Đồng độc nhất (hay độ co giãn đồng nhất) được thể hiện thuận lợi nhất bằng sơ đồ, như hình bên dưới đây:

*

Khi tài liệu thưa thớt (có quá không nhiều số đo), r tránh việc được sử dụng. Với vượt ít giá bán trị, cần thiết nói liệu mối quan hệ hai biến bao gồm tuyến tính xuất xắc không. đối sánh tương quan Pearson r là phù hợp nhất cho các mẫu to hơn (n> 30).Không nên sử dụng tương quan r khi các giá trị trên một trong các biến đang được cố định và thắt chặt trước.

4. Phân tích tương quan Pearson r trong SPSS

Ví dụ, một nhà phân tích muốn biết liệu tác dụng kỳ thi viết cuối kì môn Toán giải thích có tương quan với thời gian ôn tập cuối kì của những sinh viên xuất xắc không. Có đôi mươi sinh viên được mời tham gia một cuộc thử nghiệm, kể từ lúc bài học tập của môn Toán giải tích kết kết mang đến ngày thi cuối kì, chúng ta được đề nghị khắc ghi tổng khoảng thời gian ôn bài (cộng dồn của mỗi ngày) dành cho môn Toán. Chấm dứt kì thi, nhà nghiên cứu thu thập điểm số của 20 sinh viên này theo thang điểm 100, với tổng thích hợp theo bảng dưới đây.

*

Hai thắc mắc nghiên cứu được xem như xét: i) Điểm thi viết cuối kì môn Toán phân tích và lý giải có tương quan tuyến tính với số giờ ôn tập của những sinh viên tuyệt không? và ii) khoảng thời gian ôn tập của các sinh viên có liên quan tuyến tính với điểm thi viết cuối kì môn Toán phân tích và lý giải hay không?

Các bước dưới đây hướng dẫn bọn họ cách phân tích tương quan Pearson r trong thống kê SPSS.

Xem thêm: Cách Đưa Google Chrome Ra Màn Hình Máy Tính, TạO BiểU Tæ°Á»£Ng Google Chrome Trãªn Desktop

– bước 1: khám nghiệm biểu vật phân tán mô tả mối quan hệ giữa nhị biến. Xin vui vẻ đọc bài cách vẽ biểu vật dụng phân tán. Kết quả vẽ biểu đồ gia dụng phân tán được trình bày trong hình dưới đây.

*

Nhận xét: Biểu đồ gia dụng scatter thân Điểm thiÔn tập gợi ý xu hướng ngay gần đúng tuyến đường tính, nhưng cỡ chủng loại là bé dại để quan lại sát ví dụ một đường tuyến tính. Vào thực tế, chúng ta cần một cỡ mẫu bự hơn, ít nhất n > 30. Biểu đồ này cũng cho biết thêm một quan gần kề ngoại lệ rất rõ ràng (điểm gần cực hiếm 4 ngơi nghỉ trục hoành).

– bước 2: lúc biểu thứ phân tán dự kiến mối quan lại hệ con đường tính, chúng ta tiến hành phân tích đối sánh tương quan Pearson r. Click Analyze-> Correlate -> Bivariate…

*

– cách 3: Trong vỏ hộp thoại Bivariate Correlations, bọn họ chuyển các biến đề nghị kiểm tra đối sánh với nhau vào hộp Variables. Chú ý check vào hộp Pearson trong vùng Correlation Coefficients. Tiếp nối nhấp OK để chạy kết quả.

*

Phân tích kết quả:

Bảng Correlations trình bày hệ số đối sánh tương quan Pearson r, giá bán trị ý nghĩa sâu sắc p của chính nó và form size mẫu được tính toán. Trong lấy ví dụ như này, bạn có thể thấy rằng hệ số tương quan Pearson, r, là 0.78 với nó có ý nghĩa thống kê (p = 0.000).

*

Chúng ta rất có thể viết report rằng, một đối sánh tương quan Pearson đã được chạy để khẳng định mối quan hệ tuyến tính giữa Điểm thi viết cuối kì môn Toán phân tích và lý giải và khoảng thời gian ôn tập của những sinh viên. Kết quả cho biết thêm có mối đối sánh tương quan thuận giữa Điểm thi viết cuối kì môn Toán phân tích và lý giải và thời gian ôn tập của những sinh viên (r = 0.780, n = 20, p. = 0.000).

– bước 4: Kiểm tra chân thành và ý nghĩa của hệ số tương quan r

Một lúc mối đối sánh đã được tính toán, nhà nghiên cứu rất có thể muốn biết năng lực xảy ra mối tương quan thu được này như thế nào, nghĩa là, đây gồm phải là sự xuất hiện vô tình hay nó thay mặt đại diện cho mối đối sánh tương quan dân số xứng đáng kể?

Để thực hiện việc này, r được gửi đổi, và tỷ lệ của cơ chế ước lượng này dựa trên phân phối mẫu mã của thống kê lại t (t-statistic). vì đó, ý nghĩa của một hệ số đối sánh tương quan Pearson chiếm được được tiến công giá bằng cách sử dụng phân phối t (t-distribution) cùng với n − 2 bậc tự do thoải mái (df) và được cho vị phương trình sau:

*

Giả thuyết loại bỏ được kiểm nghiệm là hai phát triển thành độc lập, có nghĩa là không có quan hệ tuyến tính giữa chúng, H0: ρ = 0. đưa thuyết sửa chữa thay thế là, H1: ρ ≠ 0.

Để vấn đáp câu hỏi, bao gồm mối tương quan đáng đề cập nào, tại mức 5%, giữa điểm Điểm thi viết cuối kì môn Toán lý giải và khoảng thời gian ôn tập của các sinh viên không? t sẽ tiến hành tính như sau:

*

Tra bảng cho tới hạn của quý giá t (critical t-value) thu được giá trị là 2.101. Thống kê khám nghiệm t là quá quá quý hiếm tới hạn này, (5.433 > 2.101), và vì vậy giả thuyết vô hiệu bị bác bỏ. Bọn họ kết luận rằng mối đối sánh tương quan có ý nghĩa ở nút 5%.

– bước 5: kiểm soát khoảng tin tưởng của hệ số đối sánh r

Khoảng tin cẩn là dựa vào một sự biến hóa thống kê r thành thống kê lại Fisher’s z. Điều này không y hệt như độ lệch Z (Z-deviate) đối với phân phối chuẩn chỉnh (đôi lúc được gọi là vấn đề Z). Để diễn giải khoảng tin cậy, điểm số Fisher’s z đề xuất được chuyển đổi trở lại số liệu tương quan. Fisher’s z được reviews là:

Khoảng tin yêu (95%) mang lại mối tương quan lưỡng biến đổi giữa Điểm thi viết cuối kì môn Toán giải thích và thời gian ôn tập của các sinh viên được xem bằng công thức:

*

Công thức biến đổi Fisher’s Z được có mang là:

*

Áp dụng các công thức trong ví dụ như (với r = 0.78), ta có:

*

Khoảng tin tưởng (95%):

*

= 0.57 đến 1.52

Các cực hiếm này bây chừ phải được biến đổi trở lại số liệu ban đầu.

Xem thêm: Từ: Procrastinator Là Gì, Nghĩa Của Từ Procrastinator, Từ: Procrastinator

*

Nhận xét: chúng ta có thể kết luận rằng họ chắc chắn 95% rằng mối đối sánh dân số là dương với nằm trong vòng 0.515 mang đến 0.909. Khoảng tin cẩn này không bao gồm giá trị 0, điều này cho biết mối đối sánh có ý nghĩa thống kê ở tầm mức 5%.

Tài liệu tham khảo