Trang chủ Tài liệu chuyên ngành Hồi Quy Đa Biến Là Gì? Hướng Dẫn Chạy Hồi Quy Đa Biến Trong SPSS

Hồi Quy Đa Biến Là Gì? Hướng Dẫn Chạy Hồi Quy Đa Biến Trong SPSS

Đăng ngày
28 Tháng Ba, 2024

Hồi quy đa biến là một trong các phương pháp dùng để thống kê được sử dụng để đánh giá mức độ tác động của các biến độc lập lên biến phụ thuộc cũng như giải thích sự khác biệt của các biến phụ thuộc trên nhiều khía cạnh khác nhau. Để hiểu rõ hơn về hồi quy đa biến là gì và các chạy hồi quy đa biến trong SPSS, chúng ta hãy cùng nhau theo dõi bài viết sau cùng Luận Văn Beta nhé.

Khái niệm Hồi quy đa biến là gì?

Hồi quy đa biến là một phần mở rộng của hồi quy tuyến tín đơn giản, được sử dụng nhằm giải thích sự khác biệt giữa các biến phụ thuộc theo các biến độc lập. Qua đó, người dùng có thể kiểm tra tác động của các yếu tố khác nhau đối với biến phụ thuộc từ đó đưa ra những quyết định chính xác và phù hợp hơn.

Ví dụ: Công ty A muốn dự đoán chỉ số về số lượng công việc và mức thu nhập của nhân viên X. Công ty thiết lập nghiên cứu và chia ra các yếu tố: độ tuổi, phòng ban, vị trí công việc, trong đó:

Biến phụ thuộc: A (số lượng công việc và thu nhập)

Biến độc lập: độ tuổi, phòng ban, vị trí công việc

Phương trình hồi quy đa biến như sau: Y= β0+ β1X+ e

Phương trình hồi quy bội: Y= β0+ β1X1+ β2X2+….+ βnXn+e

Theo đó:

Y: biến phụ thuộc chịu tác động của các biến khác

X, X1, X2,….Xn: các biến độc lập tác động lên biến khác

Β0: Hằng hồi quy hay hệ số chặn. Chỉ số nói lên giá trị của Y sẽ là bao nhiêu nếu tất cả X cùng bằng 0. Tức là thông qua chỉ số này, chúng ta biết giá trị của Y sẽ là bao nhiêu nếu không có các X. Khi biểu diễn trên đồ thị Oxy, β0 là điểm nằm trên trục Oy mà đường hồi quy cắt qua

Β1, β2,… βn: hệ số hồi quy hay hệ số góc. Thông qua chỉ số này, chúng ta biết về sự thay đổi của Y gây ra bởi X tương ứng hay chỉ số này nói lên có bao nhiêu đơn Y sẽ thay đổi nếu X tăng hoặc giảm một đơn vị.

hoi quy da bien la gi luanvanbeta
Hồi quy đa biến là gì?

Những trị số trong phân tích hồi quy đa biến mà chúng ta cần biết

Trong phân tích hồi quy tuyến tính đa biến, chúng ta cần biết được mức độ ảnh hưởng của từng yếu tố đối với biến kết cục y. Để biết được mức độ ảnh hưởng, các bạn cần lưu ý đến các trị số quan trọng sau:

Hệ số tương quan Pearson (r): Yếu tố này có R càng lớn thì ảnh hưởng càng lớn.

Bình phương của R: Yếu tố nào có R bình phương càng lớn thì mối quan hệ giữa các yếu tố đó với biến y càng chặt chẽ.

Hệ số hồi quy Beta: Yếu tố nào có Beta càng lớn thì ảnh hưởng càng nhiều nhưng các yếu tố có đơn vị khác nhau như tuổi, mmol/L,… không nên so sánh mức độ ảnh hưởng giữa các yếu tố.

Trị số p: Giá trị của trị số này càng nhỏ thì mức ảnh hưởng của nó càng mạnh.

Ý nghĩa của các chỉ số trong hồi quy đa biến

Giá trị Adjusted R Square (R bình phương hiệu chỉnh) và R2 (R Square) được sử dụng để phản ánh mức độ ảnh hưởng của các biến độc lập lên biến phụ thuộc. Mức dao động của giá trị này là từ 0 đến 1. Nếu càng tiến về 1 thì các biến độc lập giải thích càng nhiều cho biến phụ thuộc. Ngược lại, nếu tiến về 0 thì các biến độc lập giải thích càng ít cho biến phụ thuộc.

Trị số Durbin – Watson (DW): chức năng kiểm tra hiện tượng tự tương quan của các chuỗi bậc nhất. Mức độ giao động của biến này là từ 0 đến 4. Nếu tương quan của các sai số kề nhau không xảy ra thì giá trị sẽ gần như bằng 2, nếu giá trị tiến càng gần về 4 thì các phần sai số có tương quan nghịch, nếu về 0 thì các phần sai số có tương quan thuận.

Giá trị Sig, có hai trường hợp xảy ra:

Nếu Sig < 0.05: bác bỏ giả thuyết H0, tức là R2 # 0 một cách có ý nghĩa thống kê nên mô hình hồi quy này là phù hợp.

Nếu Sig > 0.05: chấp nhận giả thuyết H0, tức là R2 = 0 một cách có ý nghĩa thống kê nên mô hình hồi quy này không phù hợp.

Hệ số phóng đại phương sai VIF: để kiểm tra hiện tượng đa cộng tuyến. Nếu VIF < 2 sẽ không xuất hiện hiện tượng đa cộng tuyến giữa các biến độc lập và ngược lại nếu VIF >2 thì xuất hiện hiện tượng đa cộng tuyến.

Hướng dẫn các bước chạy hồi quy đa biến trong SPSS

Ta xét ví dụ: Một nhà nghiên cứu muốn xác định xem liệu có mối quan hệ giữa mức độ hạnh phúc trong cuộc sống của sinh viên và mức độ trầm cảm, mức độ căng thẳng và độ tuổi. Nhà nghiên cứu đã thu thập dữ liệu từ sinh viên về mức độ hạnh phúc trong cuộc sống, mức độ trầm cảm, mức độ căng thẳng và tuổi tác. Tỷ lệ hạnh phúc theo thang điểm từ 1 đến 5, trong khi tỷ lệ trầm cảm và căng thẳng theo thang điểm từ 1 đến 10. Tuổi là dữ liệu bằng số.

Thiết lập trong SPSS

Trong SPSS Statistics, chúng ta sẽ tạo các biến để có thể nhập dữ liệu: happiness (mức độ hạnh phúc), depression (mức độ trầm cảm), stress (mức độ căng thẳng) và age (độ tuổi).

Bước 1: Trên thanh menu chính của phần mềm SPSS, Nhấp vào Analyze > Regression > Linear… như hiển thị bên dưới:

phan tich hoi quy da bien trong spss 01 luanvanbeta

Bước 2: Bởi chúng ta muốn kiểm tra xem mức độ trầm cảm, mức độ căng thẳng và độ tuổi có mối quan hệ với mức độ hạnh phúc của học sinh hay không, biến phụ thuộc của chúng ta sẽ là happiness và các biến độc lập của chúng tôi là depression, stressage. Do đó, từ hộp bên trái, chúng ta sẽ chuyển biến happiness vào hộp Dependent và các biến depression, stressage vào hộp Independent(s) như hình bên dưới:

phan tich hoi quy da bien trong spss 02 luanvanbeta

Bước 3: Nhấp vào tab Statistics… và mở một cửa sổ mới. Trong hộp Regression Coefficients, tích chọn Estimates, Confidence intervals. Trong hộp Residuals tích chọnDurbin-Watson. Đồng thời kiểm tra để đảm bảo Model fit, Descriptives, Collinearity diagnostics đã được tích chọn. Sau đó bấm vào Continue.

phan tich hoi quy da bien trong spss 03 luanvanbeta

Bước 4: Bấm vào tab Plots… tab để hiển thị biểu đồ phân tán cho phần dư. Từ hộp bên trái chuyển ZRESID vào hộp Y và ZPRED vào hộp X. Nhấp vào ContinueOK. Trong hộp Standardized residual plots, hãy tích chọn HistogramNormal probability plot.

Bước 5: Kết quả sẽ xuất hiện trong cửa sổ đầu ra:

phan tich hoi quy da bien trong spss 01 luanvanbeta

Hướng dẫn đọc kết quả chạy hồi quy đa biến trong SPSS

doc ket qua phan tich hoi quy da bien trong spss 01

Bảng đầu tiên trong cửa sổ đầu ra hiển thị số liệu thống kê mô tả (giá trị trung bình, độ lệch chuẩn và số lượng quan sát) cho các biến của chúng ta bao gồm: happiness (mức độ hạnh phúc), depression (mức độ trầm cảm), stress (mức độ căng thẳng) và age (độ tuổi).

doc ket qua phan tich hoi quy da bien trong spss 01

Bảng thứ hai cho thấy mối tương quan giữa các biến.

Hệ số tương quan Pearson cho thấy mối quan hệ nghịch chiều và có ý nghĩa thống kê giữa mức độ hạnh phúc và mức độ trầm cảm, [r(99) = -.313, p = 0,001]. Khi mức độ trầm cảm tăng lên, mức độ hạnh phúc sẽ giảm đi. Mặt khác, bảng cho thấy mối quan hệ tích cực và không có ý nghĩa thống kê giữa mức độ hạnh phúc và mức độ căng thẳng, [r(99) = 0,076, p = 0,227]. Cuối cùng, bài kiểm tra cho thấy mối quan hệ tích cực và không có ý nghĩa thống kê giữa mức độ hạnh phúc và tuổi tác, [r(99) = 0,077, p = 0,225].

doc ket qua phan tich hoi quy da bien spss 03 luanvanbeta

Bảng sau đây từ đầu ra cho thấy những biến chúng tôi đã sử dụng (phụ thuộc và độc lập) và phương thức (Enter).

doc ket qua phan tich hoi quy da bien trong spss 04 luanvanbeta

Bảng sau đây trình bày tóm tắt Mô hình – Hệ số tương quan Pearson R, R-square. Bình phương R đã điều chỉnh, sai số chuẩn của ước tính và thống kê Durbin-Watson.

Bình phương R cho biết phần trăm phương sai của biến phụ thuộc giải thích được bằng các biến độc lập. Do đó, R 2 = 0,124, chỉ ra rằng chỉ 12,40% sự khác biệt về mức độ hạnh phúc là do mức độ trầm cảm, mức độ căng thẳng và tuổi tác.

Thống kê Durbin-Watson cho thấy liệu có hiện tượng tự tương quan trong mô hình hay không. Để làm rõ, nguyên tắc chung là thống kê DW xấp xỉ 2,00 và không có hiện tượng tự tương quan. Theo Field (2009) , các giá trị từ 1 đến 3 được chấp nhận cho thống kê DW và không có hiện tượng tự tương quan. Vì trong ví dụ của chúng ta, thống kê DW là 1,193 nên chúng ta kết luận rằng không có hiện tượng tự tương quan.

doc ket qua phan tich hoi quy da bien trong spss 05 luanvanbeta

Bảng tiếp theo hiển thị kết quả ANOVA. Giá trị P (cột Sig.) phải thấp hơn 0,05 để kết quả có ý nghĩa thống kê nên kết quả ANOVA có ý nghĩa, F(3, 95) = 4,50, p = 0,005.

doc ket qua phan tich hoi quy da bien 06 luanvanbeta

Giá trị P hiển thị Sig. Nếu p > 0,05 thì biến độc lập không dự đoán đáng kể biến phụ thuộc và ngược lại.

Bảng cho thấy mức độ trầm cảm là p = 0,001 < 0,05, do đó mức độ trầm cảm dự báo đáng kể mức độ hạnh phúc. Đối với mức độ căng thẳng, p = 0,314 > 0,05, do đó, căng thẳng không dự đoán đáng kể mức độ hạnh phúc. Và cuối cùng, đối với mức độ tuổi tác, p = 0,195 > 0,05, do đó tuổi tác không dự đoán đáng kể mức độ hạnh phúc.

Unstandardized coefficients (Các hệ số không được chuẩn hóa) là các hệ số ‘thô’ được tạo ra bằng phân tích hồi quy khi phân tích được thực hiện trên các biến ban đầu, không được chuẩn hóa. Không giống như standardized coefficients (các hệ số được tiêu chuẩn hóa) là các hệ số không có đơn vị được chuẩn hóa, hệ số không được tiêu chuẩn hóa có các đơn vị và thang đo ‘thực tế’. Nó biểu thị mức độ thay đổi của biến phụ thuộc Y do thay đổi 1 đơn vị biến độc lập X.

Trong ví dụ của chúng ta, hệ số B không được tiêu chuẩn hóa cho chứng trầm cảm là âm, vì vậy chúng ta có thể nói rằng mức độ trầm cảm dự đoán tiêu cực về mức độ hạnh phúc. Nói cách khác, nếu mức độ trầm cảm tăng lên một đơn vị thì mức độ hạnh phúc sẽ giảm đi 0,145 đơn vị.

Trên đây, Luận Văn Beta đã cùng bạn đọc tìm hiểu các nội dung liên quan đến hồi quy đa biến là gì cũng như cách thực hiện chạy hồi quy đa biến và đọc kết quả hồi quy đa biến trong SPSS. Hy vọng với những chia sẻ này sẽ giúp ích cho bạn trong quá trình thực hành phân tích hồi quy đa biến trong SPSS. Nếu bạn đang gặp vấn đề cần hỗ trợ, hãy liên hệ với đội ngũ chạy SPSS thuê của chúng tôi tại: https://luanvanbeta.com/dich-vu-xu-ly-so-lieu-spss/

5/5 - (1 bình chọn)
Theo dõi
Thông báo của
guest
0 Bình luận
Phản hồi nội tuyến
Xem tất cả bình luận