Xu Hướng 11/2022 # Hướng Dẫn Thực Hành Cách Phân Tích Hồi Quy Đa Biến / 2023 # Top 12 View | Channuoithuy.edu.vn

Xu Hướng 11/2022 # Hướng Dẫn Thực Hành Cách Phân Tích Hồi Quy Đa Biến / 2023 # Top 12 View

Bạn đang xem bài viết Hướng Dẫn Thực Hành Cách Phân Tích Hồi Quy Đa Biến / 2023 được cập nhật mới nhất trên website Channuoithuy.edu.vn. Hy vọng những thông tin mà chúng tôi đã chia sẻ là hữu ích với bạn. Nếu nội dung hay, ý nghĩa bạn hãy chia sẻ với bạn bè của mình và luôn theo dõi, ủng hộ chúng tôi để cập nhật những thông tin mới nhất.

Nhóm MBA Bách Khoa hướng dẫn thực hành cách phân tích hồi quy đa biến SPSS. Đồng thời giải thích chi tiết ý nghĩa của kết quả hồi quy

Tập tin thực hành có thể lấy ở đây https://phantichspss.com/filefordownload/phantichspss.sav

Thực hành cách phân tích hồi quy đa biến

Chọn nhân tố độc lập và phụ thuộc vào các ô bên phải. Cụ thể bài ví dụ này có 6 nhân tố độc lập TINCAY, DAPUNG, DAMBAO, CAMTHONG, HUUHINH, MINHBACH sẽ được đưa vào ô Independent(s) và 1 nhân tố phụ thuộc HAILONG sẽ được đưa vào ô Dependent. ( đưa vào ô bằng cách bấm chọn biến và ấn nút mũi tên)

Xong bấm vào Statistics chọn Collinearity diagnostics ( để tính ra hệ số VIF – hệ số phóng đại phương sai- để đánh giá hiện tượng đa cộng tuyến)

Xong bấm OK, kết quả sẽ ra như sau:

Cách giải thích kết quả hồi quy đa biến SPSS

Nhìn vào Bảng 1 hình trên, dùng để đánh giá độ phù hợp của mô hình hồi quy đa biến, hệ số R bình phương hiệu chỉnh Adjusted R Square là 0.609. Nghĩa là 60.9% biến thiên của biến phụ thuộc HÀI LÒNG được giải thích bởi 6 nhân tố độc lập. Điều này cho thấy mô hình hồi quy tuyến tính này phù hợp với tập dữ liệu của mẫu ở mức 60.9%, tức là các biến độc lập giải thích được 60.9% biến thiên của biến phụ thuộc sự HÀI LÒNG.

Nhìn vào Bảng 2 hình trên, kiểm định giả thuyết về độ phù hợp với tổng thể của mô hình, giá trị F=26.746 với sig.=0.000 <5%. Chứng tỏ R bình phương của tổng thể khác 0. Đồng nghĩa với việc mô hình hồi quy tuyến tính xây dựng được là phù hợp với tổng thể (chi tiết hơn là R bình phương tổng thể ta không thể tính cụ thể được, nhưng ta biết chắc chắn sẽ khác 0, mà khác 0 thì chứng tỏ là các biến độc lập có tác động đến biến phụ thuộc)

Phần nâng cao: kiểm tra các giả định hồi quy

Mô hình hồi quy tuyến tính bằng phương pháp OSL được thực hiện với một số giả định và mô hình chỉ thực sự có ý nghĩa khi các giả định này được đảm bảo. Do vậy để đảm bảo cho độ tin cậy của mô hình, việc dò tìm sự vi phạm các giả định là cần thiết. Giả định đa cộng tuyến đã đề cập ở trên, phần này sẽ làm về giả định phân phối chuẩn của phần dư và giả định liên hệ tuyến tính.

Trong bảng hồi quy, nhấn vào nút Plots như hình bên dưới. Đưa giá trị *zresid vào ô Y, *zpred vào ô X để ra được biểu đồ *zresid by *zpred Scatterplot. Check vào Histogram và Normal Probability Plot để ra được biểu đồ Histogram và Normal P-P Plot

Kết quả hồi quy sẽ có thêm 3 biểu đồ sau.

1. Biều đồ histogram: giả định phân phối chuẩn của phần dư

Nhìn vào đây ta thấy phần dư chuẩn hóa phân bố theo hình dạng của phân phối chuẩn. Có một đường cong hình chuông trên hình là đường phân phối chuẩn, ta thấy biểu đồ tần số histogram tương ứng với đường cong hình chuông đó. Thêm nữa, giá trị trung bình mean là -1.15E-15 xấp xỉ =0, và độ lệch chuẩn bằng 0.969 xấp xỉ =1 càng khẳng định thêm phần dư chuẩn hóa tuân theo phân phối chuẩn. (Lưu ý về mặt lý thuyết, phân phối chuẩn là phân phối có trung bình =0 và phương sai bằng 1)

2. Biều đồ Normal P-P Plot of Regression Standardized Residual : giả định phân phối chuẩn của phần dư

Xem biểu đồ Normal P-P Plot bên dưới, các trị số quan sát và trị số mong đợi đều nằm gần trên đường chéo chứng tỏ phần dư chuẩn hóa có phân phối chuẩn. Kiểm định bằng Biểu đồ P- P Plot thể hiện những giá trị của các điểm phân vị của phân phối của biến theo các phân vị của phân phối chuẩn. Quan sát mức độ các điểm thực tế, tập trung sát đường thẳng kỳ vọng, cho thấy tập dữ liệu nghiên cứu là tốt, phần dư chuẩn hóa có phân phối gần sát phân phối chuẩn

3. Biều đồ Scatterplot :giả định liên hệ tuyến tính

Về giả định liên hệ tuyến tính, phương pháp được sử dụng là biểu đồ phân tán Scatterplot. Nhìn vào biểu đồ ta thấy phần dư chuẩn hóa (Regression Standardized Residual) không thay đổi theo một trật tự nào đối với giá trị dự đoán chuẩn hóa (Regression Standardized Predicted Value). Do đó giả định về liên hệ tuyến tính không bị vi phạm. Điều này có nghĩa là như thế này: giá trị dự đoán chuẩn hóa chính là giá trị chuẩn hóa của biến phụ thuộc, còn phần dư chuẩn hóa là giá trị chuẩn hóa của phần dư. Ta thấy biến phụ thuộc không có liên hệ gì với lại phần dư.

Các ghi chú cần thiết cho việc chạy hồi quy SPSS

Các nhân tố được trích ra trong phân tích nhân tố được sử dụng cho phân tích hồi quy đa biến để kiểm định mô hình nghiên cứu và các giả thuyết kèm theo. Các kiểm định giả thuyết thống kê đều áp dụng mức ý nghĩa là 5%. Phương pháp tạo ra nhân số đại diện của các nhân tố ở đây: https://phantichspss.com/cach-tinh-gia-tri-nhan-so-dai-dien-cho-nhan-to-sau-khi-phan-tich-efa.html

-Xử lý/ hiệu chỉnh số liệu khảo sát để chạy ra kết quả phân tích nhân tố hội tụ,phân tích hồi quy hồi quy có ý nghĩa thống kê. – Tư vấn mô hình/bảng câu hỏi/ traning trực tiếp về phân tích hồi quy, nhân tố, cronbach alpha… trong SPSS, và mô hình SEM, CFA, AMOS

Hồi Quy Ols Đa Biến Stata Kiểm Tra Sai Phạm / 2023

Để thuận tiện cho việc đọc kết quả, các bạn nên sử dụng chung bộ dữ liệu của chúng tôi, mở phần mềm stata ra và nhập lệnh sử dụng dữ liệu như sau:

use https://solieu.vip/data/reg01.dta

Bây giờ chúng ta đang sử dụng bộ dữ liệu chúng tôi với các biến như sau: income, educ, jobexp, race

Để hồi quy đa biến trên phần mềm stata chúng ta sử dụng lệnh reg hay regress

reg income educ jobexp race

Ta có, income là biến phụ thuộc các biến còn lại là biến độc lập. Ta nhận kết quả như sau:

Như thế là chúng ta đã có kết quả của việc hồi quy bình phương nhỏ nhất ( ols) cho đa biến này rồi. Quá đơn giản phải không các bạn.

Cách kiểm tra sai phạm

a, Mức độ phù hợp của mô hình

Chúng ta xem xét trong bảng kết quả hồi quy ở trên, xét chỉ tiêu R-Squared. Đây chính mức độ giải biến phụ thuộc được giải thích bởi các biến độc lập là 84,54%. Chỉ số R2 này tương đối tốt vì chỉ riêng có 3 biến độc lập là educ, jobexp, race mà đã giải thích đến 85%, còn lại 15% là do các biến khác.

Chú ý: Khi chạy mô hình hồi quy thì chỉ số R-Squared rất quan trọng, nên chúng tôi rút ra được một số kinh nghiệm như sau:

b, Kiểm tra hiện tượng đa cộng tuyến

Đa cộng tuyến là gì: Đa cộng tuyến là hiện tượng các biến độc lập có mối tương quan rất mạnh với nhau. Mô hình hồi quy xảy ra hiện tượng đa cộng tuyến sẽ khiến nhiều chỉ số bị sai lệch, dẫn đến kết quả của việc phân tích định lượng không còn mang lại nhiều ý nghĩa.

Để kiểm tra đa cộng tuyến trong stata, ta dùng lệnh: vif sau khi hồi quy

Định nghĩa VIF ( hệ số phóng đại phương sai): Trong thống kê , hệ số lạm phát phương sai ( VIF ) là tỷ lệ phương sai trong một mô hình có nhiều số hạng, chia cho phương sai của một mô hình chỉ có một thuật ngữ. [1] Nó định lượng mức độ nghiêm trọng của đa cộng tuyến trong phân tích hồi quy bình phương nhỏ nhất bình thường . Nó cung cấp một chỉ số đo lường mức độ chênh lệch (bình phương độ lệch chuẩn của ước tính) của một hệ số hồi quy ước tính được tăng lên do cộng tuyến.

c, Kiểm định giả thuyết thống kê (Hypothesis testing)

Chúng ta nghe cái tên thì thấy nó chung chung, kho hiểu dịch nôm na cho dễ hiểu đó là kiểm định các biến không đồng thời bằng không.

Kiểm định giả thuyết thống kê (statistical hypothesis test) là phương pháp ra quyết định sử dụng dữ liệu, hoặc từ thí nghiệm hoặc từ nghiên cứu quan sát (observational study)(không có kiểm soát). Trong thống kê (statistics), một kết quả được gọi là đủ độ tin cậy mang tính thống kê (statistically significant) nếu nó ít có khả năng diễn ra theo một ngưỡng xác suất cho trước (ví dụ 5% hay 10%). Cụm từ kiểm định độ tin cậy (“test of significance”) được đưa ra bởi Ronald Fisher.

Có 2 định nghĩa như trên các bạn muốn hiểu theo cách nào thì hiểu, còn phần kiểm định hypothesis test này thì đơn giản vô cùng với stata, ta dùng lệnh test

Cách đặt giả thuyết:

H0: các biến không đồng thời bằng không

H1: các biến đồng thời bằng không

Ta có kết quả là chấp nhận H0, bác bỏ H1, tức là hai biến educ và jobexp không đồng thời bằng 0.

chúng ta kiểm tra cho các cặp biến còn lại, tương tự như thế

d. Kiểm định phương sai phần dư thay đổi.

Đây là một kiểm định cực kỳ quan trọng nên bất cứ mô hình hồi quy nào cũng cần phải có. Để kiểm định phương sai phần dư thây đổi ta dùng lệnh hettest sau hồi quy.

Ta đặt giả thuyết như sau:

H0: có hiện tượng phương sai phần dư thay đổi

H1: Không có hiện tượng phươn sai phần dư thay đổi

Trong mô hình hồi quy ols đa biến chúng ta phải kiểm tra hết tất cả các khuyêt tật hay còn gọi là sai phạm trong mô hình hồi quy, nếu mô hình có khuyết tật thì chúng ta phải khăc phục nó, trước khi sử dụng mô hình.

Note: Thế nào cũng có các bạn hỏi, tại sao nói kiểm tra hết các khuyết tật mà không thấy kiểm tra hiện tượng tự tương quan mô hình, hay tự tương quạn phần dư … do bộ dữ liệu của chúng tôi không có dữ liệu thời gian nên chúng ta không thể kiểm tra tự tương quan. Nói cách khác, khi mô hình có chuỗi thời gian thì chúng ta mới có kiểm tra tự tương quan.

Hướng Dẫn Hồi Quy Mô Hình Tobit Trên Stata / 2023

Mô hình quỹ đạo, còn được gọi là mô hình hồi quy kiểm duyệt, được thiết kế để ước tính mối quan hệ tuyến tính giữa các biến khi có kiểm duyệt trái hoặc phải trong biến phụ thuộc (còn được gọi là kiểm duyệt từ bên dưới và bên trên). Kiểm duyệt từ trên diễn ra khi các trường hợp có giá trị ở hoặc trên một ngưỡng nào đó, tất cả đều đảm nhận giá trị của ngưỡng đó, để giá trị thực có thể bằng ngưỡng, nhưng cũng có thể cao hơn. Trong trường hợp kiểm duyệt từ bên dưới, các giá trị nằm ở hoặc dưới một số ngưỡng được kiểm duyệt.

Xin lưu ý: Mục đích của trang này là hiển thị cách sử dụng các lệnh phân tích dữ liệu khác nhau. Nó không bao gồm tất cả các khía cạnh của quá trình nghiên cứu mà các nhà nghiên cứu dự kiến ​​sẽ làm. Đặc biệt, nó không bao gồm việc làm sạch và kiểm tra dữ liệu, xác minh các giả định, chẩn đoán mô hình và phân tích theo dõi tiềm năng.

Phương pháp phân tích bạn có thể xem xét

Hồi quy Tobit, trọng tâm của trang này.

Đọc xong mấy cái định nghĩa và giả thuyết quá đau đầu,vì vậy ứng dụng của mô hình này là giới hạn biến phụ thuộc trong khoang (a;b) và là biến liên tục có phân phối chuẩn.

Hồi quy tobit

Trước tiên chúng ta hãy sử dụng bộ dự liệu sau để hồi quy

use https://stats.idre.ucla.edu/stat/ stata/dae/tobit.dta, clear

Lệnh hồi quy:

tobit apt read math prog, ul(800)

ta được kết quả hồi quy tobit như sau:

Tùy theo bộ dữ liệu mà chúng ta lấy giới hạn trái(ll) hoặc giới hạn phải(ul).

Kiểm tra phân phối chuẩn của biến apt

histogram apt, normal bin(10) xline(800)

Đồng thời chúng ta dễ dàng tìm ra được giới hạn phải của mô hình.

Kiểm định tương quan

Tiếp theo chúng ta kiểm định tương quan giữa các biến độc lập

Kiểm tra tương quan giữa ước lượng và quan sát

Bàn luận về kết quả hồi quy mô hình tobit trên.

Ta thấy p-value của mô hình <0.05, vì vậy mô hình có ý nghĩa thống kê.

Ta thấy rằng khi read tăng lên 1 đơn vị thì apt tăng lên đến 2.8 đơn vị.

Còn khi tăng math lên 1 đơn vị thì apt tăng thêm 6.1 đơn vị

Khi prog tăng lên 1 hạng thì làm giảm apt xuống 22.7 đơn vị

Ngoài ra chúng ta, có thể lấy thêm giá trị độ nhạy, để mô hình dễ dàng biện luận hơn.

Hướng dẫn hồi quy mô hình tobit trên stata Hướng dẫn hồi quy nhị phân binary logistic trên spss Hướng dẫn hồi quy mô hình tobit trên stata

Mô Hình Đa Biến: Phương Pháp Phân Tích Monte Carlo / 2023

Mô hình đa biến: Phương pháp phân tích Monte Carlo

Các nhà phân tích nghiên cứu sử dụng các mô hình đa biến để dự báo kết quả đầu tư để hiểu các khả năng xung quanh sự tiếp xúc đầu tư của họ và giảm thiểu rủi ro tốt hơn. Phân tích Monte Carlo là một kỹ thuật mô hình đa biến cụ thể cho phép các nhà nghiên cứu chạy nhiều thử nghiệm và xác định tất cả các kết quả tiềm năng của một sự kiện hoặc đầu tư. Việc chạy mô hình Monte Carlo tạo ra phân bố xác suất hoặc đánh giá rủi ro cho một sự đầu tư hoặc sự kiện cụ thể đang được xem xét. Bằng cách so sánh kết quả đúng sai với rủi ro, người quản lý có thể quyết định xem có tiến hành một số dự án hoặc đầu tư nhất định hay không.

Mô hình đa biến

Phân tích Monte Carlo

Phân tích Monte Carlo được đặt theo tên của công quốc nổi tiếng bởi các sòng bạc của nó. Với các trò chơi may rủi, tất cả các kết quả có thể có và xác suất được biết, nhưng với hầu hết các khoản đầu tư, tập hợp các kết quả trong tương lai là không xác định. Việc phân tích kết quả và xác suất mà chúng sẽ xảy ra là tùy thuộc vào nhà phân tích. Trong mô hình Monte Carlo, nhà phân tích chạy nhiều thử nghiệm (thường là hàng nghìn) để xác định tất cả các kết quả có thể xảy ra và xác suất mà chúng sẽ xảy ra.

Tạo mô hình

Sau khi được thiết kế, việc thực hiện mô hình Monte Carlo yêu cầu một công cụ sẽ chọn ngẫu nhiên các giá trị hệ số bị ràng buộc bởi một số điều kiện nhất định. Bằng cách chạy một số thử nghiệm với các biến bị ràng buộc bởi xác suất độc lập của riêng chúng, một nhà phân tích tạo ra một phân phối bao gồm tất cả các kết quả có thể và xác suất mà chúng sẽ xảy ra. Có nhiều máy tạo số ngẫu nhiên trên thị trường. Hai công cụ phổ biến nhất để thiết kế và thực hiện các mô hình Monte Carlo là @Risk và Crystal Ball. Cả hai điều này có thể được sử dụng làm bổ trợ cho bảng tính và cho phép lấy mẫu ngẫu nhiên vào các mô hình bảng tính đã được thiết lập.

Để chọn phân phối chính xác cho một biến, người ta phải hiểu từng phân phối có thể có sẵn. Ví dụ, một trong những phổ biến nhất là một phân phối bình thường, còn được gọi là một đường cong chuông. Trong một phân bố chuẩn, tất cả các lần xuất hiện đều được phân bố đều nhau (đối xứng) xung quanh giá trị trung bình. Trung bình là sự kiện có thể xảy ra nhất. Hiện tượng tự nhiên, chiều cao của người dân và lạm phát là một số ví dụ về đầu vào thường được phân phối.

Trong phân tích Monte Carlo, một bộ tạo số ngẫu nhiên chọn một giá trị ngẫu nhiên cho mỗi biến (trong các ràng buộc do mô hình thiết lập) và tạo phân phối xác suất cho tất cả các kết quả có thể có. Độ lệch chuẩn của xác suất đó là một số liệu thống kê biểu thị khả năng kết quả thực tế được ước tính sẽ là một cái gì đó khác với sự kiện trung bình hoặc có thể xảy ra nhất. Giả sử phân phối xác suất thường được phân phối, khoảng 68% giá trị sẽ nằm trong một độ lệch chuẩn của trung bình, khoảng 95% giá trị sẽ nằm trong hai độ lệch chuẩn và khoảng 99,7% sẽ nằm trong ba độ lệch chuẩn của giá trị trung bình. Điều này được gọi là “quy tắc 68-95-99.7” hoặc “quy tắc thực nghiệm”.

Ví dụ

Chúng ta hãy lấy ví dụ hai phân phối xác suất riêng biệt, phân bố thường được phân phối bắt nguồn từ phân tích nhân tố ngẫu nhiên hoặc từ nhiều kịch bản của một mô hình Monte Carlo.

Trong hai phân phối xác suất, cả hai đều có cùng giá trị nhưng có giá trị chuẩn là 100, trong khi giá trị kia có độ lệch chuẩn là 200. Điều này có nghĩa là trong phân tích kịch bản đầu tiên, có 68% khả năng kết quả sẽ là số từ 100 đến 300, trong khi ở mô hình thứ hai có 68% cơ hội kết quả sẽ là từ 0 đến 400. Với tất cả mọi thứ bằng nhau, cái có độ lệch chuẩn là 100 có kết quả điều chỉnh rủi ro tốt hơn. Ở đây, bằng cách sử dụng Monte Carlo để lấy được các phân phối xác suất, phân tích đã cho một nhà đầu tư một cơ sở để so sánh hai sáng kiến ​​đó.

Phân tích Monte Carlo cũng có thể giúp xác định liệu một số sáng kiến ​​nhất định có nên được thực hiện bằng cách xem xét rủi ro và trả lại hậu quả của việc thực hiện một số hành động nhất định hay không. Giả sử chúng ta muốn đặt nợ vào khoản đầu tư ban đầu của mình.

Phần kết luận

Phân tích Monte Carlo không chỉ được thực hiện bởi các chuyên gia tài chính mà còn bởi nhiều doanh nghiệp khác. Nó là một công cụ ra quyết định tích hợp khái niệm rằng mọi quyết định sẽ có một số tác động đến rủi ro tổng thể. Mỗi cá nhân và tổ chức đều có các dung sai rủi ro / trả lại khác nhau. Như vậy, điều quan trọng là hồ sơ rủi ro / trả về của bất kỳ khoản đầu tư nào được tính toán và so sánh với dung sai rủi ro.

Các phân bố xác suất được tạo ra bởi một mô hình Monte Carlo tạo ra một bức tranh về rủi ro. Hình ảnh là một cách dễ dàng để truyền tải ý tưởng cho người khác, chẳng hạn như cấp trên hoặc nhà đầu tư tiềm năng. Do những tiến bộ trong phần mềm, các mô hình Monte Carlo rất phức tạp có thể được thiết kế và thực thi bởi bất kỳ ai có quyền truy cập vào máy tính cá nhân.

Thông tin được cập nhập bởi những nhà đầu tư có nhiều kinh nghiệm của Công ty BBM Trade.

Cập nhật thông tin chi tiết về Hướng Dẫn Thực Hành Cách Phân Tích Hồi Quy Đa Biến / 2023 trên website Channuoithuy.edu.vn. Hy vọng nội dung bài viết sẽ đáp ứng được nhu cầu của bạn, chúng tôi sẽ thường xuyên cập nhật mới nội dung để bạn nhận được thông tin nhanh chóng và chính xác nhất. Chúc bạn một ngày tốt lành!