Hồi quy tuyến tính so với Logistic
Trong phân tích thống kê, điều quan trọng là xác định mối quan hệ giữa các biến liên quan đến nghiên cứu. Đôi khi nó có thể là mục đích duy nhất của bản thân phân tích. Một công cụ mạnh mẽ được sử dụng để thiết lập sự tồn tại của mối quan hệ và xác định mối quan hệ là phân tích hồi quy.
Hình thức đơn giản nhất của phân tích hồi quy là hồi quy tuyến tính, trong đó mối quan hệ giữa các biến là mối quan hệ tuyến tính. Theo thuật ngữ thống kê, nó đưa ra mối quan hệ giữa biến giải thích và biến phản hồi. Ví dụ, sử dụng hồi quy, chúng ta có thể thiết lập mối quan hệ giữa giá hàng hóa và mức tiêu thụ dựa trên dữ liệu thu thập từ một mẫu ngẫu nhiên. Phân tích hồi quy sẽ tạo ra một hàm hồi quy của tập dữ liệu, đây là một mô hình toán học phù hợp nhất với dữ liệu có sẵn. Điều này có thể dễ dàng được biểu diễn bằng một biểu đồ phân tán. Hồi quy đồ họa tương đương với việc tìm đường cong phù hợp nhất cho tập dữ liệu đã cho. Hàm của đường cong là hàm hồi quy. Sử dụng mô hình toán học, việc sử dụng hàng hóa có thể được dự đoán với một mức giá nhất định.
Vì vậy, phân tích hồi quy được sử dụng rộng rãi trong dự đoán và dự báo. Nó cũng được sử dụng để thiết lập các mối quan hệ trong dữ liệu thực nghiệm, trong các lĩnh vực vật lý, hóa học, và trong nhiều ngành khoa học tự nhiên và kỹ thuật. Nếu mối quan hệ hoặc hàm hồi quy là một hàm tuyến tính, thì quá trình này được gọi là một hồi quy tuyến tính. Trong biểu đồ phân tán, nó có thể được biểu diễn dưới dạng một đường thẳng. Nếu hàm không phải là sự kết hợp tuyến tính của các tham số, thì hồi quy là phi tuyến tính.
Hồi quy logistic có thể so sánh với hồi quy đa biến và nó tạo ra một mô hình để giải thích tác động của nhiều yếu tố dự báo lên một biến phản hồi. Tuy nhiên, trong hồi quy logistic, biến kết quả cuối cùng nên được phân loại (thường là chia; tức là một cặp kết quả có thể đạt được, như tử vong hoặc sống sót, mặc dù các kỹ thuật đặc biệt cho phép mô hình hóa nhiều thông tin được phân loại hơn). Một biến kết quả liên tục có thể được chuyển đổi thành một biến phân loại, được sử dụng cho hồi quy hậu cần; tuy nhiên, việc thu gọn các biến liên tục theo cách này hầu như không được khuyến khích vì nó làm giảm độ chính xác.
Không giống như trong hồi quy tuyến tính, về phía giá trị trung bình, các biến dự báo trong hồi quy logisistic không bắt buộc phải được kết nối tuyến tính, được phân phối phổ biến hoặc có phương sai bằng nhau trong mỗi cụm. Do đó, mối quan hệ giữa biến dự đoán và biến kết quả không có khả năng là một hàm tuyến tính.
Sự khác biệt giữa hồi quy Logistic và tuyến tính là gì?
• Trong hồi quy tuyến tính, mối quan hệ tuyến tính giữa biến giải thích và biến phản hồi được giả định và các tham số thỏa mãn mô hình được tìm thấy bằng cách phân tích, để đưa ra mối quan hệ chính xác.
• Hồi quy tuyến tính được thực hiện cho các biến định lượng và hàm kết quả là một định lượng.
• Trong hồi quy logistic, dữ liệu được sử dụng có thể là phân loại hoặc định lượng, nhưng kết quả luôn mang tính phân loại.