Sự khác biệt chính giữa phân loại và cây hồi quy là trong phân loại, các biến phụ thuộc được phân loại và không có thứ tự trong khi trong hồi quy, các biến phụ thuộc là các giá trị nguyên liên tục hoặc có thứ tự.
Phân loại và hồi quy là các kỹ thuật học tập để tạo ra các mô hình dự đoán từ dữ liệu thu thập được. Cả hai kỹ thuật đều được trình bày bằng đồ thị dưới dạng cây phân loại và hồi quy, hay đúng hơn là lưu đồ với sự phân chia dữ liệu sau mỗi bước, hay đúng hơn là “nhánh” trong cây. Quá trình này được gọi là phân vùng đệ quy. Các lĩnh vực như Khai thác mỏ sử dụng các kỹ thuật phân loại và học hồi quy này. Bài viết này tập trung vào cây phân loại và cây hồi quy.
Phân loại là gì?
Phân loại là một kỹ thuật được sử dụng để đi đến một giản đồ thể hiện việc tổ chức dữ liệu bắt đầu bằng một biến tiền thân. Các biến phụ thuộc là thứ phân loại dữ liệu.
Hình 01: Khai thác dữ liệu
Cây phân loại bắt đầu với biến độc lập, phân nhánh thành hai nhóm được xác định bởi các biến phụ thuộc hiện có. Nó có nghĩa là làm sáng tỏ các phản hồi dưới dạng phân loại do các biến phụ thuộc mang lại.
Hồi quy là gì
Hồi quy là một phương pháp dự đoán dựa trên giá trị đầu ra số giả định hoặc đã biết. Giá trị đầu ra này là kết quả của một chuỗi phân vùng đệ quy, với mỗi bước có một giá trị số và một nhóm biến phụ thuộc khác phân nhánh sang một cặp khác chẳng hạn như thế này.
Cây hồi quy bắt đầu với một hoặc nhiều biến tiền thân và kết thúc bằng một biến đầu ra cuối cùng. Các biến phụ thuộc là các biến số liên tục hoặc rời rạc.
Sự khác biệt giữa Phân loại và Hồi quy là gì?
Phân loại so với Hồi quy |
|
Mô hình cây trong đó biến mục tiêu có thể nhận một bộ giá trị rời rạc. | Mô hình cây trong đó biến mục tiêu có thể nhận các giá trị liên tục, thường là số thực. |
Biến phụ thuộc | |
Đối với cây phân loại, các biến phụ thuộc là phân loại. | Đối với cây hồi quy, các biến phụ thuộc là số. |
Giá trị | |
Có một lượng giá trị không theo thứ tự đã đặt. | Có các giá trị rời rạc nhưng có thứ tự hoặc các giá trị không rõ ràng. |
Mục đích xây dựng | |
Mục đích của việc xây dựng cây hồi quy là để phù hợp hệ thống hồi quy với từng nhánh xác định theo cách mà giá trị đầu ra mong đợi xuất hiện. | Một cây phân loại phân nhánh được xác định bởi một biến phụ thuộc có nguồn gốc từ nút trước đó. |
Tóm tắt - Phân loại so với Hồi quy
Cây hồi quy và phân loại là các kỹ thuật hữu ích để vạch ra quá trình dẫn đến một kết quả được nghiên cứu, cho dù là trong phân loại hay một giá trị số. Sự khác biệt giữa cây phân loại và cây hồi quy là biến phụ thuộc của chúng. Cây phân loại có các biến phụ thuộc được phân loại và không có thứ tự. Cây hồi quy có các biến phụ thuộc là các giá trị liên tục hoặc các giá trị toàn bộ có thứ tự.