Το πρόβλημα του ετεροσκεδασμού στη στατιστική
- wooded glade
- Δημοσιεύσεις: 29284
- Εγγραφή: 02 Απρ 2018, 17:04
Το πρόβλημα του ετεροσκεδασμού στη στατιστική
Μπορεί να μου το εξηγήσει κάποιος αυτό ;
Βασικά πρόκειται για μία περίπτωση γραμμικής παλινδρόμησης. Η τυχαία μεταβλητή Y συνδέεται με την στάνταρ μεταβλητή X με μία κατά προσέγγιση γραμμική σχέση y = A.X + B και θέλουμε να βρούμε το Α και το Β.
Ο τύπος των ελαχίστων τετραγώνων μας λύνει εύκολα αυτό το πρόβλημα αλλά υπάρχουν και παράξενα.
Παράδειγμα: Θέλουμε να βρούμε τη σχέση που συνδέει το ετήσιο εισόδημα με τα χρόνια σπουδών.
Αν δημιουργήσουμε ένα στατιστικό δείγμα θα παρατηρήσουμε ότι σ' αυτούς με πολύ λίγα χρόνια σπουδών (μόνο δημοτικό πχ) το εισόδημα είναι μικρό με μικρή στατιστική απόκλιση - ένας του δημοτικού μόνο από θαύμα θα έχει μεγάλο εισόδημα. Αλλά σ' αυτούς με πολλά χρόνια σπουδών -πχ 20- το μέσο εισόδημα είναι πιό μεγάλο αλλά και το εύρος είναι μεγάλο, προφνώς διότι άλλοι τα καταφέρνουν να γίνουν ceo της Bayersdorf Γερμανίας και άλλοι όχι ή μπορεί να έχουν προβλήματα υγείας που τους εμποδίζουν ή και πολλά άλλα.
Έτσι στα λίγα χρόνια σπουδών η διασπορά των τιμών της μεταβλητής y είναι μικρή και στα πολλά χρόνια σπουδών είναι μεγάλη. Υπάρχει ετεροσκεδασμός.
Αν κατασκευάσουμε την ευθεία Y = A.X + B με τον απλό τύπο των ελαχίστων τετραγώνων χωρίς να λάβουμε υπ' όψιν τον ετεροσκεδασμό θα βγει μιά ανερχόμενη ευθεία που είναι μάλλον υπέρ το δέον ανερχόμενη.
Ο ίδιος τύπος με στατιστικά βάρη για κάθε ζεύγος τιμών (Χi, Yi) του δείγματος διορθώνει την κατάσταση.
Ο τύπος για τα Α, Β είναι ο ίδιος με τον απλό, συν τα στατιστικά βάρη όπως δείχνει εδώ:
https://www.chegg.com/homework-help/que ... -q40449400
Αλλά πως επιλέγω τα ειδικά βάρη Wi ;
Μπορεί κάποιος να εξηγήσει με απλό τρόπο ;
Βασικά πρόκειται για μία περίπτωση γραμμικής παλινδρόμησης. Η τυχαία μεταβλητή Y συνδέεται με την στάνταρ μεταβλητή X με μία κατά προσέγγιση γραμμική σχέση y = A.X + B και θέλουμε να βρούμε το Α και το Β.
Ο τύπος των ελαχίστων τετραγώνων μας λύνει εύκολα αυτό το πρόβλημα αλλά υπάρχουν και παράξενα.
Παράδειγμα: Θέλουμε να βρούμε τη σχέση που συνδέει το ετήσιο εισόδημα με τα χρόνια σπουδών.
Αν δημιουργήσουμε ένα στατιστικό δείγμα θα παρατηρήσουμε ότι σ' αυτούς με πολύ λίγα χρόνια σπουδών (μόνο δημοτικό πχ) το εισόδημα είναι μικρό με μικρή στατιστική απόκλιση - ένας του δημοτικού μόνο από θαύμα θα έχει μεγάλο εισόδημα. Αλλά σ' αυτούς με πολλά χρόνια σπουδών -πχ 20- το μέσο εισόδημα είναι πιό μεγάλο αλλά και το εύρος είναι μεγάλο, προφνώς διότι άλλοι τα καταφέρνουν να γίνουν ceo της Bayersdorf Γερμανίας και άλλοι όχι ή μπορεί να έχουν προβλήματα υγείας που τους εμποδίζουν ή και πολλά άλλα.
Έτσι στα λίγα χρόνια σπουδών η διασπορά των τιμών της μεταβλητής y είναι μικρή και στα πολλά χρόνια σπουδών είναι μεγάλη. Υπάρχει ετεροσκεδασμός.
Αν κατασκευάσουμε την ευθεία Y = A.X + B με τον απλό τύπο των ελαχίστων τετραγώνων χωρίς να λάβουμε υπ' όψιν τον ετεροσκεδασμό θα βγει μιά ανερχόμενη ευθεία που είναι μάλλον υπέρ το δέον ανερχόμενη.
Ο ίδιος τύπος με στατιστικά βάρη για κάθε ζεύγος τιμών (Χi, Yi) του δείγματος διορθώνει την κατάσταση.
Ο τύπος για τα Α, Β είναι ο ίδιος με τον απλό, συν τα στατιστικά βάρη όπως δείχνει εδώ:
https://www.chegg.com/homework-help/que ... -q40449400
Αλλά πως επιλέγω τα ειδικά βάρη Wi ;
Μπορεί κάποιος να εξηγήσει με απλό τρόπο ;
δεν είναι όλα κρού-σμα-τα
-
- Παραπλήσια Θέματα
- Απαντήσεις
- Προβολές
- Τελευταία δημοσίευση
-
-
Νέα δημοσίευση Τι ακριβώς είναι η παχυσαρκία; Ένα πρόβλημα κοινωνικό ή ένα πρόβλημα ψυχολογικό;
από Antipnevma » 17 Οκτ 2024, 12:35 » σε Ψυχολογία - 122 Απαντήσεις
- 4225 Προβολές
-
Τελευταία δημοσίευση από vantono
11 Νοέμ 2024, 01:21
-
-
- 65 Απαντήσεις
- 5643 Προβολές
-
Τελευταία δημοσίευση από Antares
31 Αύγ 2023, 16:58
-
- 0 Απαντήσεις
- 498 Προβολές
-
Τελευταία δημοσίευση από Jafar
31 Μαρ 2024, 01:09
-
- 0 Απαντήσεις
- 127 Προβολές
-
Τελευταία δημοσίευση από seismic1
10 Απρ 2025, 23:28