-
Notifications
You must be signed in to change notification settings - Fork 0
/
k401k.R
102 lines (90 loc) · 3.11 KB
/
k401k.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
rm(list=ls())
# Import package
library(wooldridge)
############ SPIEGAZIONE DATI - DATA EXAMINATION ############
#
data("k401k")
help(k401k)
str(k401k)
#
# Un piano 401k è un conto pensione sponsorizzato dal datore di lavoro.
# Consente a un dipendente di dedicare una percentuale del proprio stipendio
# ante imposte a un conto pensione.
#
# Nel dataset k401k ci sono 1534 imprese
# La variabile prate é la percentuale di lavoratori all'interno dell'azienda
# che sono idonei alla pensione ed hanno un piano attivo
#
# mrate é la misurazione della generositá del piano
# ovvero é l'ammontare medio di contribuzione da parte dell'azienda
# al piano di ogni lavoratore, per ogni dollaro di contributo del lavoratore
#
##########################################
############################### EXERCISES ###########################
########### MEDIA - AVERAGE ############
#
# Calcola la media delle percentuali di partecipazione al piano
# Find the average partecipation rate
mean(k401k$prate)
#
# Calcola la media delle generositá (contribuzione da parte dell'impresa)
# Find the average match rate
mean(k401k$mrate)
#
#######################################
LEVEL-LEVEL
#### INTERPRETAZIONE - INTERPRETATION #####
#
# Stimare l'equazione di regressione semplice e riportare i risultati includendo
# la dimensione del campione ed R quadrato
# Estimate the simple regression equation and report the results along
# with sample size and R-squared
#
# prate^ = B0^ + B1^ * mrate
#
ols <- lm(prate ~ mrate, data=k401k)
summary(ols)
#
# L'intercetta per questo modello é 83.0755 ed il coefficiente mrate é 5.8611
#
## Interpretazione intercetta
# L'intercetta é il valore della variabile dipendente quando la variabile esplicativa é 0
# Quindi quando la misura della generositá é pari a 0
# la percentuale dei lavoratori idonei con un piano attivo é del 83.1%
#
## Interpretazione coefficiente mrate
# All'aumentare di 1 del mrate, la percentuale di prate aumenta del 5.86%
#
## Dimensione del campione
length(k401k$prate)
#
## R quadrato = 0.0747
#
#############################################
####### CALCOLA prate DATA UNA CERTA mrate (é prevedibile?) #########
#### Find the predicted prate when mrate = 3.5. Is this a reasonable prediction?
#
## Trova il valore predetto di prate quando mrate = 3.5
#
hb0 <- coefficients(ols)[1]
hb1 <- coefficients(ols)[2]
res <- hb0 + hb1 * 3.5
res
# Quando mrate é 3.5, prate é predetto 103.5892
#
# É ragionabile come predizione?
# No, perché una percentuale del 103% é assurda
#
# Questa variabile é cosí alta perché stiamo escludendo dal modello tanti
# altri fattori importanti che possono influenzare le decisioni dei lavoratori
#
######################################################################
####### CALCOLA QUANTO LA VARIAZIONE DI prate É SPIEGATA DA mrate (molto?) #######
### How much of the variation in prate is explained by mrate? Is a lot?
#
# Dobbiamo guardare R quadrato
summary(ols)
# In questo modello é 0.0747 ed é un valore bassissimo (0 <= R² <= 1)
# mrate spiega neanche l'un percento della variabilitá di prate
#
##################################################################################