from empiricaldist import Pmf
coin = Pmf()
coin['heads'] = 1/2
coin['tails'] = 1/2
print(coin)

heads    0.5
tails    0.5
dtype: float64

die = Pmf.from_seq([1,2,3,4,5,6])
die

letters = Pmf.from_seq(list('Mississippi'))
letters

print(f"{letters('s')=}")
print(f"{letters('x')=}")

letters('s')=np.float64(0.36363636363636365)
letters('x')=0

prior = Pmf.from_seq(['Bowl_1', 'Bowl_2'])
prior

likelihood_vanilla = [3/4, 1/2]
likelihood_chocolate = [1/4, 1/2]
posterior = prior * likelihood_vanilla
posterior

posterior.normalize()

np.float64(1.0)

posterior

prior_101 = Pmf.from_seq([f'Bowl_{n:03}' for n in range(0,101)])

prior_101

likelihood_vanilla_101 = [n/100 for n in range(0,101)]
likelihood_chocolate_101 = [1 - n/100 for n in range(0,101)]
posterior_101 = prior_101 * likelihood_vanilla_101
posterior_101.normalize()
posterior_101

posterior_101.sum() == 1

np.True_

posterior_101.max_prob()

'Bowl_100'

from matplotlib import pyplot as plt

plt.plot(
    range(0,101),
    prior_101.values,
    posterior_101.values,
    
)
plt.xlabel('Bowl number')
plt.ylabel('Probability')
plt.xlim(0, 100)
plt.ylim(0, 0.02)
plt.legend(['Prior', 'Posterior'])

<matplotlib.legend.Legend at 0x7f6111cd6c60>

posterior_101_2 = posterior_101 * likelihood_vanilla_101
posterior_101_2.normalize()

np.float64(0.6699999999999999)

posterior_101_2

from matplotlib import pyplot as plt

plt.plot(range(0, 101), prior_101.values, label='Prior')
plt.plot(range(0, 101), posterior_101.values, label='Posterior')
plt.plot(range(0, 101), posterior_101_2.values, label='Posterior 2')

plt.xlabel('Bowl number')
plt.ylabel('Probability')
plt.xlim(0, 100)
plt.ylim(0, 0.03)
plt.legend(['Prior', 'Posterior', "Posterior 2"])

<matplotlib.legend.Legend at 0x7f6111aafe60>

posterior_101_3 = posterior_101_2 * likelihood_chocolate_101
posterior_101_3.normalize()

np.float64(0.2462686567164179)

from matplotlib import pyplot as plt

plt.plot(range(0, 101), prior_101.values, label='Prior')
plt.plot(range(0, 101), posterior_101.values, label='Posterior')
plt.plot(range(0, 101), posterior_101_2.values, label='Posterior 2')
plt.plot(range(0, 101), posterior_101_3.values, label='Posterior 3')

plt.xlabel('Bowl number')
plt.ylabel('Probability')
plt.xlim(0, 100)
plt.ylim(0, 0.03)
plt.legend(['Prior', 'Posterior', "Posterior 2", "Posterior 3"])

<matplotlib.legend.Legend at 0x7f6111bb31a0>

posterior_101_3.max_prob()

'Bowl_067'

prior = Pmf.from_seq([6,8,12])
likelihood = [1/6, 1/8, 1/12]
posterior = prior * likelihood
posterior.normalize()
posterior

likelihood_2 = [0, 1/8, 1/12]
posterior_2 = posterior * likelihood_2
posterior_2.normalize()
posterior_2

from empiricaldist import Pmf
prior = Pmf({
    'White': 1/2 * 1/2, # P(White | D1) * P(D1) + P(White | D2) + P(D2)
    'Black': 1/2 * 1/2,
    'Red': 1/3 * 1/2,
    'Green': 1/3 * 1/2,
    'Blue': 1/3 * 1/2,
})
likelihood_pair = [1/2, 1/2, 1/3, 1/3, 1/3]
posterior = prior * likelihood_pair
posterior.normalize()
posterior

	probs
1	0.166667
2	0.166667
3	0.166667
4	0.166667
5	0.166667
6	0.166667

	probs
M	0.090909
i	0.363636
p	0.181818
s	0.363636

	probs
Bowl_1	0.375
Bowl_2	0.250

	probs
Bowl_000	0.009901
Bowl_001	0.009901
Bowl_002	0.009901
Bowl_003	0.009901
Bowl_004	0.009901
...	...
Bowl_096	0.009901
Bowl_097	0.009901
Bowl_098	0.009901
Bowl_099	0.009901
Bowl_100	0.009901

	probs
Bowl_000	0.000000
Bowl_001	0.000198
Bowl_002	0.000396
Bowl_003	0.000594
Bowl_004	0.000792
...	...
Bowl_096	0.019010
Bowl_097	0.019208
Bowl_098	0.019406
Bowl_099	0.019604
Bowl_100	0.019802

3 - Distribuição¶

Modelando o problema dos cookies:¶

Mesmo problema agora com 101 jarros¶

Problema do Dado¶

	probs
White	0.300000
Black	0.300000
Red	0.133333
Green	0.133333
Blue	0.133333

	probs
6	0.444444
8	0.333333
12	0.222222

	probs
6	0.000000
8	0.692308
12	0.307692