Dama z herbatą

Data ostatniej modyfikacji:
2015-09-9
Autor: 
Andrzej Dąbrowski
matematyk, statystyk, wybitny popularyzator statystyki
Poziom edukacyjny: 
gimnazjum
szkoła średnia z maturą
szkoła profilowana zawodowa
szkoła wyższa
Dział matematyki: 
statystyka

Często się zdarza, że niezwykłe pomysły rodzą się nieoczekiwanie. Cóż nadzwyczajnego może zdarzyć się podczas tradycyjnej popołudniowej herbatki?

Pewnego popołudnia, trzy osoby – dama i dwaj mężczyźni - umówili się na filiżankę herbaty. Starszy z panów nalał na dno filiżanki porcję mleka, uzupełnił herbatą i podał damie. Ta, ku jego zdumieniu, grzecznie odmówiła, twierdząc, że woli herbatę z mlekiem dodawanym na końcu. Przecież jest to obojętne – obruszył się starszy pan. Jednak ja czuję różnicę – zarzekała się dama. Wtedy młodszy mężczyzna zaproponował – A może to jakoś sprawdzimy?

Muriel Bristol

Ten drobny incydent być może przeszedłby bez echa, gdyby nie osoby, które w nim uczestniczyły i miejsce, gdzie wydarzyła się ta historia. Działo się to na początku lat 20. XX wieku, jak łatwo się domyślić (herbata z mlekiem!) w Anglii, nieco na północ od Londynu, w Stacji Doświadczalnej Rothamsted leżącej na obrzeżu miasteczka Harpenden. Osoby biorące udział w tym spotkaniu to: dr Muriel Bristol (1888-1950) – algolog (specjalistka od glonów), jej przyszły mąż William Roach - pracujący w laboratorium owadobójczym i starszy pan w grubych okularach i z charakterystyczną spiczastą bródką - statystyk, profesor  (1890-1962).

Fisher opisał później to spotkanie w monografii The Design of Experiments (projektowanie doświadczeń) wydanej w 1935 roku. Zaproponowana przez niego metoda sprawdzenia, czy dr Bristol rzeczywiście potrafi odróżnić, kiedy dodano mleko do herbaty, stała się zaczątkiem ważnej teorii planowania doświadczeń. Trudno dziś sobie wyobrazić medycynę bez doświadczeń klinicznych, rolnictwo bez doświadczeń polowych, przemysł chemiczny, a szczególnie farmaceutyczny, bez doświadczeń zaplanowanych według zasad, których początek dało to zwykłe, niezwykłe spotkanie przy herbacie.

Ronald Aylmer Fisher

Fisher zaproponował, aby bez udziału pani Bristol przygotować 8 filiżanek z herbatą. Do 4 filiżanek nalano najpierw herbaty, a później mleka, zaś do kolejnych 4 nalano  najpierw mleka, a później  herbaty. Filiżanki zostały ustawione w losowym porządku i wyglądały tak, że bez próbowania (statystyk powiedziałby bez testowania) nie można było rozpoznać, jaka mieszanka jest w poszczególnych filiżankach. Pani Bristol miała wskazać, gdzie znajduje się jej ulubiona mieszanka, z herbatą nalaną najpierw, a później uzupełniona mlekiem.

Jaki wynik doświadczenia wskazywałby, że pani Bristol rzeczywiście miała umiejętność odróżniania kolejności dodawania mleka? Czy gdyby bezbłędnie wskazała 4 filiżanki z jej ulubioną mieszanką, byłby to wystarczający dowód? A może miała szczęście i tylko udało jej się zgadnąć? A jak ocenić umiejętności pani Bristol, gdyby poprawnie wskazała tylko 3 filiżanki?  Żaden wynik tego doświadczenia nie pozwoli uniknąć podejrzenia, że został uzyskany przypadkowo, a nie w wyniku wyjątkowej umiejętności pani Bristol.

W praktyce podobne sytuacje zdarzają się bardzo często. Lekarz, wypróbowując nowy lek, zastanawia się, czy dobre samopoczucie chorego jest wynikiem działania tego leku, czy może lek wcale nie działa, a poprawa nastąpiła z zupełnie innych przyczyn. Rolnik zastanawia się, czy dobre plony są wynikiem właściwego nawozenia, czy raczej sprzyjającej pogody.

Możliwe są tu dwa zdania, które stanowią ostateczną ocenę wyniku doświadczenia: To może być wynik przypadkowy lub To nie może być przypadek. Tradycyjnie w matematyce każde zdanie ma jeden z dwóch atrybutów: To zdanie jest prawdziwe lub  To zdanie jest fałszywe. Jak widać tam, gdzie występują dane doświadczalne, obowiązują inne standardy i wymagana jest inna zasada postępowania niż w tradycyjnej matematyce. Nauka, która określa kryteria rozstrzygające, czy wynik jest przypadkowy, czy też nie, nazywa się statystyką, a kryterium to rozstrzygające nazywa się testem.

Należy określić kiedy wynik doświadczenia jest przypadkowy, a kiedy nie. Fisher zaproponował proste kryterium: wynik uznaje się za nieprzypadkowy, gdyby przypadkowe jego uzyskanie było mało prawdopodobne (było praktycznie cudem). W książce Statistical Methods for Research Workers (metody statystyczne dla naukowców) z 1925 roku określił nawet granicę, kiedy zaczyna się „cud statystyczny″ - wynik o prawdopodobieństwie mniejszym niż 0,05 = 1/20. Liczbę tę powszechnie przyjęto jako normę i nazwano poziomem istotności.

W dzisiejszej praktyce stosuje się znacznie ostrzejsze wymagania co do poziomu istotności. Jego wartość przyjmuje się zazwyczaj jako 0,01 a czasem jako 0,001. Na przykład gdy w rzucie monetą po kolei wypadną 4 orły, to uważa się, że to jeszcze za słaby argument za nieprzypadkowością wyniku, czyli za tym, ze moneta została sfałszowana (prawdopodobieństwo takiego wyniku uzyskanego przypadkowo wynosi 1/24 = 1/16 > 1/20). Gdy w kolejnym rzucie znów wypadnie orzeł, to taka seria 5 kolejnych orłów może już świadczyć o nieprzypadkowym wyniku (1/25 = 1/32 < 1/20). Ogłaszając, że taka seria wyników świadczy o asymetrii monety, popełniamy błąd z prawdopodobieństwem 1/32 ≈ 0,03. Taką liczbę nazywa się p-wartością testu.

W kontroli jakości poziom istotności jest bardziej wyśrubowany i wynosi 1/365 (czytelnik na pewno domyśla się, skąd wzięła się ta liczba). Uważa się na przykład, że automat dozujący sok do kartonu 1 litrowego jest rozregulowany, jeśli  9 kolejnych losowo wybranych kartonów zawiera poniżej 1 litra soku – 8 takich kartonów nie wystarcza (1/28 > 1/365 > 1/29).

Pora wrócić na spotkanie przy herbacie. Filiżanki ustawione przypadkowo na stole można opisać ciągiem składającym się z liter M (gdy najpierw wlano mleko) i H (gdy najpierw wlano herbatę). Na przykład ciąg HHMHMMMH oznacza, że w filiżankach 1, 2, 4 i 8 najpierw wlano herbatę. Wszystkich takich ciągów jest 70, co łatwo obliczyć. Aby zapisać konkretny ciąg, wystarczy zarezerwować 4 miejsca na napisanie liter H. Ponieważ dostępnych jest 8 miejsc, takich ciągów jest tyle, co wyborów 4 miejsc z ośmiu, czyli C(8,4) = 8!/(4!4!) = 70. C(n, k) oznaczane też jako [en po ka] oznacza tzw. symbol Newtona i wynosi n!/(k!(n-k)!).

Gdyby pani Bristol zgadła poprawnie zawartość wszystkich filiżanek, to prawdopodobieństwo uzyskania takiego wyniku przypadkowo wynosiłoby 1/70 < 1/20, co zostałoby uznane za argument potwierdzający jej umiejętności. Gdyby pani Bristol poprawnie zgadła zawartość trzech filiżanek oznaczonych literą H, to prawdopodobieństwo, że robiła to na chybił trafił, wynosiłoby 16/70, bowiem jest 16 takich możliwości: C(4, 3) · C(4, 1) = 4·4 = 16. Rachunek ten wynika z faktu, że ciągów z poprawnie zlokalizowaną literą H jest C(4, 3), bo należy wybrać 3 poprawne miejsca spośród 4 pozycji, na których jest H, natomiast ciągów z niepoprawnie zlokalizowaną literą H jest C(4, 1), bo ta litera musi wejść na miejsce, gdzie naprawdę jest M. Jednak 16/70 > 1/20, więc i taki wynik jeszcze mieści się w kategorii To może być przypadek.

A jak było naprawdę? Pani Bristol zgadła poprawnie zawartość wszystkich filiżanek. I przeszła do historii nauki o sposobach planowania doświadczeń. Na swoim zawodowym polu też odnosiła sukcesy. Jeden z gatunków badanych przez nią glonów na jej cześć nosi nazwę muriella (od imienia dr Bristol).

Temat damy z herbatą (The lady testing tea – Dama testująca herbatę – w języku angielskim występuje tu gra słów: testing w sensie potocznym oznacza 'kosztująca', 'próbująca', a w języku statystycznym - oceniająca przypadkowość wyniku) jest motywem często pojawiającym się w literaturze statystycznej. Książka Davida Salsburga The Lady Testing Tea, bardzo popularna na rynku amerykańskim, z podtytułem Jak statystyka zrewolucjonizowała naukę w XX wieku, rozpoczyna się rozdziałem właśnie o damie z herbatą.

Na kanale You Tube można obejrzeć wysmakowany filmik o opisanej tu historii:
http://www.youtube.com/watch?v=lgs7d5saFFc
Są też obszerniejsze filmy o związku historyjki o herbacie ze statystyką:
https://www.youtube.com/watch?v=vYVr50hjFbQ
https://www.youtube.com/watch?v=xh20btybjp4

Obejrzyjcie je koniecznie!


 

Powrót na górę strony