Satunnaisotos Excelillä – RAND-funktio

Kuvitellaanpa tilanne, jossa kerättäisiin tietoja yrityksen asiakastyytyväisyydestä ympäri Suomea. Asiakkaita voi olla tuhansia, joten populaatio eli perusjoukko on niin suuri, ettei jokaisen mielipidettä ole mahdollista kysyä. Sen vuoksi populaation pohjalta tulee muodostaa niin sanottu otoskehikko, johon jokaisella populaation jäsenellä on yhtä suuri todennäköisyys tulla valituksi. Menemättä tässä ohjeessa sen syvemmin tutkimusmenetelmiin, yhtäläinen todennäköisyys tulla valituksi on satunnaisotoksen kulmakivi. Hyvä artikkeli surveytutkimuksesta löytyy esimerkiksi täältä.

Tutkimusta varten hankittavat tiedot ovat yleensä jossain järjestyksessä, esimerkiksi aakkosjärjestyksessä tai aikajärjestyksessä. Sen vuoksi satunnaisotokseen ei voida ottaa vain esimerkiksi sataa viimeisintä tietoa; erot vastausnopeuksissa saattaisivat johtaa siihen että esimerkiksi hämäläisten yritysten osuus olisi korostunut. Tästä aiheutuisi niin sanottua systemaattista harhaa.

Tietojen satunnaistaminen on todella yksinkertainen prosessi, mutta vaatii pientä hoksaamista. Käytän tässä esimerkkinä listaa yrityksistä, johon on kerätty tietoja asiakastyytyväisyydestä. Otsikosta poiketen kokeilin vaihtelun vuoksi tehdä tämän ilmaisella LibreOfficella, jossa toimii samat kaavat kuin Excelissäkin.

Vaihe 1: Lista aakkosjärjestyksessä

Screenshot from 2014-09-02 11:36:40

Vaihe 2: Lisää sarake satunnaismuuttujalle

Tyhjä sarake taulukon eteen lisätään yksinkertaisesti painamalla taulukon ensimmäisen sarakkeen kirjainta (tässä tapauksessa A) oikealla, ja painamalla Insert Column, Lisää Sarake tai vastaavaa.

Taulukon tyhjän sarakkeen ensimmäiseen soluun lisätään satunnaismuuttuja. Satunnaismuuttujan kaava on sekä Excelissä, että LibreOfficessa (myös Google Docsissa) RAND(). Suomenkielisessä käännöksessä RAND on SATUNNAISLUKU. RAND on siitä erikoinen kaava, että sen perässä oleviin sulkuihin ei laiteta mitään, joten pelkkä RAND() riittää.

Screenshot from 2014-09-02 11:38:58

Lisää kaava ylimpään soluun ja klikkaa solun oikeassa alakulmassa olevaa +-merkkiä, jolloin kaava kopioituu koko sarakkeeseen.

Vaihe 3:  Järjestä satunnaisluvun mukaan

LibreOfficessa lajittelupainike on A – > Z näköinen, Excelissä vastaava löytyy Sort & Filter valikosta. Kun lajittelu on valmis, voit poistaa satunnaislukusarakkeen.

Screenshot from 2014-09-02 12:08:51

Vaihe 4: Valitse satunnaisotoksen koko

Tämä vaihe onkin sitten yllättävän yksinkertainen. Koska taulukko on satunnaisjärjestyksessä, jokainen siitä  otettu joukko on myös satunnaisotos. Tarvitsetko satunnaisotoksen kymmenestä yrityksestä? Valitse silloin kymmenen ylintä tietoa. Tarvitsetko 20? Valitse silloin 20.

Screenshot from 2014-09-02 11:41:50

 

EXTRA:

Kuten arvata saattaa, RAND-muuttujalla voi arpoa myös muita satunnaislukuja. Yksinään RAND arpoo lukuja väliltä 0-1. Jos tarvitset siis arvoja esimerkiksi väliltä 0-6, voit kertoa RANDin kuudella, eli:

=RAND()*6

Jos tarvitset satunnaisluvun joltain tietyltä väliltä esimerkiksi kouluarvosanoja varten (opettajille tiedoksi), voit lisätä RANDiin kokonaislukuja, eli:

=RAND()*6+4

Jos vastaukseksi riittää kokonaisluvut, voit käyttää myös yksinkertaisempaa RANDBETWEEN-kaavaa, eli:

=RANDBETWEEN(4;10)

 

Jäikö jotain kysyttävää? Jätä viesti!

Avoimet kurssit:

Leave a Reply

Your email address will not be published.