Casey, Riley, Jessie ja Jackie. Peyton, Jody, Kerry ja Pat. Ovatko nämä miehiä vai naisia? Sitä voi olla vaikea sanoa, koska nämä nimet ovat aika pitkälti unisex-nimiä.
Otetaan esimerkiksi Riley. Lähes 155 000 elossa olevaa amerikkalaista on nimetty Rileyksi, ja miesten ja naisten suhde on melko tasapainoinen, 51 prosenttia ja 49 prosenttia.
Jos Riley kuulostaa tutulta, se voi johtua siitä, että näit hiljattain videon Riley Currystä, Golden State Warriorsin NBA:n MVP:n Stephen Curryn ihastuttavasta 2-vuotiaasta tyttärestä pelin jälkeisessä lehdistötilaisuudessa. Tai ehkä ajattelet Riley Cooperia, Philadelphia Eaglesin laitahyökkääjää. Asia on näin: Riley ei ole miehen eikä naisen nimi. Se on molempia.
Kävi ilmi, että lähes yhdellä prosentilla amerikkalaisista (eli yhdellä 109:stä) on unisex-nimi, mikä tarkoittaa, että vähintään kolmannes vastasyntyneistä, joille tämä nimi annettiin, oli miehiä ja vähintään kolmannes naisia. On vaikea sanoa, mikä on ”eniten” unisex-nimiä, mutta alla olevassa kaaviossa on lueteltu 20 yleisintä unisex-nimeä, jotka on järjestetty sen mukaan, kuinka monella henkilöllä on kyseinen nimi.
Kollegani Mona Chalabin kanssa tekemäni työn pohjalta käytin yli sadan vuoden ajalta saatuja tietoja sosiaaliturvalaitokselta (Social Security Administration) luodakseni tämän listan androgyyneimmistä nimistä. (SSA:lla on tietoja nimistä, jotka on annettu vähintään viidelle ihmiselle, mutta asetin vähimmäiskynnykseni 100 ihmiselle varmistaakseni, että nimi oli tarpeeksi yleinen, jotta voitiin määritellä, oliko se todella sukupuolineutraali). Käyttämällä vakuutusmatemaattisia taulukoita, jotka ovat myös SSA:lta, mukautin nimitiedot siten, että arvioin kutakin nimeä nykyisin käyttävien ihmisten lukumäärän. (Tämä oli samanlainen menetelmä kuin kollegani Allison McCann ja Nate Silver käyttivät aiemmassa jutussaan.)
Jotta nimi pääsisi 20 parhaan joukkoon, vähintään 25 000:lla tällä hetkellä elossa olevalla amerikkalaisella ihmisellä täytyi olla se.
Lähes kolmella miljoonalla ihmisellä on jokin alla olevassa haettavissa olevassa taulukossa olevista yli 900 nimestä. ”Kuilu”-sarakkeessa näkyy ero miesten ja naisten osuuksissa. Mitä pienempi luku on, sitä tasaisemmin nimi on jakautunut sukupuolten kesken (minimiarvo on nolla ja maksimi noin 33,33).
SSA ei muokkaa nimiluetteloaan, minkä vuoksi siihen on kirjattu useita nimiä, jotka ovat mitä todennäköisimmin paikannimiä. Pystyimme tunnistamaan näistä viisi (Unknown, Unnamed, Infant, Infantof ja Notnamed) ja poistimme ne aineistosta. Muut, kuten Baby ja Child, olivat mielestämme moniselitteisempiä, joten jätimme ne mukaan.
Voit tutustua tämän analyysin taustalla olevaan koodiin sekä koko aineistoon GitHubissa.
TARKENNUS (10.6. klo 14:27): Tässä artikkelissa olevan unisex-nimien hakutaulukon aiemmassa versiossa jätettiin pois kaksi todennäköistä paikannimeä (Tuntematon ja Nimetön), mutta olisi pitänyt jättää pois kolme muuta (Infant, Infantof ja Notnamed). Olemme nyt poistaneet nämäkin aineistosta ja lisänneet selityksen.
The best of FiveThirtyEight, delivered to you.