Casey, Riley, Jessie a Jackie. Peyton, Jody, Kerry a Pat. Jsou to muži nebo ženy? To může být těžké říct, protože tato jména jsou v podstatě jednopohlavní.
Příklad Riley. Téměř 155 000 žijících Američanů se jmenuje Riley a poměr mužů a žen je poměrně vyrovnaný – 51 % ku 49 %.
Pokud vám jméno Riley něco říká, možná je to proto, že jste nedávno viděli video s Riley Curry, rozkošnou dvouletou dcerou nejužitečnějšího hráče NBA Stephena Curryho z Golden State Warriors, na tiskové konferenci po zápase. Nebo možná máte na mysli Rileyho Coopera, wide receivera týmu Philadelphia Eagles. To je právě ono: Riley není ani mužské, ani ženské jméno. Je to obojí.
Ukázalo se, že téměř 1 procento Američanů (neboli 1 ze 109) má unisex jméno, což znamená, že nejméně třetina novorozenců, kteří toto jméno dostali, byli muži a nejméně třetina ženy. Je těžké říci, jaké je „nejčastější“ unisex jméno, ale v následující tabulce je uvedeno 20 nejčastějších unisex jmen seřazených podle celkového počtu lidí s tímto jménem.
Na základě práce, kterou jsem provedl se svou kolegyní Monou Chalabi, jsem použil více než 100 let stará data ze Správy sociálního zabezpečení a vytvořil tento seznam nejčastějších oboupohlavních jmen. (SSA má k dispozici údaje o jménech, která byla dána nejméně pěti osobám, ale já jsem stanovil minimální hranici na 100 osob, abych měl jistotu, že jméno je dostatečně rozšířené, abych mohl určit, zda je skutečně jednopohlavní). Pomocí pojistně-matematických tabulek, rovněž od SSA, jsem upravil údaje o jménech tak, abych přibližně určil počet osob, které v současnosti žijí s každým jménem. (Šlo o podobnou metodu, jakou použili moji kolegové Allison McCann a Nate Silver v předchozím článku.)
Aby se jméno dostalo do první dvacítky, muselo by ho mít alespoň 25 000 v současnosti žijících Američanů.
Téměř 3 miliony lidí mají jedno z více než 900 jmen v níže uvedené tabulce s možností vyhledávání. Sloupec „gap“ ukazuje rozdíl v podílu mužů a žen. Čím nižší číslo, tím je jméno mezi pohlavími vyrovnanější (s minimální hodnotou nula a maximální asi 33,33).
SSA svůj seznam jmen neupravuje a v důsledku toho eviduje řadu pravděpodobně zástupných jmen. Pět z nich (Unknown, Unnamed, Infant, Infantof a Notnamed) se nám podařilo identifikovat a z údajů odstranit. Ostatní, jako například Baby a Child, jsme považovali za víceznačné, a proto jsme je tam ponechali.
Kód, který stojí za touto analýzou, stejně jako celý soubor dat, si můžete prohlédnout na GitHubu.
ZPRAVODAJ (10. června 14:27): Dřívější verze vyhledávací tabulky jednopohlavních jmen v tomto článku vyloučila dvě pravděpodobná zástupná jména (Neznámý a Bezejmenný), ale měla vyloučit další tři (Infant, Infantof a Bezejmenný). Ty jsme nyní z údajů také vyřadili a přidali vysvětlení.
To nejlepší z FiveThirtyEight, co vám přinášíme.
.