martes, 24 de abril de 2018

Los títulos de películas más utilizados y las profesiones más representadas en el cine

La web imdb ha hecho públicas bases de datos con información de su web y he aprovechado para analizar algunas cuestiones.
Aunque muchas películas tienen que cambiar de título para no coincidir con otras, lo cierto es que hay cientos de films que comparten título con otros. Pero ¿cuáles son los más repetidos?


originalTitle
Home 38
Broken 37
Hamlet 32
Blackout 28
Carmen 27
Trapped 25
Alone 25
Macbeth 25
Solo 24
No Man\'s Land 24
Homecoming 24
Anna 24
Hope 24
Freedom 24
Run 23
Reunion 22
The Return 22
Redemption 21
Brothers 21
The Promise 21
Karma 21
Maya 21
The Gift 21
Paradise 20
The Journey 20
Retribution 20
The Stranger 20
Shadows 20
Home Sweet Home 20
Revenge 19


No sé qué dice de las necesidades creativas humanas que "Broken", "Alone", "Black Out" o "Trapped" sean de los más comunes. Las adaptaciones literarias muestran la popularidad de Shakespeare y la ópera "Carmen". Ya fuera de la lista publicada en el blog, el primer título literario en aparecer que no pertenece a una obra de Shakesperare es Anna Karenina.

También he querido averiguar cuáles son las profesiones más comunes que aparecen en los créditos de películas. Por orden de aparición son: doctor, enfermera, "bartender" (el camarero que está detrás de la barra), detective, oficial de policía y profesor.
Los hospitales tienen un peso enorme en el cine, arte donde el drama es el género más común, mientras que el tópico del camarero de bar es un reflejo de la cultura estadounidense, dominante en el cine.

jueves, 12 de abril de 2018

"No es profeta en su tierra". Un análisis estadístico


"Nadie es profeta en su tierra" es una expresión bíblica para decir que alguien es más popular fuera de su país que dentro.
Muchas veces que he escuchado esta expresión aplicada a alguien he dudado de si era verdad, ya que tengo la impresión de que en realidad esta persona es más famosa en su país que en ningún otro lado y que el problema está en las expectativas fervorosas de quien dice la frase.

Hoy, gracias a Internet y Google Trends se puede comprobar fácilmente.

Google Trends ofrece la opción de comparar la cantidad de búsquedas de un término en diferentes países utilizando lo que ellos llaman "search interest", que es una ratio de búsquedas relativa y no absoluta. Es decir, el país donde se den más búsquedas relativas (apareciendo siempre con el valor 100) no es aquel con más búsquedas totales, sino con más búsquedas en relación a otras búsquedas dentro de dicho país.


Empecemos.

Woody Allen

Siempre se ha dicho que es más apreciado en Europa que en su propio país. ¿Será esto verdad?



Pues en este caso sí. Italia, España y Sudamérica son los lugares donde tiene más popularidad y Estados Unidos aparece en noveno lugar.
En España es tan popular que ha venido hasta a dar conciertos de jazz a precio de oro y a realizar propaganda turística de Barcelona en forma de película.

Franz Kafka

Cuando los checos dicen que Kafka no es apreciado allí, ¿es solo una forma burda de ensalzar a su autor?

 


Sí, la República Checa es con diferencia el país del que surgen más búsquedas relativas de Kafka.

Papa Francisco

¿Más popular fuera de Argentina?



Según Google Trends, sí. Su popularidad se da en Sudamérica sobre todo, pero Argentina aparece en el puesto 11, incluso después de El Congo Dashiki (país católico). España aparece en el puesto 22.

Esplendor Geométrico

Esta es la banda de la que más he escuchado decir que son más conocidos fuera de España que en España. De hecho hasta la propia banda lo ha comentado alguna vez. ¿Es verdad?


No. España es con diferencia el país dónde más búsquedas aparecen. Por supuesto, como con toda la música extrema, Japón está cerca.

Ya que estamos con la música, Iron Maiden sí es más popular en el norte de Europa que en Reino Unido, y los Héroes del Silencio son más populares en Honduras y Centroamérica, a pesar de que siempre se solía decir que era en Alemania donde tenían un gran éxito.

miércoles, 27 de diciembre de 2017

Los alimentos más consumidos por país


Tras el post pasado sobre el ordeño por países, he decidido utilizar datos de la FAO para investigar el alimento más consumido por país, según datos de 2011. De los alimentos presentes en la base de datos, he excluido las definiciones más generales (frutas, verduras, cereales etc.)

El de abajo es un gráfico interactivo, por lo que pasando el puntero del ratón por encima del país se puede ver el producto más consumido y la cantidad del mismo en gramos diarios per capita. Cada color se corresponde con un producto distinto. Si no se ve en el blog, el gráfico también se puede consultar en este enlace.




Los productos lácteos (la categoría "Milk - Excluding Butter" y que incluye también el queso, pero no la mantequilla) dominan Occidente. Hasta 89 países de los 180 incluidos comen más lácteos que otra cosa y en Finlandia llegan a comer 1 kg diario.
El arroz y el trigo llegan en segundo y tercer lugar, dominando el sudeste y el este Asiático respectivamente, donde la tolerancia a la lactosa es menor.
África es el continente más variado. Entre otros aparecen la yuca ("cassava" en inglés), maíz, plátano macho, el sorgo o el curioso caso del mijo en Níger, donde una mala cosecha de dicho cereal puede tener consecuencias devastadoras.

Como curiosidades, el alimento más comido en la isla de Kiribati es el coco y en Namibia y Panamá la cerveza.

Para terminar, en esta tabla se ven los alimentos más consumidos en el mundo, la media de gramos anuales por país per cápita, el país con mayor consumo y el valor de dicho país.

Item World_average Country with highest consumption Highest values
0 Milk - Excluding Butter 308.512571 Finland 1082.43
1 Wheat and products 193.898268 Azerbaijan 575.65
2 Potatoes and products 95.372179 Belarus 507.47
3 Beer 85.569270 Ireland 391.18
4 Rice (Milled Equivalent) 85.123743 Bangladesh 472.93
5 Sugar & Sweeteners 83.451285 United States of America 166.16
6 Cassava and products 74.770556 Congo 674.39
7 Maize and products 59.653121 Lesotho 457.22
8 Poultry Meat 55.604914 Saint Vincent and the Grenadines 203.17
9 Yams 54.428689 C\xf4te d\'Ivoire 523.34
10 Tomatoes and products 49.233898 Turkey 257.69
11 Roots & Tuber Dry Equiv 48.408827 Ghana 321.75
12 Oranges, Mandarines 42.955618 Belize 291.27
13 Pigmeat 39.606647 Austria 184.86
14 Plantains 38.830435 Rwanda 373.23
15 Bananas 34.884620 Sao Tome and Principe 408.41
16 Bovine Meat 31.358571 Argentina 150.53
17 Oilcrops 28.357401 Samoa 483.48
18 Sorghum and products 25.946061 Sudan (former) 199.10
19 Onions 25.568214 Albania 91.14
20 Apples and products 25.406089 Austria 145.44
21 Millet and products 22.027612 Niger 386.99
22 Coconuts - Incl Copra 20.116570 Samoa 476.16
23 Pelagic Fish 19.118218 Maldives 311.41
24 Eggs 18.743143 Paraguay 52.00
25 Sweet potatoes 17.590600 Solomon Islands 479.10
26 Wine 17.543886 Luxembourg 140.61
27 Pulses 17.161124 Niger 96.24
28 Grapes and products (excl wine) 13.441534 Albania 152.32
29 Cheese 13.046839 Greece 71.80


El mundo depende sobremanera de lácteos y almidón. El pollo es la carne más consumida hoy día, apareciendo en el noveno puesto, muy por encima de la carne de cerdo, y el tomate es la verdura más importante. La fruta más consumida puede ser o bien naranjas/mandarinas o bien el plátano, si consideramos el plátano macho y el "nuestro" como el mismo.
Ver datos mundiales me hace darme cuenta de lo diferentes que son las cosas en ambos hemisferios. Por ejemplo, el consumo de coco es mayor que el de huevos, algo que jamás habría imaginado. Algunos alimentos apenas consumidos -o conocidos- en occidente son de gran importancia socioeconómica para países en desarrollo, sobre todo raíces o tubérculos como la yuca ("cassava"), el ñame ("yams"), ambos en el top diez.

martes, 5 de diciembre de 2017

Tolerancia a la lactosa en el mundo: un análisis etnográfico



La web D-Place ha recopilado información de sociedades del siglo XIX y XX sobre varias áreas (lingüística, entorno y cultura).

Uno puede verlas en su web o descargar toda la información en una serie de bases de datos. Me he decidido a hacer lo último, para un análisis que relacione el ordeño de animales en el mundo con la tolerancia a la lactosa actual.

El siguiente gráfico muestra qué sociedades del siglo XIX y del siglo XX anteriores a 1950 todavía ordeñaban animales cuando fueron estudiadas.





El mapa ofrece una explicación de la tolerancia a la lactosa actual. América, donde los mamíferos tradicionalmente presentes desde el neolítico no eran domesticables, está casi ausente, como lo está buena parte de África y Asia Oriental. Por ello tiene sentido que el 85 % de los aborígenes australianos, el 93 % de los chinos, el 98 % de los tailandeses y el 100 % de los amerindios sean intolerantes a la lactosa.

Algunas zonas de Siberia sí presentan ya ordeño de animales -ahora entiendo que una amiga de Yakutsk bebiera leche sin problemas-, mientras que otras tienen poco más que perros o ciervos, como mostraré en un gráfico inferior.


Ante esto, es interesante comprobar cuáles eran los animales domesticados de las sociedades que ordeñaban y de las que no.




No es sorprendente que los bovinos y los camellos sean ordeñados más a menudo que no, o que los pueblos donde haya mamíferos cuya leche no sea rentable consumir (como perros o cerdos) no ordeñen leche.
Sí me sorprende que los lugares donde el animal ordeñado sean las ovejas y las cabras tengan por costumbre no ordeñar animales

Las ovejas y las cabras fueron el primer ganado domesticado en la historia y en un inicio solo se utilizaron para sacar provecho de su leche y carne, pues originariamente no tenían lana (este fue un rasgo que los humanos produjeron por su propio interés mediante la domesticación).

Quizás estas sociedades habían comenzado recientemente a domesticar cabras y ovejas, y no eran todavía tolerantes a la lactosa. ¿Tiene alguien otra idea?

Por último, un mapa donde se puede ver la distribución geográfica de los animales domesticados en el mundo.


Como ya he comentado, América y Oceanía no tienen animales que merezca la pena ordeñar. Algunas latitudes solo permiten ciertos animales (camellos en el desierto africano y ciervos en el norte de Europa), mientras que en otras, como Nueva Zelanda o el centro occidental de África, el cerdo y las ovejas/cabras eran todavía más importantes que el ganado bovino.



Bibliografía:

Atlas etnográfico de Murdock (1962-1971) y Gray (1999)

Lee-Thorp and Rogers-Ackermann (2002); Campbell
et al. (2005)


jueves, 22 de junio de 2017

¿Cuáles son los alimentos que producen cáncer?

Todos ellos.

Al menos esta es la conclusión que se puede sacar de este estudio de 2013 que recopiló estudios epidemiológicos (que buscan causas de enfermedades) sobre alimentos y cáncer.

Prácticamente todos los alimentos causan o previenen el cáncer. Solo las olivas se salvan.

Esto es algo a tener en cuenta para la próxima noticia televisiva sobre los efectos de este u otro alimento, especialmente si uno tiene en cuenta que los estudios que muestran resultados sesgados tienen más posibilidades de salir en los medios.




jueves, 1 de septiembre de 2016

Estadísticas sobre las Olimpiadas

Tras el final de las Olimpiadas me he hecho preguntas sobre la relación entre distintos deportes y las características de sus deportistas. Para responderlas he hecho un scraping de la página oficial de los Juegos Olímpicos de Rio, recopilando información sobre sus más de 1000 atletas. Primero una distribución por países:

country
USA 562
BRA 480
GER 435
AUS 429
CHN 403
FRA 403
GBR 374
JPN 342
CAN 317
ESP 311
ITA 308
RUS 281


Tiene especial mérito la representación olímpica de países como Australia o Canadá, ambos con poblaciones menores de 40 millones. La décima posición de España también me parece aceptable. Esta es la distribución de atletas según deportes (solo los 10 primeros):

sport
Athletics 2389
Swimming 840
Football 609
Rowing 547
Hockey 432
Judo 392
Shooting 390
Sailing 380
Handball 357
Wrestling 348


Media de edades por deporte olímpico

age
sport
Equestrian 37.240000
Shooting 31.366667
Golf 29.566667
Beach Volleyball 28.718750
Cycling Road 28.509434
Cycling Mountain Bike 28.461538
Tennis 28.010152
(...)
Taekwondo 24.171875
Cycling BMX 23.833333
Football 23.558292
Synchronised Swimming 23.509615
Diving 23.441176
Artistic Gymnastics 22.510204
Swimming 22.435714
Rhythmic Gymnastics 20.281250

El fútbol aparece artificalmente abajo porque la organización no permite utilizar un número de jugadores por encima de una cierta edad. Hay tres deportes olímpicos en los que la media supera los 28 años: hípica, golf y tiro en los que los atletas más viejos llegan hasta los 62 y 56 años. Suele debatirse en bares si la Fórmula 1 es un deporte o no. Me pregunto si ese debate no es también apto para estas competiciones.

Estadísticas individuales

Las dos competidoras más jóvenes tienen 13 años (Gaurika Singh y Ana Iulia Dascal) y son nadadoras. La más delgada (Flavia Saraiva) pesa 31 kilos y en ese rango hay varias mujeres en gimnasia artística.
El atleta más alto es el chino Muhao Li con 2,18 y el más pesado es Daniel Natea, un yudoca rumano con 170 kilos (5 veces más que la competidora más ligera).





Para finalizar dejo una enorme tabla con la distribución de altura, peso y estatura de cada deporte, separada por género. La columna "w_to_h_ratio" se refiere a la relación entre peso y ratio. Cuanto mayor sea (caso del baloncesto) más peso en relación a la estatura (en algunas competiciones esto tiene poco significado porque están ya divididas por peso).

age height weight w_to_h_ratio
sport gender
Archery Men 25.671875 1.795714 80.079365 44
Women 25.875000 1.676190 64.301587 38
Artistic Gymnastics Men 24.714286 1.670312 63.021053 37
Women 20.306122 1.546701 48.185567 31
Athletics Men 26.437348 1.809198 74.751958 41
Women 26.214410 1.690680 60.156134 35
Badminton Men 27.977011 1.804070 76.023810 42
Women 25.694118 1.685595 61.162500 36
Basketball Men 27.736111 2.003611 100.297872 50
Women 27.513889 1.833819 75.377622 41
Beach Volleyball Men 29.229167 1.951667 89.729167 45
Women 28.208333 1.799149 68.543478 38
Boxing Men 24.721116 1.757375 NaN NaN
Women 27.083333 1.682222 NaN NaN
Canoe Slalom Men 26.730159 1.776349 73.571429 41
Women 26.900000 1.663500 59.600000 35
Canoe Sprint Men 26.723684 1.838212 85.596026 46
Women 27.197674 1.708235 68.130952 39
Cycling BMX Men 23.656250 1.806786 82.892857 45
Women 24.187500 1.646667 62.133333 37
Cycling Mountain Bike Men 28.140000 1.770667 67.711111 38
Women 29.035714 1.650741 54.040000 32
Cycling Road Men 28.420690 1.786692 67.781955 37
Women 28.701493 1.663710 56.901639 34
Cycling Track Men 25.285714 1.809278 78.659794 43
Women 25.383721 1.691512 63.941860 37
Diving Men 23.882353 1.721912 68.191176 39
Women 23.000000 1.617794 54.955882 33
Equestrian Men 37.812950 1.788963 72.814815 40
Women 36.313953 1.682143 58.554217 34
Fencing Men 28.172131 1.833802 78.785124 42
Women 26.943548 1.712581 62.733871 36
Football Men 22.139130 1.793571 74.459119 41
Women 25.412879 1.682710 61.053435 36
Golf Men 31.983607 1.793500 79.000000 44
Women 27.067797 1.691404 63.200000 37
Handball Men 28.308989 1.913034 95.359551 49
Women 27.474860 1.760335 70.903030 40
Hockey Men 26.912037 1.800093 77.375000 42
Women 25.444444 1.667870 60.425926 36
Judo Men 26.050209 1.781783 84.616740 47
Women 26.450980 1.665132 65.392157 39
Marathon Swimming Men 25.875000 1.814583 76.333333 42
Women 25.250000 1.697500 61.333333 36
Modern Pentathlon Men 26.027778 1.826765 76.470588 41
Women 25.138889 1.700882 59.852941 35
Rhythmic Gymnastics Women 20.281250 1.688021 50.406250 29
Rowing Men 27.075529 1.898708 86.504615 45
Women 26.611111 1.773286 69.776190 39
Rugby Sevens Men 26.034483 1.829306 90.416667 49
Women 26.210884 1.678403 66.579310 39
Sailing Men 28.750000 1.812770 77.122066 42
Women 25.895706 1.692767 63.194969 37
Shooting Men 32.677824 1.780343 81.068966 45
Women 29.291391 1.648400 62.675676 38
Swimming Men 22.953642 1.864554 80.331776 43
Women 21.829457 1.728901 63.005479 36
Synchronised Swimming Women 23.509615 1.685577 55.221154 32
Table Tennis Men 27.941860 1.786860 72.558140 40
Women 27.558140 1.653659 57.530120 34
Taekwondo Men 24.203125 1.863846 74.462963 39
Women 24.140625 1.721455 61.310345 35
Tennis Men 29.590476 1.860388 80.417476 43
Women 26.206522 1.734205 64.670455 37
Trampoline Gymnastics Men 24.437500 1.721875 64.733333 37
Women 25.750000 1.619375 52.750000 32
Triathlon Men 27.290909 1.783469 67.041667 37
Women 28.145455 1.678704 54.666667 32
Volleyball Men 27.562500 1.968125 89.319444 45
Women 26.531034 1.837931 71.324138 38
Water Polo Men 27.717949 1.912051 94.621795 49
Women 25.048077 1.762885 71.692308 40
Weightlifting Men 25.329032 1.709355 87.032258 50
Women 24.125000 1.603558 68.384615 42
Wrestling Men 27.038462 1.758376 85.572650 48
Women 25.596491 1.651239 61.805310 37

martes, 9 de agosto de 2016

Carreras para hombres y carreras para mujeres


Siempre me ha resultado curioso que haya carreras que atraen más a hombres y otras más a mujeres.

He buscado datos al respecto y solo los he encontrado de parte de la comunidad del País Vasco del año 2014.

En ellos se ve que en general las mujeres estudian más carreras que los hombres, 30127 contra 27201. Y su predilección son las carreras donde puedan ayudar a otros (Educación infantil (mucho más que primaria), Psicología, Enfermería, Medicina...), aquellas creativas (Creación y diseño, Arte), las relacionadas con la lengua (Lenguas modernas y gestión, Traducción) y carreras técnicas o científicas con menos matemáticas (Bioquímica y biología molecular, Química, Arquitectura).

Los hombres estudian más las carreras que tienen que ver con el estudio de las máquinas, como todos los tipos de Ingeniería o la Mecánica, carreras técnicas con más dosis de matemáticas como Física, Matemáticas, Finanzas o Economía, Estudios deportivos y la triada de Historia, Geografía y Filosofía que siempre parece atraer más a los hombres.


Debajo una lista con todos los resultados.

Asignatura total hombres mujeres diferencia
62 Administración y dirección de empresas 5771 2868 2903 -35
84 Educación primaria 3660 1565 2095 -530
81 Derecho 3365 1383 1982 -599
155 Psicología 2605 638 1967 -1329
138 Ingeniería mecánica 2362 1996 366 1630
83 Educación infantil 2058 242 1816 -1574
149 Medicina 1565 482 1083 -601
87 Enfermería 1536 253 1283 -1030
85 Educación social 1288 341 947 -606
104 Gestión de negocios 1254 694 560 134
132 Ingeniería en tecnología industrial 1118 831 287 544
161 Trabajo social 1101 262 839 -577
118 Ingeniería electrónica industrial y automática 1058 908 150 758
136 Ingeniería informática 853 698 155 543
154 Periodismo 819 376 443 -67
157 Química 700 300 400 -100
74 Ciencias de la actividad física y del deporte 679 508 171 337
91 Farmacia 658 175 483 -308
111 Ingeniería civil 658 430 228 202
99 Fundamentos de arquitectura 629 334 295 39
82 Economía 600 350 250 100
66 Arte 576 208 368 -160
107 Historia del arte 562 167 395 -228
159 Relaciones laborales y recursos humanos 556 210 346 -136
42 Arquitectura 553 222 331 -109
77 Comunicación audiovisual 535 238 297 -59
129 Ingeniería en organización industrial 529 316 213 103
135 Ingeniería en tecnologías industriales 519 377 142 235
156 Publicidad y relaciones públicas 506 163 343 -180
137 Ingeniería informática de gestión y sistemas d... 505 426 79 347