Análisis Líneas Spread y Over/Under NBA (y 2)

En el anterior post dejamos por analizar los datos de la temporada 06-07. Habíamos visto en el tramo inicial de la temporada 05-06 alguno de los gráficos con tendencias inestables y en los tramos finales también se detectaron discrepancias. Veamos si podemos confirmar estas conclusiones con el análisis de esta temporada.

Puntos Locales (PL)

El gráfico para los puntos locales durante esta temporada es perfecto, con mínimas desviaciones en los tres períodos y sin signo alguno de inestabilidad.

Puntos Visitantes (PV)

Para los puntos visitantes no ocurre lo mismo. El desajuste más importante se ve al final de la temporada con unas diferencias superiores a los 2.5 puntos entre el valor real y el estimado. Los modelos predecían menos puntos que los que en realidad anotaban los equipos visitantes. Este es el error más grande que hemos encontrado hasta ahora.

Spread (Sp)

Para el Spread tenemos un gráfico muy similar al anterior. Las predicciones fueron bastante buenas durante toda la temporada pero debido a ese fallo en las predicciones para los puntos visitantes en el tramo final tenemos un desajuste de más de 1.5 puntos. Las casas colocaban lineas de spread 1.5 puntos de media más bajas de lo que en realidad eran.

Over/Under (OU)

En este último gráfico se aprecia lo mismo que en los dos anteriores. Buenas predicciones durante toda la temporada pero fallo en el tramo final de más de 3 puntos en media.

Con estos análisis de las dos temporadas podemos concluir que las casas tienen modelos de predicción bastante ajustados. Que además son extrapolables de una temporada a otra porque no se han visto discrepancias repetitivas en los tramos iniciales de las dos temporadas para ninguna de las variables analizadas, pero lo que si hemos notado que en los tramos finales de las dos temporadas algo sucede. Las discrepancias entre los valores previstos por los modelos y los valores reales se hacen mayores y probablemente ahí tengamos, lo que los expertos en márketing llamarían, un nicho de mercado. Esperaremos a final de esta temprada para corroborar los resultados.

FELIZ NAVIDAD!!!

Me ha costado un pastón, pero la ocasión lo merece y además con los resultados de los últimos retos me lo podía permitir.


Os deseo todo lo mejor para estas fiestas y que continúe el año que viene.

Filosofia en los blogs y foros de apuestas

Hoy Jsnielfa moderador y uno de los mejores tipsters de forobet, abrió un post que me toca de lleno. ¿A que cojones aspirais?. Creo que no estaría de más pasarse por él y observar como la gente se va quemando debido a la ingratitud de los 'videntes'.

Este post me ha llevado a volverme a plantear la participacion en los foros y el mantenimiento del blog. Yo llevo solo una semana con el inicio de un reto en la NBA y la NHL y desde el primer día me vengo preguntando lo mismo: ¿merece la pena tener la obligación de dia a dia actualizar los dos hilos en los foros y el post en el blog?. Merece la pena estar HORAS haciendo números, calculos, mejorando sistemas, posteando cuando sabes que no vas a recibir nada a cambio?. Creo que la respuesta a todo esto es: NO, NO MERECE LA PENA.

La ley del mínimo esfuerzo es lo que prima, más de 2000 visitas en 8 días en los foros, aquí también se ha subido la cantidad de gente que accede a la página y me busca en google, pero cuento con los dedos de una mano los comentarios y los agradecimientos.

Después de esto he llegado a la conclusión de que para mi no es rentable publicar ningún sistema como estos. Sistemas que me exigen a diario colocar algún dato. NO GANO NADA PUBLICANDO ESTO, mas bien al contrario, pierdo mucho tiempo, cosa que, como a la mayoría de nosotros, no me sobra.

Así que hoy una pregunta me da vueltas por la cabeza, ¿por qué posteamos?. Es probable que buscando la respuesta a esta pregunta encuentre la motivación para seguir presente en foros y blog. Pero hoy por hoy no lo veo nada claro, así que aprovecharé las fiestas navideñas para reflexionar sobre el tema entre polvorón y polvorón.

Preparando nuevos retos

Creia que ibamos a poder seguir adelante con el reto de la champions league, pero parece ser que Bwin ha decidido eliminar esas apuestas, con lo que acabaremos el reto aqui, por ahora. Me parece demasiado pretencioso suponer que ha sido por nuestro reto, pero la verdad es que podían haber seguido un poco más a ver que pasaba con nuestro sistema.

Pero no pasa nada, estoy en fase de preparación de otros nuevos basados en deportes americanos. No es que controle mucho de este tipo de deportes, pero me resultan bastante interesantes porque entre todos ellos suelen haber partidos durante toda la temporada. Además se juegan por la noche, con lo que las apuestas son como una carta a los Reyes Magos, dejas tus zapatillas colocadas por la noche y al despertarte vas a ver si te han dejado algun regalo. Eso me encanta!!

Ahora estoy en fase de validación de tres estrategias, las más avanzadas las tengo para la NBA y la NHL. Ambos retos son para partidos ganados / perdidos. En otros años he estado investigando sobre los Over Under, pero exigen mucho tiempo de recopilación y procesamiento de datos, así que este año he optado por apuestas al partido, y métodos más sencillos.

En la NBA los resultados eran bastante esperanzadores, en la fase de validacion del método llevaba analizados 38 partidos de los cuales había seleccionado 16 con un 100% de acierto en la predicción. El % de aicierto de la fase de ajuste del método era ya bastante alto, rondaba el 90% pero este nivel de acierto de la fase de validación me parecía exagerado. Así ha sido, en los ultimos 4 partidos ha fallado 3. Entre ellos el de los Lakers de ayer, contra Sacramento que había perdido 11 de los últimos 12 partidos. ¡Cosas de la vida!

En la NHL los resultados son mas estables, rondando el 60% de aciertos, lo que proporciona beneficiós ya que las cuotas al partido suelen estar por encima de 2.

El problema de ambos retos es que son diarios, y eso es algo muy exigente. No se si podré colocar los picks del reto a diario, por lo que también he estado investigando la NFL, aunque en este caso el sistema está mucho más verde. Y lo de verde no es por los beneficios, no penseis.

Por ahora voy a ir colocando las tablas de datos solo de la NHL y NBA, hasta finalizar las validaciones. Cuando termine la fase de validación pondre las tablas de datos con los picks seleccionados solamente. A todo ello podeis acceder directamente pulsando sobre el botón de la parte superior del Blog.

Analisis de Lineas Spread y Over/Under NBA

En el anterior post sobre la NBA dejamos en el aire el análisis sobre las líneas Over-Under y el Spread colocadas por las casas para los partidos de la NBA. En este post y en los siguientes vamos a realizar un análisis sobre la fiabilidad de estas predicciones dependiendo de la fase de la temporada. Para ello hemos dividido la temporada en tres fases, la primera incluye los 350 primeros partidos (aproximadamente 35 jornadas), la fase intermedia corresponde al grueso de la temporada y la fase final que agrupa los 200 últimos partidos antes de los play-off.

En este primer post veremos los resultados de la temporada 05-06 y en el siguiente comprobaremos si los patrones encontrados en esta temporada se repiten para la 06-07.

Para el análisis vamos a estudiar los errores de las predicciones de 4 variables, la puntuacion local estimada (PL), la puntuacion visitante estimada (PV), el spread para el equipo local estimado (Sp) y la linea Over Under estimada (OU). Las puntuacioines locales y visitantes estimadas las obtenemos a partir de la línea OU y el Sp de la siguiente forma:

PL = ENTERO (OU / 2 - Sp / 2)
PV = OU - PL

Las diferencias se establecen siempre como Valor real - Valor estimado

Los resultados son los siguientes:

  • Puntos Locales (PL)

La media de las diferencias para el tramo inicial es prácticamente 0 (-0.32), es decir, las predicciones de las casas van bastante ajustadas a las puntuaciones finales, aunque hay un tramo hacia el final de la fase inicial en el que se ven indicios de inestabilidad, con varios puntos por debajo de la media seguidos. Esto se corrige para la zona media de la temporada y al comienzo de la zona final llega un cambio importante. En un primer período las predicciones se van bastante por debajo (diferencias positivas) y luego sucede todo lo contrario.

Las medias de los tres periodos son muy cercanas a 0.
  • Puntos Visitante (PV)

Aquí sucede algo similar pero en sentido contrario, en el tramo final del período inicial (sombreado en rojo) parece que las predicciones de puntos del equipo visitante fueron algo bajas. Esta falta de precisión en este tramo junto a la observada en las predicciones de los puntos del equipo local hará que el Spread tenga unos valores muy diferentes para la primera parte y la última parte de este periodo inicial. El resto de la temporada se ajusta bastante bien y su media se situa al rededor del 0, y aunque es ligeramente superior, no llega a 1 punto.

  • Spread (Sp)

Como ya hemos comentado el tramo inicial de las diferenicas para el Spread se ven unos claros signos de inestabilidad (areas sombreadas en rojo y azul). El modelo predecia Spread mucho más altos para el equipo local (zona roja: puntos por debajo de 0 significan que los valores reales son menores que los estimados) y parece que hubo una correccion en el modelo que hizo que las predicciones se fuesen justo al lado contrario (zona azul: valores reales mayores que los previstos). Estas variaciones en las predicciones del modelo pueden venir originadas por lo que comentabamos en la entrada inicial. La temporada estaba comenzando y los datos introducidos en el modelo no eran los suficientes como para tener unas predicciones estables.

Los errores de las medias de las predicciones para esos dos períodos del tramo inicial son de -1.32 puntos para el tramo inicial y de 2.45 para el final. Altísimos si los comparamos con el resto de la temporada, donde la media de los errores de las predicciones sobre el Spread rondan los 0 puntos, y solo se aprecia un ligero ascenso en el tramo final de la temporada.

  • Over/Under (OU)

Este es el gráfico más estable de todos, las medias de los errores para los tres tramos se distribuyen de manera aleatoria por encima y por debajo de la media y solo en el tramo final se aprecian ligeros desajustes. Las medias de los errores son siempre positivas y solo en el tramo final sube algo más pero no llega nunca a 1 punto.

Como conclusión podríamos decir que los modelos de predicción de las casas para esta temporada han sido realmente buenos, descontando el tramo inicial de la temporada. Veremos si los datos de la temporada 06-07 confirman estas conclusiones.

Retos: Resultados y Picks

La idea de esta sección es mantener una pequeña estadistica de todos los retos propuestos en el blog para comprobar sus resultados. En la parte superior del blog he colocado también una pestaña que permite acceder directamente a ella de una forma rápida.

Así mantendremos el blog diferenciado en dos zonas. La primera sería la del blog en sí, en la que iremos colocando las entradas normales incluyendo la primera explicación de todos los retos que vayamos planteando y en esta segunda iremos colocando los picks, resultados, estado de los retos... etc.

Por ahora os dejo con las estadisticas de los retos realizados.

RETO CHAMPIONS LEAGUE:

En principio quería seguir con este reto a ver que resultado final obteníamos y de paso comprobar si podíamos pillar alguna cuota de 15, que siempre hace ilusión, pero en Bwin han eliminado estas apuestas para los partidos de hoy. Esperemos que las vuelvan a colocar para poder seguir adelante.

RETO VALUEBETS:

Este reto lo voy a dejar aqui porque para mí es muy exigente en cuanto a tiempo que tengo que dedicarle y de tiempo no voy precisamente sobrado.

RETO GANADOR ROLAND GARROS'08:

Viendo los datos de este reto llama la atención que solo con 1 acierto hayamos acabado en positivo, pero así fue. Arriesgamos en la última apuesta y salio bien.


RESUMEN FINAL:

Resumenes gráficos de variables en escala ordinal

Los gráficos utilizados en el resumen de datos para variables en escala ordinal son los mismos que para el caso de variables en escala nominal, es decir, histogramas o gráficos de barras y diagramas de sectores. La única diferencia la encontramos en la interpretación del histograma. En los gráficos de escala nominal, la posición de cada una de las categorías era indiferente, mientras que en este caso la posición nos informa sobre el orden en el que se encuentran las categorías.

Veamos un ejemplo. Utilizamos los mismos datos que en la entrada anterior de representaciones gráficas:

Este gráfico

Es exactamente el mismo que este otro:

Lo único que hemos hecho es reordenar las categorías. Sin embargo con datos en escala ordinal, la forma del gráfico si que es importante, ya que las categorías SI estan ordenadas.

Ejemplo posición en parrilla de salida de Alonso y Piquet

Aquí se puede ver que las barras naranja (Alonso) se encuentran agrupadas más a la izquierda (puestos mejores en parrilla) que las barras azules (Piquet).

El objetivo de esta representación gráfica es simplemente mostrar diferencias en las distribuciones. Podemos encontrar diferentes formas de distribuciones a simple vista, pero para confirmar estas diferencias habría que hacer uso de los test de hipótesis, que supongo veremos en posteriores entradas.

Lo único que haremos por ahora es estimar probabilidades y comprobar que se ajustan a las cuotas ofertadas por las casas. Así, recuerdo un pick que puse en Forobet al comienzo de la temporada de F1 sobre un H2H entre Alonso y Piquet. La cuota estaba en torno al 1,15 para la clasificación y a mi me parecía un regalo. Era una 'chiquicuota', como se le suele llamar, pero para mi, esta cuota no debería haber pasado de 1,01 o 1,02. Y los datos al final de la temporada así lo han demostrado. Nelsiño no ha ganado ningún H2H en clasificación a Fernando. Si la cuota hubiese sido correcta, supondría una probabilidad de 1/1,5*Fracción de pago (suponemos un 85%) = 74%

Multiplicando este 74% por el total de carreras (18) supondría un 13-5 a favor de Alonso, cuando ha sido un 18-0. Después de hacer un simple test de hipótesis con estos datos, podemos decir que hay evidencias estadísticas que demuestran que la cuota colocada no era correcta. Es decir, habiamos encontrado un autentico value. Con lo que la apuesta estaba más que justificada.

Páginas recomendables: OLBG

Entre las muchas páginas que hay relacionadas con las apuestas hay una que me parece muy interesante tanto por la cantidad de información que tiene, como por los servicios que puedes encontrar. El único problema que tiene es que solo está en inglés, como la mayoría de páginas relacionadas con apuestas. En OLBG (Online Betting Guide) podeis encontrar desde competiciones de picks hasta calculadoras de stakes, pasando por los tipicos valuebets o surebets, entre otras muchas opciones. Además tienen una sección en la que analizan los movimientos de las cuotas por horas y en la que hacen una distinción de los bookies en función de como se ha ido produciendo esos movimientos. Ellos han creado tres grupos: los Steamers, los Drifters y los Sleepers. Una traducción bastante libre de estos nombres podría ser: los Favoritos, los Ofertones y los Dormilones.

Steamers

Los Steamers son selecciones que han sido elegidas por una gran cantidad de apostantes a lo largo del día, bien porque la cuota era más alta de lo esperado o bien porque son apuestas consideradas como casi seguras. Seguir esta tendencia puede resultar provechoso pero hay que ser cautelosos y saber a que estamos apostando. Estos movimientos masivos hacia un resultado suelen ser habituales en las carreras de caballos, aunque también pueden aparecer en otros deportes.

La verdad es que siempre resulta agradable apostar a algo con la seguridad de que puede salir, pero no es del todo conveniente apostar sin dar importancia a la cuota a la que estamos apostando. Estos desajustes en el mercado hacen que las apuestas no esten equilibradas para los bookies. Lo interesante para ellos es tener un mercado bien equilibrado, para conseguirlo, moverán las cuotas para ofrecernos a los Drifters (Ofertones) y atraer a otros apostantes hacia esta apuesta para compensar la cantidad de apostantes que han optado por la favorita.

Podeis chequear los Steamers que ofrecen ahora en OLBG siguiendo este enlace:
http://www.valuechecker.co.uk/selection/steamers.php

Drifters

Los difters son generalmente apuestas que no 'gustan' a la gente y a las que los bookies les suben las cuotas durante el día, para hacerlas mas atractivas. .

En un partido de futbol, si se aprecia un drifter para un equipo es probable que haya ocurrido algun cambio de última hora en uno de sus jugadores importantes. Una lesión de ultima hora puede hacer que una cuota varíe drásticamente. Sin embargo la causa más importante para que aparezca un drifter son las fuerzas del mercado. Siempre que aparezca una apuesta desequilibrada el bookie modificará las cuotas para atraer dinero a la opción menos seleccionada, como ya hemos comentado. A pesar de que por norma general un drifter suele acabar como apuesta perdedora, hay que analizar bien nuestros datos porque es probable que encontremos en estos drifters alguna apuesta con value.

Podeis chequear los drifters que ofrece OLBG aqui:
http://www.valuechecker.co.uk/selection/drifters.php

Sleepers

Los Sleepers son aquellos bookies que ofrecen cuotas mucho mayores que el resto. Esto puede venir provocado bien porque el bookie se haya 'dormido' al cambiar las cuotas o bien porque sus estadísticas le indican que el movimiento del mercado es incorrecto. Estas situaciones son especialmente interesantes para los traders.

En el ejemplo que colocan en la web, explican como en una carrera de caballos las cuotas por uno de ellos comenzaron en torno a 4.5 a las 9 de la mañana para descender hasta 3.25 a lo largo del día. La mayoría de bookies bajaron la cuota pero hubo otros que 'se durmieron'. Resultado final: el caballo ganó.

Si quieres ver los sleepers que ofrecen OLBG puedes hacerlo siguiendo este enlace:
http://www.valuechecker.co.uk/selection/sleepers.php

Resultado Picks Liga Campeones

Ayer me vino justo analizar los tres partidos y colocar los picks antes de que comenzasen, pero mereció la pena, 2 de 3 aciertos a esas cuotas es para estar contento. Para los picks de ayer utilicé los datos de Soccerway que me permiten analizar bastante más partidos que los 6 ofrecidos por Bwin.

Tomé todos los partidos de cada equipo en competiciones oficiales desde el comienzo de la liga. Y fui anotando el primer evento de la primera parte, como ya he explicado. Al final el resultado es una tabla en la que comparamos las cuotas reales con las previstas:



Como se puede ver las cuotas ofrecidas para los goles de los dos partidos acertados eran superiores a las teóricas, por eso las seleccionamos para los picks. En el partido del Mancherster volvía a aparecer la cuota de Sustitución muy por encima de la cuota teórica. De 42 partidos analizados en 9 de ellos el primer evento había sido sustitución, así que la cuota teórica es 42/9 = 4,67 muy inferior al 13 ofrecido. Esta cuota la debemos acertar una de cada 5 veces aproximadamente, si está bien calculada la probabilidad, con lo que el fallo entraba dentro de lo posible. Era una apuesta arriesgada pero con un poquito de suerte, es probable que podamos 'cazar' una de estas cuotas altas en próximos eventos.

Incluso con este fallo nos ponemos en positivo en el reto y seguimos acumulando datos en nuestra base de datos para hacer mas fiables las predicciones.

Nos vemos en próximas rondas de la Champions League.

*********** RESULTADOS DEL RETO ***************
Picks totales: 8
Aciertos: 4 (50%)
Uds apostadas: 43 uds.
Beneficio/ Pérdidas: +10.13 uds.
***********************************************

Picks Liga Campeones

Siguiendo lo que comentabamos en el otro post de picks vamos a seleccionar para hoy lo siguiente:

  • Partido Fiorentina - Bayern: Gol 5 uds @ 2.75
  • Partido R. Madrid - Juve: Gol 5 uds @ 2,65
  • Partido Celtic - Manchester: Sustitución 5 uds @ 13
No me extiendo más que no hay demasiado tiempo. Mañana comentaremos los picks y los resultados.

Un saludo

NBA: Comienza el show

Señoras y señores, con todos ustedes, la mejor liga de baloncesto del mundo. La NBA arranca esta noche con 3 partidos y las casas de apuestas han tenido que rescatar del olvido sus sistemas y colocarlos a punto para la nueva temporada. Y esto me ha dado que pensar, ¿de donde sacarán los datos para las predicciones de los OVER/UNDER y los spread?, ¿serán fiables estos datos?.

Después de un largo verano, los equipos han cambiado sus plantillas, se han reforzado, los lesionados se han podido ir recuperando, los viejos son un año mayores y los nuevos se tienen que ir acoplando. Por todo esto, si yo fuese el encargado de colocar estas líneas, no estaría nada tranquilo. Cualquier sistema que se precie necesita datos fiables y cuanto más ceranos a la realidad mejor. Y ahora no estamos en esas condiciones.

El año pasado, comencé a preparar un modelo de predicción para la NBA con datos de la primera parte de la temporada. Además tomaba como base las predicciones de NBAStuffer sobre puntos anotados por partido. Los datos de la web parecían bastante fiables, así que he ido a ver que 'decían' sobre estos tres primeros partidos y me he llevado una sorpresa. No van a publicar datos de predicciones hasta primeros de Diciembre, por una razón completamente lógica: Necesitan datos reales para ajustar su modelo de predicción. Exactamente lo que yo creía.

Todo esto me lleva a enredar y estrujar datos, más aún. Y vamos a ver en las proxímas entradas, si las casas de apuestas colocan las líneas a ojímetro en estos primeros partidos de la temporada o tienen modelos lo suficientemente sofisticados y buenos para dar predicciones ajustadas en estas circunstancias. También veremos si los datos de la pretemporada son extrapolables a la temporada regular o no. Pero no adelantemos acontecimientos, pronto saldremos de dudas.

Yo, por mi parte, me uno a NBAStuffer y prefiero esperarme a tener datos antes de lanzarme con ningún sistema.

Suerte con vuestros picks. ¡QUE COMIENCE EL SHOW!

Resultados Picks Champions League

Ayer me resulto imposible conectarme, como dicen en la tele, por causas ajenas a mi voluntad, con lo que perdimos la oportunidad de seguir estudiando la estrategia de picks de la Champion League.

El resultado del martes no fue todo lo bueno que hubiese querído basicamente por dos motivos. El primero porque en los partidos que apostamos a la tarjeta como primer evento se dieron goles muy tempraneros, 4' para el Bayern (tarjeta a los 29') y 8' para el Steaua (tarjeta a los 19'). En ambos casos faltó un poquito de suerte, y el segundo fue la selección del stake por el criterio de kelly. Como había comentado en mismo post, 6 partidos es probable que no sean suficientes para estimar las tendencias de cada uno de los eventos y no contento con eso, no solo selecciono picks sino que tambíen asigno stakes tomando las probabilidades calculadas con los datos de los 6 partidos. De esta forma le estoy dando mucho peso a un dato que todavía no se si será correcto. Así que para el resto del reto asignaré un stake plano de 5 uds a cada pick.

Tras los picks del martes el reto queda de la siguiente forma:

Picks totales: 5
Aciertos: 2 (40%)
Uds apostadas: 28 uds.
Beneficio/ Pérdidas: -1.88 uds.

Con el stake plano no hubiesemos tenido pérdidas.

Para los siguientes picks del reto, me guardaré los datos de los 6 partidos que he tomado esta vez y así iremos incrementando la base de datos de partidos analizados, con la esperanza de mejorar en nuestras predicciones. A ver si hay más suerte la próxima vez.

Picks Liga Campeones

Esta semana vuelve la champions y entre la gran cantidad de apuestas que ofrecen las casas para estos partidos encontramo las apuestas a eventos en escala nominal como los que vimos en el ejemplo de hace un par de post. Así que a modo de repaso y para ver su funcionamiento vamos a utilizar el mismo criterio que empleamos allí para seleccionar posibles apuestas.

Recordemos los pasos:

1. Buscamos los datos de los 6 ultimos partidos para cada equipo que ofrece Bwin
2. Anotamos el primer evento de los ofrecidos para cada uno de los partidos
3. Hacemos un resumen de estos datos
4. Evaluamos la probabilidad de cada evento y calculamos su cuota teórica esperada
5. Comparamos la cuota esperada con la ofrecida por la casa y seleccionamos aquellas apuestas en las que la cuota esperada es menor que la ofrecida.

Con esto tenemos lo siguiente (he seleccionado estos partidos por cuestión de tiempo, no doy para más):



Y seleccionamos como picks:

  • Partido Bayern - Fiorentina: Tarjeta amarilla 9 uds @ 1.75
  • Partido Juve - R. Madrid: Gol 5 uds @ 2.75
  • Partido Manchester - Celtic: Sustitución 2 uds @ 13
  • Partido Fenerbahce - Arsenal: Gol 4.5 uds @ 2.75
  • Partido Steaua - Olympique: Tarjeta amarilla 7.5 @ 1.75

El stake lo he hecho siguiendo el criterio de kelly

Los sombreados en amarillo también cumplen ell criterio de ser mayor la cuota ofrecida que la teórica, pero el problema que tienen es que hay muy pocos partidos para confirmar esa discrepancia entre cuotas y los he dejado en 'cuarentena'.

El sistema teoricamente ha de funcionar a largo plazo, así que lo mantendremos para los partidos de la Champion League a ver como evoluciona. El único pero que tiene es que suponemos que los últimos 6 partidos de cada equipo son un buen estimador de las probabilidades de los eventos que estamos analizando, cosa que probablemente no sea del todo cierta. Así que recomiendo no seguir los picks hasta tener datos suficientes para comprobar si el sistema funciona o no.

Por otro lado, después de analizar los partidos de hoy, parece que la casa coloca las cuotas de manera genérica, con muy poca variación de un partido a otro. Esto puede jugar a nuestro favor porque hay partidos en los que las cuotas de un partido standard no se ajustan demasiado bien, como es el caso del partido Juventus - Real Madrid. Para el Madrid en 5 partidos de los 6 analizados, el primer evento ha sido un gol, y solo en 1 ha habido una tarjeta. Sin embargo en los partidos de la Fiorentina, en TODOS el primer evento ha sido una tarjeta.

Veremos lo que pasa hoy y mañana seguiremos.

La distribución de Poisson: Test de ajuste

En esta segunda entrega sobre el uso de la distribución de Poisson para predecir resultados de partidos de Futbol vamos a exponer como podemos comprobar si nuestros datos se ajustan a este tipo de distribución o no. Esto se conoce en estadística como test de bondad de ajuste o, en inglés, goodness of fit test.

Este proceso que vamos a explicar se puede utilizar con cualquier tipo de variable en escala nominal u ordinal y sirve para cualquier tipo de distribución.

El test está basado en la distribución chi cuadrado () y fue creado por uno de los más reputados estadísticos de los últimos tiempos, Karl Pearson. Su base, como en todos los test de hipótesis, consiste en establecer dos hipótesis, la hipótesis nula que considera que los datos que tenemos se ajustan a una determinada distribución y la hipótesis alternativa que es la negación de la nula, es decir, nuestros datos no se ajustan a la distribución. Dicho así no parece muy claro, pero es como se suele explicar la teoría. Traducido al cristiano sería algo así: Tenemos unos datos que 'parece' que siguen una determinada distribución, pero hay unas diferencias entre los datos que tenemos (observados) y los que deberían de ser (esperados). ¿Son esas diferencias lo suficientemente grandes para que sean provocadas por el azar?. La respuesta a esta pregunta la obtendremos con el test de bondad de ajuste.

Alguno a estas alturas se estará preguntando, ¿pero para que necesito hacer esto, si saco la media y lo meto en la fórmula de Poisson y obtengo el resultado que necesito?. La respuesta es sencilla, si nuestros datos no siguen la distribución de Poisson, todas las predicciones que hagamos utilizando las fórmulas para esta distribución serán erroneos y si nos basamos en ellos para apostar, tenemos muchas posibilidades de ver numeros rojos en nuestro bank a final de temporada.

Después de este pequeño paréntesis económico, vamos a ver como podemos realizar el test de bondad de ajuste a una distribución de Poisson en Excel.

Para ello tomaremos los datos del total de goles marcados por partido en la primera división durante la temporada 2007-2008. Pulsando sobre estadísticas tendremos el resumen de los datos que necesitamos. Estos serían nuestros valores 'Observados'. El siguiente paso que debemos hacer es calcular la media de los goles totales marcados por partido. Al tener los datos resumidos no podemos utilizar la función promedio() si no que debemos hacer una especie de 'desagrupamiento'. Esto, como siempre, se puede hacer de varias formas, yo voy a explicar dos de ellas, las más sencillas.

La primera es crear una nueva columna en la que multiplicaremos el número de goles por la cantidad de partidos (Columna C). Sumaremos todos esos productos y dividiremos este valor por el total de partidos jugados.

La otra es usar la formula sumaproducto(A2:A11;B2:B11) y nos ahorramos el paso de las multiplicaciones, que lo hace excel internamente. El resultado es el mismo para ambos casos, ¡Faltaria más!.

Una vez calculada la media, lo que hacemos es determinar los valores 'Esperados' según una distribución de Poisson con esa media. Esto lo calculamos multiplicando la probabilidad de Poisson para cada resultado, por el total de partidos.

La última columna la utilizaremos para calcular el estádistico con la siguiente fórmula:



Esta columna es importante, porque nos da información de donde se producen las mayores discrepancias. Cuanto mayor sea el valor que obtengamos, mayor es la discrepancia entre el valor observado y el esperado. Más alejado está ese punto de su lugar teórico predicho por la curva de Poisson y más probabilidad tenemos de que el resultado del test nos diga que nuestros datos no se ajustan bien a la curva.

Ya solo nos queda sumar todos estos valores y 'buscar' dentro de la función y comprobar si las diferencias que hemos encontrado son lo suficientemente grandes o no para rechazar o no rechazar la hipótesis nula. Ya veis que he dicho rechazar o no rechazar, en lugar de rechazar o aceptar, porque NUNCA se acepta la hipótesis nula. Este es un error muy común en la interpretación de los resultados de test de este tipo. Pero dejaremos esto para un futuro.

La función tiene dos parámetros, el primero de ellos es el valor de nuestra suma, y el segundo son los grados de libertad para los que vamos a calcular este estadístico.

Los grados de libertad se obtienen con la siguiente fórmula: GL = Nc - Np - 1

Siendo Nc = al número de categorías que tenemos y Np = número de parámetros que estamos estimando. Para nuestro caso tenemos 10 categorías y vamos a estimar un parámetro solo que es la media: GL = 10 - 1 - 1 = 8

El valor que nos devuelve es lo que en estadística se llama P-Value, y corresponde a la probabilidad de equivocarnos si rechazamos la hipótesis nula. Como norma general se suele tomar como valores de corte el 5% ó el 1% dependiendo de lo restrictivos que seamos. Este valor lo debemos de tomar ANTES de la realización del test y será nuestro límite para rechazar o no rechazar la hipótesis nula.

En el ejemplo tenemos un P-Value de 0.54 con lo que debemos decir que las diferencias que hemos encontrados no son lo suficientemente grandes como para decir que nuestros datos no siguen una distribución de Poisson. Como esto es un poco engorroso, hay mucha gente, que viendo este P-Value, adopta una postura más comprometida y llega a decir que nuestros datos siguen una distribución de Poisson. Pero como ya he explicado esto no es del todo cierto, puede que siga una distribución de Poisson o puede que se acerquen más a otro tipo de distribución. El aspecto final de la hoja sería el siguiente:



Como no quiero extenderme más, solo hago una puntualización final. Si os fijais tenemos dos categorías con menos de 5 datos (8 y 9 goles), siendo estrictos deberíamos haber agrupado estas dos categorías y crear una nueva como más de 6 goles, agrupando en ella las categorias 7, 8 y 9 goles. El resultado del test varía poco en este caso, así que para no complicar más la explicación lo he dejado así. Si alguno está interesado en como se haría el test en este caso que lo diga y lo explicaremos.

Un saludo y hasta la próxima

EDITO 22/07/10: Al final he encontrado una forma de añadir hojas de cálculo al blog y he creado una mini hoja Excel para calcular los resultados de un partido de Futbol a partir de la media de goles marcados por cada equipo. La hoja la teneís aqui.

Resumenes gráficos de variables en escala nominal

Las dos formas más frecuentes de resumir gráficamente variables de escala nominal son los diagramas de barras y los diagramas de sectores. Lo que se representa en ambos casos es la cantidad de eventos que se han dado en cada una de las categorías. Es importante señalar, que el orden en el que se presentan las categorías no tiene ningún significado.

En apuestas deportivas no es fácil encontrar casas que nos ofrezcan apuestas relacionados con variables en escala nominal. Uno de los pocos ejemplos que podemos encontrar son apuestas al primer evento que se puede producir en un partido de futbol. Bwin es una de las pocas casa en las que se pueden encontrar apuestas de este tipo y hace un par de semanas ofrecían lo siguiente para el partido entre el Cluj y el Chelsea (lo he seleccionado en honor a mi compañero Baldani que es un apasionado de la liga Rumana):

Primer evento en la primera parte

1. Tarjeta @ 1.7
2. Gol @2.65
3. Sustitución @15
4. Medio tiempo @8.5

Este es un claro ejemplo de variables en escala nominal. Se ofrecen 4 categorías diferentes con sus cuotas entre las cuales no existe ningún tipo de relación de orden, entendiendo por orden, el que una categoría sea mayor a otra. Evidentemente no se puede decir que tarjeta sea mayor que sustitución o que gol sea menor que medio tiempo.

Para realizar nuestro resumen utilizaremos los datos que ofrecía la propia Bwin. Allí podíamos encontrar los resultados de los dos equipos en sus seis ultimos encuentros y además entrando en cada uno de los partidos podíamos ver los detalles del mismo. Esta será nuestra fuente de datos para este ejemplo.

Iremos partido por partido apuntando el primer evento hasta obtener una columna con 12 datos (6 datos por cada equipo)

Una vez tenemos esto, el siguiente paso es construir un histograma y esto se puede hacer de varias formas en Excel. La que más utilizo, porque creo que es la más rápida y flexible es la tabla dinámica, aunque también se pueden usar otras como los subtotales, la función histograma implementada en el complemento de análisis de datos, la función de excel frecuencia() o la más simple contar.si(). Es esta última la que vamos a explicar en este ejemplo.

El resultado final que vamos a obtener es una hoja como esta:

En la que en la columna D tenemos los datos de los partidos, que hemos ido sacando de Bwin y en las columnas H-I-J-K tenemos los resultados.

Así, partiendo de la tabla de datos, vamos a crear la siguiente:

En la primera columna colocaremos los cuatro tipos de eventos. IMPORTANTE, la función contar.si() no distingue entre mayúsculas y minúsculas, pero si es sensible a los espacios entre palabras o al final de las mismas. Así que, lo que recomiendo, es copiar y pegar los identificadores de cada una de las categorías para no equivocarnos al teclear.

En el resto de la tabla introduciremos la siguientes fórmulas. Los $ supongo que sabeís para que sirven, y se colocan SOLO EN WINDOWS pulsando [F4] repetidas veces, para fijar la celda, la columna o la fila. Volveremos sobre esto en otras entradas.


La columna de frecuencias la obtendremos con la función contar.si() de Excel, que tiene dos argumentos. El primero es el rango donde se encuentran nuestros datos, y el segundo es el criterio, lo que queremos que Excel cuente. Para nuestro ejemplo el rango de datos siempre es el mismo y lo fijamos con los símbolos de $ para que no varíe al arrastrar la función y el segundo es el nombre de la categoría. Con esto conseguiremos que Excel nos cuente la cantidad de veces que aparece el nombre de la categoría en el rango de datos que le hemos dado. A esto habitualmente se le llama frecuencia.

En la siguiente columna hemos calculado un cociente entre la frecuencia de cada categoría y el total de elementos que tenemos. Esto representa la cantidad de elementos que tenemos de cada categoría con respecto al total. A esto se le llama frecuencia relativa y se suele representar en porcentajes, porque también coincide con la probabilidad de que se de un resultado de esa categoría.

Y con esto tenemos ya nuestro resumen gráfico en forma de histograma


Que podríamos representar también en diagrama de sectores:


Como podeis ver en este caso los % coinciden con las frecuencias relativas que hemos calculado en la tabla.

El último paso que nos quedaría sería el de utilizar estos datos para evaluar las cuotas que nos ofrecía Bwin. Si considerasemos como representativos estos seis partidos de cada equipo para evaluar el partido en cuestión, las cuotas que Bwin debería haber ofrecido serían las mostradas en la última columna de la tabla. Para su cálculo simplemente divdiremos 1 por la frecuencia relativa. Comparando estas cuotas teóricas con las ofrecidas por Bwin vemos que existe una discrepancia en la de Sustitución, que Bwin la ofrecía a 15, mientras que en nuestro cálculo habíamos obtenido 6. Esta sería para nosotros una apuesta de valor (value bet) y sería la que deberíamos elegir.

Antes de acabar puntualicemos varias cosas, por si las moscas.

1. Los datos de partida son inventados, pero las cuotas eran las reales
2. No es muy conveniente utilizar solo 6 partidos como un estimador razonable. Cuando se usan tablas de contingencia se habla de que hay que tener como mínimo 5 datos por cada casilla. En nuestro caso sería conveniente tener al menos 5 datos para cada una de las categorías, lo que solo se cumple para una de ellas.
3. Es muy probable que la value bet que obtengamos no sea la que tiene una probabilidad más alta de salir, lo que quiere decir que es probable que no salga. Pero, pero, pero, si seguimos utilizando este método y nuestros análisis son correctos, la frecuencia con la que se irán dando los aciertos hará que se compensen las pérdidas a largo plazo.

Creo que ha sido un pequeño ladrillo para comenzar la semana. Espero que no se haya dormido nadie. Hasta otra

Las dos caras de la verdad

En relación a la entrada anterior, haremos un comentario sobre la preparación para apostar. Desde luego que no tenemos que hacer una gran marca en el test de Cooper, ni lograr hacer más de 100 dominadas para afrontar el cierre de una apuesta, pero sí que debemos partir de un estado físico y mental mínimamente adecuado para este hecho.

Cuando nos enfrentamos al cierre de una apuesta, suceso que habitualmente hacemos con total naturalidad en la mayor parte de los casos, debemos ser conscientes de que la calma y la frialdad han de anteponerse a cualquier otra sensación del cuerpo. Con la misma predisposición deberemos proceder a la lectura de los infinitos pronósticos que se ven publicado en los diferentes foros, blogs y demás espacios de la red.

Si leyésemos un post de este tipo ¿cuál sería nuestra reacción?

F.C.Barcelona-Atlético de Madrid: el segundo partido más esperado del año para los rojiblancos tras el duelo con su eterno y vecino rival el Real Madrid. Este partido enfrenta al quinto y séptimo clasificados en la liga con un Atlético más que motivado para la victoria final. Comandados por su líder el Kun y reforzados sus planteamientos tras el partido de la Champions League, competición en la que marchan co-líderes empatados a puntos con el todopoderoso Liverpool, llegan a un Camp Nou que esperará a los blaugranas con excepticismo.

Tras la agónica remontada de los culés en campo del débil Shaktar Donest, propiciado por un error colegial del portero, los locales tendrás más dudas que certezas a la hora de plantear su fútbol. Con un Henry que ha pasado de ser el 9 indiscutible de Guardiola a ser el blanco de todas las críticas, un Etoo tan voluntarioso como poco efectivo en su mejor faceta, el gol, y un Messi que parece ser un carro de fuegos de artificio, deberán doblegar a la tercera mejor defensa del campeonato. Esto, sumado a que en los últimos 8 enfrentamientos directos del Barcelona-Atlético sólamente 2 cayeron del lado catalán, podemos arriesgar un stake moderado por la victoria rojiblanca en el colosal estadio del Barcelona a la descabellada cuota de 6,50.

Si por contra leemos para el partido F.C. Barcelona-Atlético de Madrid leemos el siguiente post a favor de la victoria local, ¿cuál sería nuestra inercia?:

F.C.Barcelona-Atlético de Madrid: clásico entre los clásicos en el Camp Nou. El F.C. Barcelona recuperado de las dudas que asaltaron tras la derrota en "Los Pajaritos" ha comenzado su despegue a fuerza de remontadas. Cuando todo parecía en contra de la reacción de los de Pep en el Olímpico de Monjuit, Henry sacó su mejor cara y logró cazar un rechace que supuso el inicio del despegue culé. Un partido destinado al empate, fue salvado por el camerunés Etoo con una acción que terminó en un más que discutido penalty transformado por Messi, el mejor jugador del mundo en estos momentos. Y es que el Barcelona tiene demasiados recursos ofensivos, con Xavi (en la versión más goleadora de su historia), Etoo, Henry, Messi e incluso Gudhjonsen desde el banquillo hacen muy difícil que el Barcelona termine un partido sin hacer gol.

Por si este baño de moral fuese poco, volvió a zambullirse en tan cálidas aguas durante su enfrentamiento en la máxima competición continental. Se perfiló con una nueva remontada como sólido líder de su grupo y ofreciendo un final de partido que nos indican lo fuerte y mentalizado que está el conjunto de Guardiola para exprimir los partidos hasta obtener la victoria.

Por el lado colchonero, muchas serán las bajas que presenten el domingo. Aguirre no podrá contar con la presencia ni de Maniche, ni Simao, Seitaridis, Pablo Ibáñez y Forlán, por lo que ha recurrido a tres hombres del filial, Álvaro Domínguez, Keko y Joshua para completar la convocatoria. Si a esto le añadimos que de los últimos tres enfrentamientos entre los dos, el Barcelona obtuvo la victoria en 2 de ellos y sólo perdió a domicilio el año pasado, que ha marcado un total de 11 goles en esos tres partidos y recibido 4, podremos confiar en la segura victoria blaugrana.

Esto nos indica que además de dejar a un lado nuestros colores futbolísticos o deportivos, deberemos medir muy bien los post, que normalmente nos muestran los datos que más justifican el pronóstico del autor, dejando a veces otros que bajarían algunos puntos la confianza en los mismos.

Precaución amigo apostador. Toda apuesta suele tener dos caras como la película de Richard Gere y Eduard Norton que desde aquí recomiendo ver.

¿Por qué apostamos?

Existe una pregunta que todo apostante debería hacerse alguna vez: ¿Por qué apostamos?. O más concretamente ¿por qué he seleccionado este evento para apostar?. En la mayoría de los casos nos encontraríamos con respuestas del tipo, 'porque creo que va a salir', 'porque me da a mi que voy a acertar', 'porque tengo el presentimiento' o cosas similares. No parecen estos razonamientos demasiado lógicos ni consistentes, como para concluir que podemos seguir en esto de las apuestas con una cierta garantía de exito.

Si algún bookie nos ofreciese la posibilidad de apostar a que el gordo de la lotería nacional va a ser un número par o impar a una cuota de 1,95, es bastante probable que a ninguno de nosotros nos llamase demasiado la atención. Pero que pasaría si viesemos algo así:

  1. El gordo de la lotería nacional va a ser un número par @ 2,3
  2. El gordo de la lotería nacional va a ser un número impar @1,8

¿Que es lo que haríamos en este caso?.

Supongo que una gran mayoría pondría su dinero en la selección 1, pensando que tenemos una cuota de 2,3 en un evento con el 50% de probabilidad, un evento cara o cruz, básicamente. Este tipo de razonamiento es de lo más lógico ante este tipo de apuestas y debería ser el que utilizasemos para seleccionar cualquiera de nuestras apuestas deportivas. Deberíamos buscar cuotas con valor ('value bets'), cuotas cuya probabilidad asociada sea menor a la probabilidad real de que el resultado se de.

Una cuota de 2,3 correspondería, despreciando la comisión del bookie, a una probabilidad asociada de 1 / 2,3 = 43,48%. Esto es más de un 6.5% menor que la probabilidad real de que se de este resultado. Si tuviesemos la suerte de encontrar eventos de este tipo, el beneficio final esperado de nuestras apuestas sería:

VE = 0,5 * (2,3 -1) - 0,5 * 1 = 0,15

Es decir a largo plazo estaríamos ganando un 15% por unidad apostada.

El problema de esta estrategia, que repito debería ser la que nos guiase en esto de las apuestas, radica en la estimación de la probabilidad real de que el resultado se de. Teoricamente el bookie tiene más medios, tanto humanos como materiales, para estimar esta probabilidad mejor que nosotros. Lo que sucede es que hay veces que bien el bookie, bien nosotros (la mayor parte de las veces), fallamos en la estimación. Y a esto es a lo que quería llegar, muchas veces la estimación de la probabilidad no es tan sencilla como parece a primera vista.

En la pelicula 21 BlackJack, Kevin Spacey, que interpreta a un profesor de ecuaciones no lineales en el mítico instituto MIT, propone un problema a sus alumnos durante una de sus clases. El problema es una variante del famoso problema de Monty Hall, y decia algo así (lo cito de memoria):

Tengo tres cajas tapadas, en una de las cuales hay un cheque de 1000$ y te doy a elegir una de ellas.

Una vez has hecho tu elección yo, que se en que caja está el cheque, te abro una de las dos cajas que no has elegido y que no contiene el cheque. Si llegado a este momento te diese a elegir entre quedarte con tu caja o cambiarla por la otra que yo tengo ¿que harías?.

Una vision rápida y errónea del problema, podría ser.

En un primer momento tengo 3 cajas, con lo que la probabilidad de acertar al seleccionar la caja es de 1/3

Cuando abre la caja mala, me quedo con dos cajas, con lo que la probabilidad de acertar ahora es de 1/2, y es la misma para ambas cajas. Con lo que me da lo mismo cambiar que quedarme con la caja que había elegido en un principio. Meeeeeecccc, ERROR!!!

Demos un paso atrás y volvamos al principio.

Tenemos tres cajas y elegimos una. Tenemos 1/3 de posibilidades de haber elegido la caja buena y el profesor tiene un 2/3 de probabilidad de haberse quedado con la caja con el cheque. Si al abrir una caja que no contiene el cheque, me dan la posibilidad de pasarme al conjunto que tenía 2/3 de posibilidades de tener la caja con el cheque, así que debo cambiar siempre. Si hago esto, solo perderé en los casos en los que haya tenido la suerte de elgir la caja con el cheque en la primera elección, que será el 33% de las veces, mientras que ganaré el cheque en el 66% de las veces restante. Así, como dicen en la película, cambiaremos y le agradeceremos el favor de darnos un 33% más de probabilidad de acertar.

Casos con apariencia sencilla como este, inducen muchas veces al error en las estimaciones de las probabilidades y, por desgracia para nosotros, en las apuestas deportivas los casos son bastante más complicados, con lo que la probabilidad de equivocarsenos en las estimaciones son mucho mayores. En las diferentes entradas del blog relativas a la estadistica lo que vamos a intentar es ofrecer las pautas y herramientas necesarias para que nuestras estimaciones sean lo más precisas posibles. Hasta entonces os dejo con dos tonterías para que os divirtaís:

  1. ¿Cual es la probabilidad de sacar una cara en 4 lanzamientos de una moneda?
  2. ¿Realmente deberíamos elegir la opción par en la apuesta de la lotería nacional?

Estaría bien oir vuestros comentarios sobre esto, aunque fuese en plan anónimo. No voy a examinar ni calificar ninguno de ellos, simplemente nos servirán para dabatir sobre las soluciones. Un saludo a todos.

Manejo de Datos en Excel

Antes de continuar con nuevas entradas, vamos a hacer un recorrido por el Excel para conocer algunas de sus funciones que nos van a ser muy útiles en el manejo de datos. La mayoría de los ejemplos que colocaremos en el blog se harán con este programa, y solo en caso de extrema necesidad utilizaremos otros paquetes estadísticos. Para seguir estos post será necesario tener un conocimiento mínimo de Excel ya que voy a saltarme los pasos de principiante y me centraré en utilidades un poco más avanzadas y menos conocidas de este programa. Todo lo que comente, vale para las versiones 2003 y 2007 de excel.

  • Introducir datos en varias celdas a la vez:
Esto, como la mayoría de cosas en excel se puede hacer de varias formas. Podríamos hacerlo introduciendo el dato en una celda y posteriormente, copiando y pegando en el resto, pero hay un atajo bastante útil que nos permite hacerlo en una sola operación.
  1. Seleccionamos las casillas donde queremos introducir los datos.
  2. Escribimos en cualquiera de ellas el dato que queremos que aparezca en todas
  3. Si pulsamos [INTRO] (colocaré en este formato las teclas) el dato se coloca en una casilla, pero pulsando [CTRL]+[INTRO] se introducirá en todas las casillas seleccionadas a la vez.

  • Introducir datos en varias celdas, de diferentes hojas a la vez:
También se pueden introducir datos en una o varias celdas de diferentes hojas a la vez. Para ello lo único que deberemos hacer es seleccionar varias hojas, con [CTRL] o [SHIFT] y pulsando sobre la pestaña de las hojas, para seleccionarlas y a partir de aquí todo lo que hagamos en las celdas automáticamente quedará copiado en las hojas seleccionadas.

  • Introducir la Fecha Actual y la Hora Actual:
Las funciones Ahora(), y Hoy(), nos devuelven información sobre el dia y la hora actual, y se actualizan cada vez que recalculamos la hoja (para recalcular la hoja manualmente se puede hacer pulsando [F9]). Si lo que necesitamos es introducir la fecha de hoy, en lugar de hacerlo a mano tecleando el dia mes y año, podemos hacerlo automáticamente con [CTRL] + [SHIFT]+[; ] para la hora utilizaremos [CTRL] + [SHIFT]+[: ]

  • Extender Listas, Fórmulas y Números:
Excel tiene predeterminadas listas de meses del año y dias de la semana, con lo que para escribir los meses de año lo único que debemos hacer es colocarnos en una celda, escribir ENE (o ENERO) y arrastrar para que se vayan rellenando las celdas con los meses consecutivamente.

Las listas de los meses y días de la semana vienen predefinidas en el programa, pero se pueden modificar e incluso añadir más listas personalizadas. Para ello debemos ir a Herramientas -> Opciones -> Listas Personalizadas en Excel 2003, en el 2007 vamos a Opciones de Excel -> Listas Personalizadas.

Para arrastrar más rápidamente, podemos hacer
DOBLE CLICK en el cuadradito de arrastrar. Esto nos rellenará todas las celdas hacia abajo hasta completar una columna igual a la que se encuentra a su lado.

Si arrastramos una fecha o una hora, nos rellenará las casillas incrementando en un dia o en una hora. Esta función es realmente interesante porque podemos variar a nuestro gusto el incremento. Para ello lo que hacemos es rellenar dos casillas adyacentes con los números, las fechas o las horas que queramos y separadas por el incremento que necesitemos. Si seleccionamos las dos casillas y arrastramos conseguiremos una lista con el incremento que había entre las dos primeras celdas.

Por último pulsando en el cuadrado naranja podemos seleccionar el tipo de relleno que queríamos hacer al arrastrar. Si lo que queríamos era copiar solo los datos pulsaremos en copiar en lugar de rellenar la serie.

Con esto acabamos la entrada de hoy, seguiremos con más información sobre funciones de excel en las siguientes entradas, en las que seguiremos también con el curso básico de estadística. Hasta entonces sed felices.