¿Sirven para algo los WAR?

alberto silva

Administrador
Miembro del equipo
Durante un tiempo se pensó que con los WS se había conseguido cuantificar bien el aporte de un pelotero a su equipo, aunque se admitía que el procedimiento de cálculo era bastante engorroso. Pero pronto se sustituyó esa estadística por los WAR, con el problema de que su método de cálculo no sólo era también complicado, sino que existían variantes (B-R y F-G) que conducían a resultados distintos.

En 2011 las listas de los 10 mejores en WAR según B-R y F-G coinciden en 7 nombres en los mejores jugadores de posición y en otros 7 en los mejores pitchers. Y en cuanto a los 5 mejores coinciden en 4 nombres en los jugadores de posición y en los 5 en cuanto a los pitchers. Hasta aquí podría decirse que la coincidencia no es tan mala, sobre todo en la capacidad de identificar a los más destacados. Sin embargo, el orden en que aparecen los peloteros es distinto en las dos fuentes, haciendo casi imposible decidir quien es mejor que quien. Por ejemplo, Ellsbury es mejor que todos los demás peloteros de MLB según F-G, pero es superado por Kemp, Bautista y Braun según B-R. Y Verlander es mejor que todos según B-R, pero es superado por Halladay y Sabathia según F-G.

Y si vamos más abajo en las listas, las diferencias son más grandes. Por ejemplo, Kinsler según F-G es el 6º mejor jugador de posición en todo MLB, pero según B-R apenas alcanza el puesto 17º. Y Adrián Gonzalez es el 6º mejor según B-R, pero es el 12º según F-G. Y el caso de Haren es todavía peor; es el 6º mejor pitcher en MLB según F-G y no entra entre los 20 primeros según B-R.

Pareciera que hay que darle un compás de espera a este asunto de los WAR mientras se convierte en algo más útil o es reemplazada por una estadística mejor.
 
Este es un tema que se ha discutido una y otra vez en el foro y yo todavía no entiendo la complicación. Cada quién tiene que saber tomar su postura y tener bien claro las razones de la diferencia entre un método y el otro y decidir con cual se queda si es que las diferencias incomodan. Yo desde hace rato no uso el método de Sean Smith porque me parece atroz para los pitchers y aunque es más confiable para bateadores, también pierde con la menos confiable metrica defensiva TZ. Las diferencias entre el rWAR y fWAR van a estar dictadas en casi la totalidad por la defensa para bateadores y para pitchers si son cosas totalmente diferentes.

A mí el WAR jamás me ha parecido tan complicado. Complicados son los win shares, que no tengo idea como se calculan, los WAR son extremadamente sencillos de entender (la partición de las diferentes contribuciones lo hace así) y es posible determinarlos con matematica básica. Posiblemente el WAR no sea la mejor estadistica, pero si es lo mejor que tenemos que se encuentre disponible de forma gratuita. Obviamente es posible mejorarla y esto probablemente se logrará con el Field f/x para bateadores porque para pitchers jamás habrá correlación.

PD: Otra cosa que he escuchado/leido ultimamente como punto en contra al fWAR es que se basa en el FIP y esta no es una estadistica descriptiva del rendimiento pasado sino predictiva y eso es algo completamente falso. Claro que es predictiva de rendimientos futuros (aunque no más que xFIP o SIERA), pero el FIP es el aislamiento de determinadas variables del pitcheo así como el OBP, Ave o Slugging solo aislan ciertas partes del bateo (En el OBP un boleto es igual a un HR y nadie es tan loco para decir que esas dos cosas valen lo mismo). Sin embargo, considero que aisla de una mejor forma lo que en verdad hizo el pitcher sin tomar en cuenta todo el ruido con el que contribuye la defensa y otros factores como los dragones de la suerte...
 

alberto silva

Administrador
Miembro del equipo
GONZ dijo:
Este es un tema que se ha discutido una y otra vez en el foro y yo todavía no entiendo la complicación. Cada quién tiene que saber tomar su postura y tener bien claro las razones de la diferencia entre un método y el otro y decidir con cual se queda si es que las diferencias incomodan. Yo desde hace rato no uso el método de Sean Smith
Gonz:

En efecto, éste es un tema en el que no hay consenso y por eso cada quien puede tomar su postura, adoptando uno de los métodos propuestos o no adoptando ninguno. Pero creo que esto no impide que sigamos discutiendo.

Supongamos que descartamos el método de Sean Smith, utilizado por B-R, y utilizamos el de F-G. Apliquemoslo a los mejores bateadores de 2011. Si aceptamos que el OPS puede ser una referencia adecuada para la capacidad ofensiva de un bateador y su contribución a la producción de carreras de su equipo, Bautista, Cabrera, Fielder y Berkman, entre otros, son muy afectados en los WAR de F-G, debido a su baja capacidad defensiva. En cambio, Ellsbury, Granderson y Gordon se ven muy favorecidos por su mejor capacidad defensiva. Parece lógico que la capacidad defensiva deba ser tomada en cuenta, pero por su OPS Ellsbury debería tener alrededor de 6 WAR y tiene más de 9; entonces uno se pregunta, será cierto que la contribución de Ellsbury a su equipo se incrementa en más de un 50 % por su buena capacidad defensiva? Por lo que conocemos del aporte de la defensa, parece que los WAR de F-G sobrevaloran demasiado este aspecto.

En el caso de los pitchers, también hay problemas. Kershaw y Halladay tienen ERA y FIP similares, pero Halladay tiene 20 % más WAR según F-G. En este caso, la razón de la diferencia parece ser que Halladay juega para un equipo mucho más ganador que el de Kershaw (aunque tuvo peor récord W-L que Kershaw). Pero esto hace que Halladay sea 20 % mejor o más valioso que Kershaw? No parece que eso sea cierto (por lo menos no lo vieron así los electores de la BBWAA cuando le dieron el Cy Young a Kershaw, premio considerado justo por la mayoría de los analistas). Cain es otro caso que parece no bien tratado por los WAR de F-G. Por su ERA y FIP debería tener por lo menos unos 6.5 WAR, pero tiene sólo 5.2 . Porqué sus WAR son 20 % menos de los que parecen justos? Será porque lanza para los Gigantes y no para los Phillies?

Estas inconsistencias hacen que tampoco los WAR de F-G puedan ser utilizados con confianza. Para tomarlos en cuenta, deberíamos hacer ajustes entonces con respecto a factores como el valor defensivo de los jugadores de posición o el equipo para el que lanzan los pitchers, lo que nos obliga a un ejercicio innecesario. Parece más fácil modificar el método de cálculo para hacerlo más justo
 
No entiendo lo que dices, alberto. Sabes cómo se calcula el WAR, ¿no?

El equipo donde juegan no tiene ningún tipo de peso en el WAR de un jugador más allá del estadio. En el caso puntual de Kershaw y Halladay es claro que aunque tienen prácticamente la misma ERA, la diferencia en el FIP es considerable (casi 0.3) y más importante aún es el factor que Kershaw lanza en el Dodger Stadium y Halladay en el Citizens. La carreras producidas por cada uno son ajustadas al estadio donde juegan y es fácil ver que Kershaw debe ser penalizado cuando sus splits casa/visitantes son tan notables, caso contrario a Halladay. Precisamente por estas diferencias, no tengo dudas que Halladay fue un pitcher muy superior a Kershaw, sin importar los resultados de una votación donde pareciera que los votantes no revisaron los números y apenas pensaron Triple Corona = Cy Young (que a pesar que es un pensamiento tan básico, normalmente es lo cierto, con excepción del caso Jake Peavy-Brandon Webb en 2007, algo bastante parecido a lo que pasó este año).

En cuanto a los bateadores que nombras, las diferencias van más allá de la defensa. Si suponemos que Ellsbury, Cabrera, Bautista y Granderson son jugadores con defensiva promedio en sus respectivas posiciones (y también en el corrido de bases), cada uno tendría aproximadamente el siguiente WAR (entre paréntesis el WAR verdadero): 7.8 (9.4), 8.0 (7.3), 8.4 (8.3), 6.9 (7.0), respectivamente; esto sería algo así como WAR ofensivo+Posición, porque reemplazo es igual para todos. Los más afectados son Ellsbury y Cabrera porque una métrica piensa que uno es un gran defensor y otro es uno pobre. Sin embargo, las diferencias entre los considerados mejores jugadores de la Americana, Ellsbury, Cabrera y Bautista, son mínimas ahora (apenas 0.6 WAR). A pesar que evidentemente Ellsbury fue un peor bateador que los otros dos, sigue teniendo un boost por jugar CF. A pesar de restarle todo el valor defensivo que el UZR le pone, sigue estando a la par de los otros dos. ¿Entonces el fWAR sobrevalora su defensa? Puede ser, el UZR no es completamente confiable en 162 juegos, pero mi punto es que si tú entiendes cómo funciona la métrica puedes fácilmente dividir las contribuciones y tratar de entender lo que está pasando.

Ellsbury no fue un jugador muy diferente a Bautista o Cabrera aún con la ofensiva+posición solamente, pero si uno quiere creer que fue un jugador defensivo espectacular si se despega del resto (Y todo esto es considerando a Miguel como un 1B promedio… y todos sabemos que no lo es). Allí está el valor de las opiniones e impresiones de cada quién, por eso para mí no tiene sentido andarse quejando de una métrica si no sabes completamente como funciona. Sabermetría no es escupir números y confiar ciegamente en las métricas que calculan desconocidos, sino saber que significa cada número, desglosarlo e incluso criticarlo.
 

alberto silva

Administrador
Miembro del equipo
Los comentarios de Gonz me motivaron a revisar mis conocimientos sobre los métodos de cálculo de los WAR. Comparto aquí los resultados de esa revisión, basándome primero en el método empleado por Fan Graphs y discutiendo luego sus diferencias con el método empleado por Baseball Reference. Disculpen los que ya están muy familiarizados con todo esto.

:arrow: Jugadores de posición. Los WAR se calculan sumando el wRAA con el UZR y efectuando un ajuste por la posición del jugador. El wRAA se relaciona con el wOBA y éste se relaciona bastante bien con el OPS, como hemos demostrado en otra parte de este foro. Creo que la principal debilidad de este procedimiento está en darle al UZR, una estadística de dudosa precisión, el mismo valor que el wOBA o el OPS. A mi juicio, esto hace que se sobrevaloren jugadores con UZR muy altos y se subvaloren jugadores con UZR muy bajos. Para los catchers el método no se basa en el UZR, que no está disponible para ellos, sino en el rSB (bases robadas evitadas), que a mi juicio es una buena medida de la habilidad defensiva de un catcher
:arrow: Pitchers. Los WAR se calculan tomando en cuenta el FIP y los IP. Creo que ésta es una buena forma de hacerlo

Con respecto al método empleado por Baseball Reference, que llamaremos rWAR para diferenciarlo de los fWAR calculados por Fan Graphs, las principales diferencias son las siguientes:

:arrow: Jugadores de posición. La defensa se basa en los TZ y no en el UZR. Con toda su imprecisión cuantitativa, el UZR es una mejor medida que los TZ
:arrow: Pitchers. Los fwar se basan sólo en el FIP, lo que los hace independientes de la defensa, mientras que los rWAR incluyen las carreras evitadas. Parece más lógico valorar a los pitchers con independencia de la defensa, como lo hacen los fWAR

En resumen, creo que los fWAR están calculados sobre mejores bases que los rWAR, pero tengo mis reservas sobre el uso que se les da a los UZR en los fWAR de los jugadores de posición. Por ejemplo, en esta temporada los valores extremos de UZR correspondieron a dos LF: Brett Gardner con 25.2 y Raul Ibanez con -18.9. Esto hace que Gardner e Ibanez, con casi el mismo OPS, termine uno con 5.1 WAR y otro con -1.3 WAR. Sinceramente, no creo que los valores de UZR reflejen la diferencia real entre las habilidades defensivas de cada uno ni que los valores de fWAR reflejen la diferencia real entre sus valores como peloteros; si eso fuese cierto, Ibanez no estaria jugando ni en los Phillies ni en ningún otro equipo de MLB (tomando otra estadística defensiva, los RF, que a mi juicio no son una medida tan mala como se cree, Gardner tiene 2.02 e Ibanez 1.59; es decir, según esa medida Gardner es 27 % mejor que Ibanez defensivamente y no casi infinitamente mejor como sugieren los UZR, lo que parece más lógico)
 

alberto silva

Administrador
Miembro del equipo
Con base en esta discusión, me atrevo a sugerir el siguiente procedimiento para calcular los WAR, tomando como base un óptimo de 10 para los WAR en una temporada.

Para los jugadores de posición, supondría que el bateo representa el doble de la defensa, es decir 66 % y 33 % respectivamente. Es decir, un óptimo de 6.6 WAR por el bateo y 3.3 WAR por la defensa. Un OPS de 1000 equivaldría a 6.6 WAR. Para la defensa, 3.3 WAR equivaldrían a un RF de 10 para un 1B, de 5 para un 2B y un SS, de 3 para un 3B y un CF y de 2.5 para un LF y un RF. Para los catchers, un SB/9 de 0.3 equivaldría a 3.3 WAR.

Para los pitchers, supondría que una relación IP/ FIP de 120 equivaldría a 10 WAR.

Veamos que resulta para los principales peloteros de esta temporada:

Bautista/ Cabrera 9.8
Fielder 9.4
Braun/ Kemp 9.0
Ellsbury 8.9


Halladay 8.9
Lee 7.5
Verlander 7.0
Sabathia 6.9
Kershaw 6.5

Si aceptamos esos resultados, Verlander merecía el CY, con poca ventaja sobre Sabathia, pero Halladay debería haberlo ganado en lugar de Kershaw y Fielder y Cabrera deberían ser los MVP (en el caso de Cabrera considerando que los Tigres clasificaron y los Azulejos no)
 

alberto silva

Administrador
Miembro del equipo
Esta es una versión revisada de mi propuesta para un nuevo método de cálculo de los WAR.

Para los pitchers: WAR = 0.085 x (IP/ FIP)
Para los jugadores de posición: WAR= (PA/700) x ((a x OPS) + (b x UZR*))

a y b son parámetros para ajustar por posición el peso relativo de la ofensiva y la defensa de cada jugador.

a/b
1B 0.009/0.001
LF 0.0085/0.0015
RF 0.008/0.002
CF 0.0075/0.0025
3B 0.007/0.003
2B 0.0065/0.0035
SS 0.006/ 0.004

UZR* es una versión ajustada de UZR, para expresarlo en una escala similar a la de OPS:

UZR* = 10 x (UZR) + 750

Para los catchers: WAR = (PA/550) x ((0.0055 x OPS) + (1.4/ (SB/9))

Veamos algunos ejemplos para la temporada 2011:

Roy Halladay (P) WAR = 0.085 x (233.2/ 2.2) = 9.0

Miguel Cabrera (1B) WAR= (688/700) x ((0.009 x 1033) + (.001 x 712) = 9.8

Yadier Molina (C) WAR= (518/550) x ((.0055 x 814) + (1.4/ 0.36) = 7.9
 
J

joecali

Invitado
Y los robos de base no son tomados en los WAR creo que si????....y eso puede hacer que Ellsbury suba sobre Cabrera o Bautista definitivamente....
 

alberto silva

Administrador
Miembro del equipo
joecali dijo:
Y los robos de base no son tomados en los WAR creo que si????....y eso puede hacer que Ellsbury suba sobre Cabrera o Bautista definitivamente....
Joecali:

Sí. Fangraphs toma en cuenta el "speed score" y éste incluye las bases robadas. Pero eso no es lo que hace que Ellsbury sobrepase a Bautista y Cabrera (de hecho tiene un "speed score" más bajo que Bautista) sino su capacidad defensiva (tiene un UZR de 15.6 contra -3.8 de Cabrera y -4.8 de Bautista).

Creo que incluir todos esos elementos del juego (bateo, velocidad corriendo las bases, defensa, etc.) es muy necesario a la hora de valorar a un jugador; el problema está en la justa proporción que deben tener todos esos elementos en el análisis, tomando en cuenta la posición que juega, el tipo de jugador que es (rápido, de poder, de contacto, etc.). No es nada fácil lograr el balance adecuado en el análisis
 
J

joecali

Invitado
Exactamente tu no puedes pedir lo mismo a un primer bate que a un cuarto/tercero o a un noveno....

Y para mi con todo lo hecho por ellsbury (robos,rbi fueron monstruosas para un primer bat, hr,r) en fin era campaña de MVP y no me gusto la eleccion de Verlander.
 

alberto silva

Administrador
Miembro del equipo
De esta discusión sobre los WAR yo saco las siguientes conclusiones preliminares:

(1) Los WAR sí sirven y son la mejor herramienta propuesta hasta ahora para definir de manera más o menos integral el valor de un pelotero
(2) Aunque los métodos de cálculo de los WAR deben perfeccionarse en todos los casos, creo que Fangraphs propone hasta ahora los mejores métodos de cálculo
(3) Pienso que Fangraphs tiene mejores resultados calculando los WAR de los pitchers que los de los jugadores de posición, aunque para los pitchers luce demasiado dependiente de una sola variable (xFIP)
(4) Creo que Fangraphs debe revisar la importancia que le da al corrido de bases, la defensa y la posición en el cálculo de los WAR de los jugadores de posición (además de revisar la escala en la que se expresa la medida de la defensa, que en su caso es el UZR)
 

FrankPereiro

Administrador
Miembro del equipo
Y yo le agregaría un quinto punto: Así como Fangraphs le da un peso según la posición defensiva, dar también un peso según el orden al bate...

Creo que esto también es importante porque como recalcó el amigo [perfil]joecali[/perfil], según en qué orden se batea se le pide al bateador cosas un poco más concretas.
 

alberto silva

Administrador
Miembro del equipo
Analizando una vez mas las diferencias entre los WAR de B-R y los de F-G, vemos que en lo que va de temporada las principales diferencias se observan en los pitchers. En los WAR de B-R parece pesar mucho el ERA+ y es asi que pitchers como Villanueva, Buchholz, Chacin y Harvey parecen sobreestimados en WAR con respecto a F-G. Sus FIP y xFIP no son nada extraordinarios, por lo que su valoracion en F-G es relativamente menor.

En los jugadores de posicion las diferencias son menores, quizas con excepcion de Kinsler, al que B-R parece valorar mas su bateo, en relacion con la posicion que juega, y su defensa (basada en Rtot en lugar de UZR).

Por supuesto, las diferencias son mas complejas de explicar pero este es un intento sencillo por tratar de entenderlas.

En lo que si hay coincidencia entre B-R y F-G es en dar una alta valoracion tanto a Justin Upton como a Wainwright.
 

Nelson

Grande Liga
Aqui hay algo que se puede prestar a la confusion y a lo no creer tanto en esta estadistica y es que no es posible que BR tenga una formula y FG tenga otra por lo cual los resultados nunca van hacer parecidos, unos tendran mas puntos que otros... Entonces crea o crearia una duda en esta estadistica... Todos los que hemos leido acerca de WAR sabemos que toma BR y que toma FG.... pero para hacer esta herramienta super legitima o super valedera, estos dos señores deberian ponerse de acuerdo, porque siempre van a llegar los llamados "SiberHaters" a decir que esa herramienta es Basura, como lo dijo una vez Tony LaRussa y nadie me lo dijo, yo lo vi... Mientras tengamos dos compañias sacando resultados distintos asi sea por un punto pero usando la misma herramienta WAR vamos a seguir teniendo esos problemas de darle rango legal a ella y de que algunos o muchos la vean como un chiste...

Yo aun no doy mi cambio al 100% a la sabermetria, sin embargo me gustan mucho las estadisticas como el OBP, OPS y el OPS+ .... Leo mucho el WAR e intento comprender las estadisticas defensiva y de hecho me gusta el UZR, el detalle es como lei por alli "en la estadistica UZR hay vacios y se puede refutar como no precisa" es logico son estadisticas nuevas, pero se tambien que hay estadisticas viejas con vacios que no te dan una informacion completa!

Pero quizas sea por no ser muy apasionado a las matematicas y por algo algunas estadisticas me parecen un poco confusas y no entiendo, por eso no estudie nada que tuviera que ver con numeros hahahaha!
 

FrankPereiro

Administrador
Miembro del equipo
Pienso que el punto que ha tocado Nelson es muy importante. Debe haber una sola fórmula para el WAR.

No se puede defender algo en lo que nosotros mismos no estamos ni claros ni de acuerdo.

A mi sí me gusta el WAR porque es una herramienta de lectura rápida y fácil.

Espero que ambos sitios se aclaren pronto...
 

sergioesp

Grande Liga
Aqui caemos en el tema de criticar la idea por problemas en la implementación de la misma.

El concepto de WAR es bueno porque con una sola medida se pretende dar suficiente información para calificar el valor de un pelotero. Que aún esté en proceso dar con la fórmula correcta es otro tema.

Igual con el UZR, para mí como concepto es más completo que simplemente contar errores, lances y calcular % de fildeo; que el método para calcularlo muestre deficiencias también es otro tema, es de esperarse que mejore
 

Hilos similares

Béisbol por Alberto Silva

Donar a Planeta Béisbol

Por favor, dona el equivalente a una taza de café a través de PayPal

Ayuda a Daniel a caminar de nuevo

Arriba