Elometer. è uno strumento elaborato nell’ambito di una ricerca universitaria che consente in poche ore (da una a tre, a seconda del tempo che ci dedicate) di avere una valutazione del proprio Elo, risolvendo 76 posizioni. Il risultato è centrato sul valore ritenuto più probabile con uno scarto di circa 120 punti in più o in meno. Interessante soprattutto per chi non frequenta i tornei, la domanda che ci si deve porre è: è affidabile? Sicuramente dà buoni risultati che però probabilmente sono un po’ falsati dalla serie di domande che vengono proposte prima del verdetto finale.
NOTA – Probabilmente, per vari motivi, il software non considera il tempo di soluzione che non dovrebbe superare i 60’. Occorre farlo in una sola sessione (per simulare la “stanchezza” di una partita) e togliere circa 100 punti ogni mezz’ora che ci si impiega sopra la soglia dell’ora. Dati per tempi sopra le 4 ore non sono attendibili.
Cosa dicono gli autori di Elometer
Il programma utilizza la teoria della risposta a eventi (le posizioni delle partite in questo caso; o “teoria dei tratti latenti”; Hambleton, Swaminathan e Rogers, 1991) per ricavare una stima della forza di gioco in base alle risposte a una serie di problemi scacchistici. Per arrivare a questa stima, abbiamo utilizzato il modello Birnbaum a due parametri (Lord, 1980) che consente alle posizioni di differire a) in difficoltà e b) in potere discriminatorio. L’insieme dei problemi di scacchi che abbiamo utilizzato è stato preso dal “Test di scacchi di Amsterdam” sviluppato da van der Maas & Wagenmakers (2005), che hanno presentato i loro problemi di scacchi a un campione di 259 partecipanti a un torneo open olandese. La valutazione Elo nazionale di questi partecipanti variava da 1169 a 2629. Utilizzando un sottoinsieme degli elementi di questo test (il set di elementi Scegli-A-Move A e B), gli autori sono stati in grado di calcolare una stima di massima verosimiglianza della valutazione ELO basata su una formula di previsione che regredisca le stime di capacità latente del modello Birnbaum sui rating ELO del campione di confronto. Utilizzando la funzione di informazione del test, siamo stati anche in grado di calcolare un intervallo di confidenza del 95% per questa stima.