Uno dei temi più dibattuti, e sui quali si continua a fare ricerca in ambito ingegneristico e finanziario, è quello della persistenza di una certa dinamica individuata sul mercato. In parole più semplici, quando conosciamo un determinato comportamento dei prezzi, qual è la probabilità che si possa sfruttare tale comportamento anche in futuro per generare profitti?
L’utilizzo del “Machine Learning” per l’analisi delle serie finanziarie, è strettamente legato a questo tema. Abbiamo visto varie volte come sia semplice, per una macchina, individuare una inefficienza statistica, difficilmente individuabile ad occhio nudo, ma abbiamo anche affrontato il tema della iper-specializzazione che spesso comporta questo approccio. Eppure proprio il machine learning ci consente di analizzare questo tema come nessuna altra tecnica permetterebbe di fare. Lanciare decine di migliaia di simulazioni sulla serie dei prezzi di un qualsiasi strumento finanziario, ad esempio, da l’occasione di sondare la robustezza di tali tecniche tra un periodo di addestramento noto alla macchina (In Sample) ed uno di verifica, completamente ignorato dalla macchina durante la fase di concepimento delle regole di compravendita (Out of Sample).
Un algoritmo evolutivo, di generazione in generazione, consentirà di migliorare sempre di più le performance, certificate da un indicatore chiamato fitness function che, ad esempio, può essere il profitto netto della strategia. Questo miglioramento avverrà nella porzione nota dei dati, ma nessuna garanzia è data nel periodo successivo.
Facciamo un esempio per semplificare. A tale scopo ci serviremo del Gandalf Pattern Composer, uno dei due codici che consentono di determinare direttamente su Tradestation e Multicharts, sistemi automatici di compravendita. Decidiamo di misurare il profitto generato in In Sample e quello ottenuto nel periodo successivo Out of Sample, ponendoci un quesito, solo apparentemente lapalissiano: al migliorare della risposta operativa in addestramento (net profit) dobbiamo aspettarci necessariamente un miglioramento su aree di prezzo inesplorate?

In Fig.1 abbiamo fermato la macchina nelle primissime epoche dell’ottimizzazione e abbiamo preventivamente ordinato i profitti ottenuti dai nostri migliori investitori in In Sample. Il banco di prova è stato il future TBond trentennale americano su time frame a 60 minuti.
Sulla destra possiamo osservare gli investitori che perdono denaro fino ad un massimo di -200000 $. Spostandoci gradatamente verso sinistra notiamo come le performance negative, evidenziate dalle barre azzurre, migliorino, fino a giungere ad investitori che riescono a fare pari e patta col mercato, non perdendo e non guadagnando denaro. Le performance Out of Sample sugli stessi periodi sono mediamente in linea con la proiezione del periodo In Sample sulle aree successive, ma non è sempre così. Esistono infatti investitori in grado di guadagnare denaro in Out of Sample anche se l’esito dell’addestramento non è andato proprio a buon fine (barra azzurra negativa e barra arancione positiva). E’ raro, ma accade.
Concentrandoci adesso sui “primi della classe”, quegli investitori, cioè, in grado di produrre un guadagno e vediamo come progrediscano verso sinistra in maniera regolare, tirandosi dietro anche i profitti del periodo non noto.
Sembra dunque esserci un legame tra la bontà dei profitti In Sample e la probabilità (perché di probabilità si parla) che tali investitori siano in grado di generare ulteriori profitti in Out of Sample, autonomamente.
Concentrandoci soltanto sull’istogramma arancione invece, si può apprezzare come tale andamento sia ovviamente meno regolare anche se tendenzialmente in linea con l’istogramma azzurro: non sempre ad un profitto migliore in In Sample corrisponde un profitto migliore in Out of Sample.
Ma vediamo se tale tendenza è confermata lasciando lavorare la macchina per maggiore tempo (questa volta verifichiamo le performance sul future TNotes decennale americano, time frame daily).

Aumentando il numero degli investitori e quindi la varietà delle regole di compravendita, si nota una sostanziale equivalenza con i risultati precedenti. Quello che è maggiormente apprezzabile è come esistano investitori in grado di generare profitti in Out of Sample a valle di una pessima risposta in In Sample (lato destro del grafico). A sinistra, invece, notiamo l’opposto e una tendenziale aspettativa di guadagni in Out of Sample. Esistono tuttavia alcuni casi in cui ad un guadagno consistente in In Sample corrisponde una perdita in Out of Sample.
Come mai avviene ciò?
La prima evenienza è quella di aver setacciato rumore e aver quindi prodotto del “fitting”, ossia adattamento alle specifiche condizioni di mercato, la cui probabilità di ripetersi in futuro è quasi nulla. Se siamo riusciti ad evitare questa spiacevole situazione propria del sovra-addestramento sul rumore di una serie, tuttavia ancora possiamo incappare in una evenienza che non ci permetterà di guadagnare denaro. Sappiamo, infatti, che il mercato è mutevole di natura, mentre la nostra strategia, per quanto coniata in condizioni dinamiche, rimane ancorata al periodo In Sample e quindi a criteri statici. Se la nostra strategia diviene “asincrona” rispetto alle condizioni in essere di mercato, questo vanificherà tutto il nostro lavoro di produzione.


La declinazione di quanto detto in termini operativi è che si rivela tendenzialmente conveniente utilizzare sistemi addestrati, purchè abbiano prima superato una prima prova del tempo in un primo periodo Out of Sample, prima di misurare tale sistema su un secondo periodo Out of Sample che chiameremo Real Money.
Have a good trade!
Giovanni Trombetta