
(AGENPARL) – mar 18 luglio 2023 Analisi spazio-temporale degli incidenti stradali di Roma:
determinazione delle componenti cicliche e dell’effetto di eccitazione
Pierfrancesco Alaimo Di Loro1,?, Marco Mingione2, Antonello Maruotti1
Dipartimento GEPLI, Libera Università Maria Ss. Assunta (LUMSA)
Dipartimento di Scienze Politiche, Università degli Studi Roma Tre
Abstract. In questo lavoro di ricerca analizziamo l’andamento spazio-temporale degli incidenti stradali avvenuti sul territorio di Roma Capitale nell’arco degli anni 2019, 2020 e 2021. Per verificare
l’eventuale effetto di innesco/eccitazione tra incidenti, proponiamo una procedura semi-parametrica
per la stima di un modello Hawkes periodico spazio-temporale. Il modello è caratterizzato da: componenti giornaliere e settimanali che colgono la naturale ciclicità di tali eventi; una funzione di intensità
spaziale che descrive le variazioni nel rischio di collisioni stradali in diverse aree; una componente
di eccitazione spazio-temporale che, a differenza di precedenti tentativi, conserva un comportamento
isotropico nello spazio. La stima viene eseguita utilizzando l’algoritmo di ricostruzione stocastica, in
cui sono state implementate strategie di correzione ad hoc per ridurre i ben noti problemi di distorsione presso i bordi del dominio. I risultati confermano la ciclicità, disomogeneità ed il comportamento
clusterizzato che ci si aspettava nel caso degli incidenti stradali. Il modello prevede che circa l’1%
di tutte le collisioni verificatisi nell’area di studio sono un effetto di eventi precedenti e che, quindi, si
sarebbero potute evitare tramite un’accurata gestione della zona circostante.
Keywords. Semi-parametrico; Processo di Hawkes; Algoritmo EM; Spazio-tempo; Incidenti stradali.
Introduzione
Secondo l’ultimo rapporto dell’Istituto Nazionale di Statistica, nel 2021 si sono verificati sul territorio
italiano oltre 150.000 incidenti stradali, di cui 2.875 con decesso entro 30 giorni. Le stime per il primo semestre del 2022 (gennaio-giugno) evidenziano un numero di incidenti stradali in aumento – anche
se non allarmante – rispetto al periodo pandemico. Le cause principali di tali eventi possono essere ricondotte alla guida distratta e all’eccesso di velocità. Sebbene il trend di lungo periodo degli incidenti
stradali sia in diminuzione negli ultimi due decenni, i costi sociali di questi eventi sono ancora ingenti
(in termini economici e di vite umane). In senso assoluto, il numero di incidenti è ancora molto elevato
ed il loro monitoraggio è essenziale per identificare i punti critici (nello spazio e nel tempo) ed implementare tempestivamente politiche di prevenzione e controllo. I recenti sviluppi tecnologici consentono
di registrare in modo semplice ed economico l’esatta posizione spazio-temporale dei veicoli al momento
dell’incidente. A partire dal 2014 le autorità stradali del Comune di Roma hanno il compito di registrare
l’ora e la posizione di ogni incidente stradale per il quale è richiesto il loro intervento. Queste registrazioni geo-referenziate vengono raccolte mensilmente e pubblicate per uso pubblico sul portale open-data
del Comune di Roma1 [10]. Questa enorme miniera d’oro di dati pubblici ha già attirato una certa atten1 https://dati.comune.roma.it
ANALISI ESPLORATIVA DEI DATI
zione [7, 3], in quanto tale struttura dati permette l’utilizzo di tecniche statistiche avanzate che possano
modellare la dinamica spazio-temporale degli incidenti.
Il modo più naturale per modellare l’occorrere di eventi nello spazio e nel tempo è rappresentato dai processi di punto spazio-temporali [8, 9]. Una sfida molto interessante nella modellazione degli incidenti
stradali è capire se il verificarsi di un evento aumenta il rischio che si verifichino altri eventi nelle sue
immediate vicinanze [1] e, in caso affermativo, quantificare il numero di incidenti innescati dal primo
evento. Questo tipo di effetto a cascata può essere dovuto all’effetto diretto dell’incidente originale o
alle sue conseguenze indirette: aumento della congestione del traffico, riduzione delle corsie, ecc. Questa particolare dinamica è nota nel gergo statistico/probabilistico come autoeccitazione di un processo di
punto, ed è la proprietà che definisce il processo di Hawkes [13]. Esso è stato ampiamente utilizzato in
letteratura per caratterizzare i pattern clusterizzati tipici di terremoti [21, 25] o shock finanziari [4, 14].
La sua applicazione è stata recentemente estesa a molti altri contesti: crimini [20, 23], malattie infettive
[6, 5], e infine incidenti stradali [18, 15].
Ai fini della stima, prendiamo spunto dalla ricostruzione stocastica del processo di Hawkes spaziotemporale di [23] e proponiamo tecniche alternative per la stima della funzione di eccitazione e per la
correzione dello smoothing presso i bordi del dominio. A differenza di quanto già fatto precedentemente
[16] lavoriamo sull’intero spazio euclideo preservando l’isotropia della funzione di eccitazione. Maggiori dettagli sono forniti nella sezione 3. La Sezione 4 introduce l’applicazione originale sugli incidenti
stradali avvenuti a Roma nel 2019-2020-2021. Infine, la Sezione 5 fornisce una discussione finale.
Analisi esplorativa dei dati
Abbiamo elaborato una routine per scaricare automaticamente le tabelle mensili degli incidenti stradali
dalla pagina dedicata del sito web di Roma Capitale2 . Queste tabelle contengono tutti e soli gli incidenti
stradali avvenuti nelle strade di competenza del Comune di Roma in cui è intervenuta una pattuglia della
Polizia Locale.
Nella presente elaborazione consideriamo tutti i record riferiti agli ultimi tre anni completamente disponibili, ovvero tutte le tabelle mensili che vanno dal 2019 al 2021. Questa finestra temporale è interessante
anche perché permette di confrontare i tassi di incidentalità stradale pre- e post-pandemia da Covid-19. Il
tempo necessario per il processo di download è fortemente legato alla velocità della connessione internet.
Secondo gli standard attuali tale operazione richiede un tempo trascurabile.
I dati contengono un record per ogni soggetto coinvolto in ogni incidente stradale, con record riferiti ad
un medesimo incidenti identificabili tramite un numero di protocollo comune. Ogni singola riga contiene
informazioni accessorie sull’incidente stradale, ma la nostra attenzione si limita alle seguenti: ora esatta
dell’evento, posizione geo-referenziata (cioè longitudine e latitudine), numero di feriti, morti e persone
illese coinvolte nell’incidente. In alcuni record alcune di queste informazioni sono registrate in modo errato o sono mancanti. Perciò, i dati sono stati sottoposti a una procedura di pre-elaborazione consistente
di tre fasi principali: (i) correzione e filtraggio dei record alterati, (ii) raggruppamento e combinazione
per protocollo, (iii) eliminazione di tutti gli errori di localizzazione degli incidenti3 .
Alcune statistiche annuali di base sono riportate in Tabella 1. Essa contiene il numero totale di
incidenti (N), il numero totale di incidenti con almeno un morto o un ferito (NDI ), il tasso di incidenti
con almeno un morto o un ferito (NDI rate = NDI /N × 100) il numero totale di morti (D), il numero totale
di feriti (I), il tasso di mortalità calcolato come D/N × 100 o D/NDI × 100, la lesività calcolata come
I/N × 100 o I/NDI × 100 e la gravità calcolata come D/(D + I) × 100.
2 https://dati.comune.roma.it/catalog/dataset?tags=Incidenti&groups=sicurezza-urbana
3 Shape-file
disponibile a http://www.datiopen.it/it/catalogo-opendata/daticomuneromait
Andamento temporale
ANALISI ESPLORATIVA DEI DATI
Tabella 1: Statistiche di sintesi ed indicatori di severità per tutti gli incidenti avvenuti sul territorio di
Roma Capitale dal 2019 al 2021.
Tasso NDI
Mortalità
Mortalità (2)
Lesività
Lesività (2)
Gravità
29696
20409
27378
11066
10125
14057
12517
47.34
44.95
45.72
127.03
125.53
123.62
77483
28499
35748
46.14
125.44
Tra il 2019 e il 2021 la città di Roma ha registrato un totale di 77483 incidenti stradali, di cui 28499
con almeno un ferito o un morto. Questi hanno causato 35748 feriti e 311 morti nei tre anni. Si tratta
di una media di 25828 incidenti stradali (9500 incidenti stradali con almeno un ferito o un morto) ogni
anno, con 11916 feriti e 104 morti all’anno, rispettivamente. Si noti che queste medie sono falsate verso
il basso dall’eccezionalità di 2020, durante il quale erano in vigore le politiche di chiusura e restrizione
legate alla pandemia. In particolare, la lesività è inferiore in 2020 rispetto a 2019 e 2021, mentre il
tasso di mortalità e la gravità sono maggiori (molto maggiori nel caso della gravità) in 2020. Ciò indica
che il tasso complessivo di incidenti stradali è diminuito a causa delle restrizioni dovute alla pandemia,
ma il tasso di incidenti molto gravi (cioè che portano alla morte) non ha subito una riduzione analoga.
La Tabella 2 riporta i tassi orari, giornalieri e settimanali di incidenti stradali e di incidenti stradali con
almeno un ferito o un morto nei tre anni.
Tabella 2: Tassi di incidenza per tutti gli incidenti stradali avvenuti sul territorio di Roma Capitale dal
2019 al 2021.
Tasso orario
Tasso giornaliero
Tasso settimanale
Tasso orario (2)
Tasso giornaliero (2)
Tasso settimanale (2)
81.35
55.76
75.00
571.07
392.48
526.50
30.32
19.97
27.74
212.81
140.54
194.71
70.76
496.69
26.03
182.69
Nella città di Roma ci sono stati circa 3 incidenti ogni ora, circa 70 ogni giorno e circa 500 ogni
settimana nell’arco dei tre anni considerati. Circa il ? 37% (1 all’ora, 26 al giorno, 183 alla settimana)
hanno causato almeno un morto o un ferito. I tassi sono sostanzialmente più bassi durante il 2020, con il
2021 che si avvicina ai livelli pre-covido di 2019.
Andamento temporale
Qui forniamo una descrizione più dettagliata degli andamenti temporali seguiti dagli incidenti stradali
sul territorio di Roma tramite grafici e statistiche di sintesi.
La figura 1a riporta l’andamento a lungo termine degli incidenti stradali nel triennio. Esso mostra una
brusca riduzione all’inizio del secondo trimestre del 2020. Questa tendenza al ribasso scompare lentamente, e il livello generale torna ai livelli pre-Covid solo verso la fine del 2022. Si noti che, fatta
eccezione per il periodo marzo-maggio 2020 (primo lockdown), il modello di stagionalità annuale è
estremamente simile nei tre anni di studio.
Tale pattern è chiaramente visibile in Figura 1b. Le tendenze all’interno dell’anno vengono confrontate
su base mensile, dove la maggiore differenza tra i tre anni si verifica nel periodo marzo-maggio del 2020.
Andamento temporale
ANALISI ESPLORATIVA DEI DATI
In particolare, si può notare chiaramente come la linea del 2020 rimanga tra 2019 (sotto) e 2021 (sopra)
fino a giugno 2021. Ciò implica che gli effetti della pandemia hanno avuto una coda lunga che si è propagata fino a luglio 2021, quando la curva dei tassi di 2021 è tornata ai livelli pre-covid di 2019. Tale mese
non è un mese qualsiasi, in quanto a partire da luglio 2021 ha visto la fine l’obbligo allo smart-working
per molte fasce dei lavoratori settore pubblico (e privato).
Figura 1: Andamento temporale complessivo (a) e mensile (b) degli incidenti fra il 2019 ed il 2021.
Le figure 2a e 2b mostrano l’andamento ciclico settimanale e giornaliero degli incidenti stradali nell’intero territorio di Roma, come rilevato dai tassi di incidentalità giornalieri (per giorno della settimana)
e orari (per ora del giorno).
Figura 2: Stagionalità settimanale (a) e giornaliera (b) degli incidenti tra il 2019 ed il 2021.
Anche se su livelli complessivi diversi, l’andamento ciclico settimanale è sostanzialmente invariato
nei tre anni. Dal lunedì al venerdì si registra il maggior numero di incidenti stradali, che diminuisce
sensibilmente durante il fine settimana. È interessante notare come 2020 e 2021 mostrino una maggiore
variabilità nel numero di incidenti per giorno della settimana rispetto al 2019, probabilmente legato
all’alternarsi di fasi diverse durante la pandemia.
L’andamento ciclico giornaliero è in linea con i comportamenti di pendolarismo quotidiano della città di
Roma. Tutte le ore centrali della giornata, tra le 7:00 e le 19:00, presentano un rischio generalmente alto.
Si registra una prima fase ad alto rischio tra le 8:00 e le 12:00, ore del mattino in cui le persone escono
di casa per recarsi al lavoro, ed una seconda fase dalle 14:00 (pendolarismo del dopo-pranzo) alle 19:00
(quando i cittadini romani tornano di corsa a casa dal posto di lavoro).
Andamento spaziale
Andamento spaziale
PROCESSO SPAZIO-TEMPORALE DI HAWKES
La figura 3 illustra invece i tassi di mortalità (a), lesività (b) e gravità (b) per anno e per ciascuno dei
quindici municipi romani.
Il Municipio IV mostra il tasso di mortalità e gravità più elevato in tutti gli anni. Questo municipio si
estende per 49 km2 ed è situato nella parte nord-orientale del territorio romano. Si trova tra due arterie
principali, ossia la Tiburtina e la Nomentana, che formano due grandi circonvallazioni con la Tangenziale
Est, ossia una delle strade più trafficate della Capitale.
In termini di numero di incidenti stradali, il Municipio I (che è il più antico e si estende per soli 20 km2 ) è
quello che riporta i valori più elevati in tutti gli anni (si veda la figura 3). Si tratta di oltre 10.000 incidenti
(13% del totale), che corrispondono a 9 incidenti stradali al giorno e fino a 490 incidenti stradali per km2
Figura 3: Tasso di mortalità (a), lesività (b) e gravità (c) nei vari municipi e nei vari anni.
Processo spazio-temporale di Hawkes
L’obiettivo è quello di modellare il verificarsi di collisioni di traffico in un dominio spazio-temporale
Q = D × [0, T ], dove D ? R2 indica la dimensione spaziale e [0, T ] l’intervallo temporale di riferimento.
Si assuma che il numero di incidenti stradali N(B × [t1,t2 ]), dove B ? D e [t1,t2 ] ? [0, T ], sia il risultato
di un processo puntuale semplice e (localmente) finito. Esso può essere definito attraverso l’opportuna
specificazione della funzione di intensità condizionata :
E N(ds, dt) Ht
?c (s,t) = lim
ds,dt?0
ds · dt
dove calHt = {(u, ?)}? 0 sono due parametri a valore reale che
hanno il ruolo di coefficienti di rilassamento.
Il background descrive il rischio generale, variabile nello spazio-tempo, di incidenti stradali. Il termine
spaziale è statico nel tempo e tiene conto del diverso rischio di collisione dovuto ad esempio a bassa
visibilità, a maggiore presenza di incroci, a maggior traffico, ecc. Il termine temporale è costante nello
spazio e si ottiene come prodotto di tre ulteriori funzioni mut (·) = µd (t) · µw (t) · µtr (t), dove mud (·) e
µw (·) modellano la periodicità giornaliera e settimanale e mut (·) rappresenta la tendenza a lungo termine. La stagionalità giornaliera e settimanale è una caratteristica tipica dei dati legati ad eventi stradali, in
quanto essa riflette i pattern di pendolarismo giornaliero e settimanale.
La componente di eccitazione descrive l’aumento del rischio di ulteriori incidenti che si verifica in
prossimità di un incidente appena avvenuto. [23] considera un’eccitazione potenzialmente anisotropica nello spazio, il cui valore dipende dall’intero vettore di separazione s? ? s? = (x? ? x, y? ? y) con
s = (x, y). La nostra proposta è di mantenere la separabilità spazio-temporale ma modificare l’espres-
L’algoritmo di Ricostruzione Stocastica
PROCESSO SPAZIO-TEMPORALE DI HAWKES
sione della componente spaziale rendendola dipendente solo dalla distanza euclidea: g(s? ? s,t ? ? t) =
gs (||s? ? s||) · gt (|t ? ? t|).
Poiché la stima completamente non parametrica di un modello così flessibile può soffrire di una serie
di complicazioni numeriche e statistiche, legate all’identificabilità delle varie componenti, le funzioni di
fondo e di eccitazione sono costrette ad avere una media pari a 1 e un integrale pari a 1, rispettivamente.
Pertanto, il ruolo dei due coefficienti di rilassamento mu0 e A è quello di regolare il livello complessivo
delle componenti di background e di eccitazione/innesco normalizzate.
La stima non parametrica di (1) può essere ottenuta mediante l’algoritmo di ricostruzione stocastica
[25, 22].
L’algoritmo di Ricostruzione Stocastica
Sia {(si,ti )}Ni=1 un la realizzazione osservata di un processo di punto sulla regione D × ×[0, T ] ?
R2 × R+ . La ricostruzione stocastica si basa sulla combinazione di kernel smoothing, per stimare separatamente ogni componente, e sull’algoritmo Expectation-Maximization (EM), per aggiornare i pesi a
ogni iterazione fino a convergenza.
Le componenti del background vengono stimate tramite il kernel smoothing di ogni singolo evento (si,ti )
con pesi proporzionali all’importanza relativa dell’intensità del background sull’intensità complessiva in
quella stessa posizione:
?(si,ti ) = µ0
µs (si ) · e
µd (ti )e
µw (ti )e
µt (ti )
?c (si,ti )
where ?(si,ti ) = ?i ? i.
La ricostruzione delle componenti di innesco/eccitazione è ottenuta mediante kernel smoothing di tutti i
lag spaziali e temporali osservati, cioè dati due punti arbitrari p = (s,t) e p? = (s?,t ? ) il vettore dei lag p?
p? = (||s ? s? ||,t ? t ? ). Ciascuna coppia contribuisce con un peso proporzionale all’importanza relativa
della sua specifica eccitazione inter-evento rispetto all’intensità complessiva sulla posizione eccitata:
( A·eg (||s? ?s||)·eg (|t ? ?t|)
t 0 ed estendere linearmente la stima fino a 0 senza grandi
perdite di informazione.
Infine, è ben noto come le stime di tipo kernel smoothing siano affette da distorsione ai bordi di domini
limitati. Questo problema può essere affrontato separatamente, e in modo diverso, per ogni componente. Nel caso del background spaziale e del trend temporale, possiamo risolvere la questione utilizzando
L’algoritmo di Ricostruzione Stocastica
PROCESSO SPAZIO-TEMPORALE DI HAWKES
un’area di buffering calB ? Q . Ciò equivale a considerare anche i dati appena al di fuori del dominio Q
in fase di kernel smoothing, ma ignorarli nella valutazione della verosimiglianza [24]. Consideriamo la
correzione periodica per le restanti componenti del background, come in [15].
La funzione di innesco/eccitazione ha un unico bordo naturale in 0. Abbiamo considerato un approccio
di correzione basato sulle trasformazioni di dominio. In pratica, le coppie di distanze ||bs j ? si | e |t j ? ti |
vengono convertite in scala log log(|||s j ? si ||) e log(|t j ? ti |), in modo da eliminare il bordo, e successivamente viene applicato il kernel smoothing. La densità risultante viene quindi riconvertita nella scala
originale, tenendo in considerazione il Jacobiano [19, 17].
Una volta stimate e normalizzate tutte le funzioni coinvolte nell’espressione della funzione di intensità
condizionale, dobbiamo stimare i due coefficienti di rilassamento mu0 e A. La stima che meglio si adatta
all’andamento dei punti osservati sarebbe la stima della massima verosimiglianza (MLE), condizionata alle componenti dell’intensità stimate in modo non parametrico. La funzione di log-verosimiglianza
di {(si,ti )}ni=1, realizzazione di un processo puntuale spazio-temporale finito e semplice su un dominio
delimitato Q = D × [0, T ], è nota:
log(L?c ) = ? log (?c (si,ti, )) ?
?c (?, ?)d?d?,
per qualsiasi lambdac (·, ·). In particolare, consideriamo la funzione di intensità condizionale definita in
(1) e ci affidiamo a metodi di ottimizzazione numerica per ottenere il MLE di µ0 e A.
È chiaro che i coefficienti di rilassamento sono necessari per ponderare lo smoothing delle varie componenti, mentre le stime non-parametriche di ciascuna componente sono necessarie per ottenere log(Lµ0,A )
e stimare µ0 e A. Questa circolarità può essere risolta alternando la ricerca dei coefficienti di rilassamento ottimali date le componenti stimate e viceversa, nello spirito dell’algoritmo EM. Lo pseudo-codice
è riportato in Algoritmo 1. La convergenza può essere verificata con diversi criteri. Dopo un numero
Input: Initial guesses µs, µd, µw, µt, gt, gs, A(0), µ0
Set k = 1
while Not converged do
Compute ?di, ?wi, ?ti, ?i, ?i, j for all valid (i, j)
(k) (k) (k) (k) (k) (k)
Reconstruct µs, µd, µw, µt, gt, gs
Determine optimal A(k) and µ0
Check convergence
Output: Optimized components µd, µw, µtr, µs, g, h, A, µ0
Algorithm 1: Ricostruzione stocastica semi-parametrica.
ragionevole di iterazioni (che dipende dall’applicazione), gli incrementi di log-verosimiglianza si appiattiscono e viene trovato un massimo (locale). Non c’è garanzia che tale ottimo sia globale, pertanto si
suggerisce di eseguire l’algoritmo più volte partendo da diversi punti iniziali e mantenere solo la soluzione migliore tra i risultati delle varie esecuzioni.
Uno dei principali svantaggi di questo approccio risiede nella sua complessità computazionale, che è
principalmente influenzata dallo smoothing della funzione di eccitazione (che scala quadraticamente
con il numero di punti). Un’idea per ridurre l’onere della prima consiste nell’assumere che l’eccitazione/innesco diventi trascurabile dopo una distanza prestabilita nel tempo e/o nello spazio (tapering).
Questo può ridurre sensibilmente il numero di coppie ammissibili per lo smoothing.
Inoltre, per rendere questa procedura praticabile su un insieme di dati ampio come il nostro, i punti chiave
dell’algoritmo sono stati programati in C++, sfruttando la parallelizzazione quando possibile.
APPLICAZIONI AI DATI DEL TRIENNIO 2019-2021
Applicazioni ai dati del triennio 2019-2021
Figura 5: Punti osservati (top panels) serie giornaliere del numero di incidenti (bottom panels), per i vari
anni.
La stima di un modello complesso e basato sui dati, come quello descritto nella Sezione 3, dipende
fortemente dalla qualità e dalla coerenza dei dati di input. Il territorio della città di Roma è vasto e notevolmente eterogeneo in termini di tessuto urbano, tipologia e condizione delle strade, pattugliamento
della polizia, densità di popolazione, ecc. Tali caratteristiche rappresentano una fonte importante di eterogeneità da gestire nel processo di stima del modello. Pertanto, in fase di stima del modello, limitiamo
la nostra attenzione alla sola area urbana di Roma, cioè agli incidenti stradali registrati nell’area all’interno del Grande Raccordo Anulare (GRA, cioè la strada principale che circonda il centro di Roma). Un
totale di NGRA = 22901, 20409, 21012 si è verificato rispettivamente nel 2019, 2020, 2021. Le Figure
5a, 5b e 5c mostrano l’andamento puntuale puramente spaziale nei tre anni, mentre le Figure 5d, 5e e
5f riportano la corrispondente evoluzione temporale giornaliera. Questa ulteriore esplorazione conferma
quanto già osservato nella sezione 4, ma cattura un quadro più dettagliato della distribuzione spaziale
degli incidenti stradali nell’area urbana di Roma. L’addensamento di punti nelle 5d, 5e e 5f evidenzia
degli hot-spot in due zone di Roma: uno situato nel centro della città e un altro poco più a nord (dietro
la Città del Vaticano). Una visione più chiara sarà possibile dopo l’addestramento del modello già introdotto in 3, il quale fornirà una stima delle componenti di fondo (spaziali e temporali) e di eccitazione
(spaziali e temporali). La prima può confermare, ampliare o smentire i suggerimenti originali sulla distribuzione spaziale e temporale degli incidenti stradali. La seconda verifica se gli incidenti presentano
un raggruppamento che può essere motivato da un effetto di eccitazione/innesco tra gli incidenti stradali.
Risultati
Risultati
APPLICAZIONI AI DATI DEL TRIENNIO 2019-2021
L’ algoritmo E-M è arrivato a convergenza dopo ? 50 iterazioni effettuate in meno di un’ora, separatamente per i dati di ciscun anno. I coefficienti stimati sono riportati in Tabella 3:
Tabella 3: Stime dei coefficienti di background e auto-eccitazione dal 2019 al 2021.
µˆ 0
0.152
0.005
0.093
0.004
0.142
0.006
Le stime del coefficiente di background µˆ 0 costituiscono le intensità medie degli incidenti nello spazio e nel tempo. In altre parole, al netto dell’effetto di auto-eccitazione, avvengono in media µˆ 0 incidenti
“spontanei” per ogni unità di spazio (in questo caso 1km2 ) e per ogni unità di tempo all’interno del
GRA. Si nota chiaramente come il coefficiente di fondo per 2020 sia più basso rispetto a 2021 e 2019,
corroborando ancora una volta l’effetto delle politiche di restrizione del Covid-19 sulla condizione del
traffico stradale della capitale. Le componenti di tendenza a lungo termine di 2019 e 2021 (Figure 6a e
6c) evidenziano variazioni stagionali. Prendendo in riferimento l’anno 2019, il picco maggiore è stimato
a gennaio mentre il periodo a minore incidenza è agosto. Questi due aspetti possono essere spiegati come
segue: peggioramento delle condizioni meteorologiche e l’aumento del traffico successivo alle festività
natalizie nel caso di gennaio; fuga dalla città con conseguente riduzione del traffico e del tasso di incidenti. Il trend a lungo termine di 2020 (Figura 6b) cattura invece chiaramente la brusca riduzione del
periodo di blocco totale di marzo-maggio. Le figure 6d, 6e e 6f mostrano il comportamento settimanale,
che presenta valori bassi durante la domenica, con un aumento graduale nei giorni feriali tra il lunedì ed
il venerdì (non visibile nell’analisi esplorativa preliminare) ed un iniziale riduzione già il sabato. Ciò è
determinato da diverse concause: traffico lavorativo combinato con un maggior numero di persone che
escono per svago; un gran numero di persone che escono tardi durante la notte, che è un noto fattore
di rischio per gli incidenti stradali; ecc. ec. Le figure 6g, 6h e 6i mostrano la componente periodica
giornaliera stimata nei tre anni, che non mostra variazione nel corso di essi se non per un leggero slittamento verso orari leggermente successivi nel corso del 2020 (probabilmente legati al cambio di abitudini
durante la pandemia). Esse evidenziano il già sottolineato rischio più elevato durante le ore centrali della
giornata (7.00-19.00), con picchi stimati dalle 8.00 alle 10.30 (ore di punta del mattino in cui la gente va
al lavoro e iniziano le scuole) e dalle 15.30 alle 18.00 (ritorno a casa). In termini di background, sono
state stimate due superfici alternative: una ad ampio spettro ed una a stretto spettro (la prima evidenza
aree, la seconda punti). Le figure in 6j, 6k e 6l mostrano il trend spaziale stimato ad ampio raggio, che
è quasi identico nei tre anni. Si evidenziano due grandi aree di rischio: una situata proprio dietro la Città
del Vaticano e un’altra al grande incrocio tra Via Statilia, Via San Quintino e Via Carlo Emanuele Primo,
sul lato ovest della Stazione Centrale di Roma. Entrambe queste aree sono solitamente molto trafficate
durante l’intera giornata. Vi sono anche altre zone a grande intensità di incidenti, soprattutto rispetto
al circostante: Piazza dei Quiriti a Prati (in generale il triangolo che formano Ottaviano-Lepanto-Castel
Sant’Angelo), Area antistante Termini tra Piazza dei Cinquecento e Repubblica, Centocelle tra Piazza
dei Gerani e Piazza Teofrasto (Via dei Castani); Zona Don Bosco (tra Lucio Sestio e Giulio Agricola),
ecc.ec. Il background spaziale a stretto spettro (su scala log in figure in 6m, 6n e 6o) invece evidenzia
dei punti circoscritti ad alta intensità, spesso in corrispondenza di incroci con strade ad alto scorrimento
e/o altri incroci a raso. Alcuni di tali incroci a maggior rischio sono riportati qui di seguito: incrocio tra
Lungotevere e Ponte Vittorio Emanuele II; Lungotevere in corrispondenza dell’Isola Tiberina Manzoni;
Via Nomentana 1111; incroci tra Cristoforo Colombo e Via Di Decima; inserimento di Via Nasso su
CONCLUSIONE E DISCUSSIONE DEI RISULTATI
Via del Mare; Via Prenestina in corrispondenza del cavalcavia sul GRA; Via della Magliana nella curva
successiva a Via delle Vigne; ecc.ec.
Le stime del coefficiente di innesco Aˆ sono una stima del numero medio di incidenti stradali innescati/causati da eventi precedenti. Per tutti gli anni è stato stimato un valore di Aˆ fra 0.004 e 0.005 nei tre
anni. Questo implica che (in media) ci sono almeno 4 eventi non spontanei ogni 1000 incidenti stradali
spontanei (ovvero ? 240 incidenti non spontanei nell’arco dei tre anni).
Le figure 7a, 7b e 7c mostrano l’eccitazione spaziale stimata, mentre le figure 7d, 7e e 7f mostrano le
funzioni di eccitazione temporale stimate. Come atteso, l’effetto di eccitazione/innesco diminuisce man
mano che ci si allontana nello spazio o nel tempo dall’evento originale. In particolare, esso è limitato a
un raggio di ? 300m nello spazio e a ? 1h (0.06 di un giorno) nel tempo. Anche se il valore di Aˆ non
è enorme, ciò indica che ? lo 0.5% di tutti gli incidenti stradali potrebbe essere evitato attraverso una
gestione efficace dell’area circostante tutti gli eventi originali.
Conclusione e discussione dei risultati
Questo documento di ricerca introduce l’analisi della distribuzione spazio-temporale degli incidenti stradali nella città di Roma. Si considerano tutti i dati relativi agli anni dal 2019 al 2021, in quanto sono i
più recenti completamente disponibili. L’obiettivo finale dell’analisi è verificare se esiste un effetto di
eccitazione tra gli incidenti stradali che si verificano a Roma e, in caso affermativo, quanto è forte e qual
è il suo range spazio-temporale.
La sezione 4 fornisce un’approfondita analisi esplorativa delle caratteristiche temporali e spaziali degli
incidenti sulla superficie di Roma Capitale. Essa motiva la necessità di includere nel modello un trend
temporale con componenti cicliche (settimanali e giornaliere), oltre a considerare un’intensità spaziale
non omogenea. Pertanto, si è di considerare un modello di Hawkes periodico spazio-temporale, stimato
in maniera non-parametrica, come già proposto in letteratura per altri fenomeni che presentano pattern
simili. Estendiamo le proposte precedenti introducendo una zona di buffering per correggere le distorsioni al contorno e proponendo una procedura di smoothing alternativa per preservare l’isotropia nella
componente di eccitazione spaziale. Altre analisi sulla stessa fonte dati erano state ostacolate dall’eccessivo costo computazionale per valutare tutte le componenti su un insieme così ampio di punti [2]. In
questo tentativo sono state raggiunte prestazioni computazionali migliori implementando il nucleo dell’algoritmo in C++, consentendo di considerare dati su uno o più anni.
Esiste ancora un ampio margine di miglioramento, poiché il metodo proposto modella i gli incidenti stradali come se si verificassero sullo spazio euclideo determinato dai confini di Roma Capitale. Tuttavia,
quando si tratta di incidenti stradali, il modello dovrebbe tenere conto della struttura di rete stradale, che
è dove effettivamente gli incidenti si verificano. [12, 11] considera la rete lineare con una specifica di modello simile e stiamo attualmente lavorando per combinare le loro e le nostre idee utilizzando strumenti
efficienti per rendere i calcoli fattibili. A quel punto, l’applicazione completa potrebbe essere adattata
alla rete stradale lineare di Roma per fornire un’inferenza più affidabile ed un identificazione più precisa
dei veri incroci ad alto rischio. Un altro sviluppo interessante è costituito dalla possibilità di includere
covariate ausiliarie per spiegare l’eterogeneità spaziale o temporale nelle componenti del background e
di eccitazione/innesco. Tutto ciò potrebbe consentire una comprensione più approfondita delle proprietà
statistiche del processo di incidentalità stradale e fornire una indicazioni più accurate per la gestione del
traffico alle autorità locali.
CONCLUSIONE E DISCUSSIONE DEI RISULTATI
Figura 6: Intensità stimate per background spaziale ad ampio spettro (j,k,l) ed a stretto spettro (scala log,
m,n,o); trend spaziale (intra-anno) (a,b,c); stagionalità settimanale(d,e,f); stagionalità giornaliera (g,h,i).
Le colonne si riferiscono al 2019, 2020 e 2021.
RIFERIMENTI BIBLIOGRAFICI
RIFERIMENTI BIBLIOGRAFICI
Figura 7: (a) Stima dell’auto-eccitazione spaziale (riga in alto) e temporale (riga in basso).
Riferimenti bibliografici
[1] Benjamin Acker and May Yuan. Network-based likelihood modeling of event occurrences in space and time:
a case study of traffic accidents in Dallas, Texas, USA. Cartography and Geographic Information Science,
46(1):21–38, 2019.
[2] Pierfrancesco Alaimo Di Loro. Innovative approaches in spatio-temporal model-ing: handling data collected
by new technologies. 2021.
[3] Pierfrancesco Alaimo Di Loro, Enrico Ciminello, and Luca Tardella. Hidden Markov Model estimation via
Particle Gibbs. Book of Short Papers SIS 2019, pages 829–835, 2019.
[4] Emmanuel Bacry, Iacopo Mastromatteo, and Jean-François Muzy. Hawkes processes in finance. Market
[5] Álvaro Briz-Redón, Adina Iftimi, Jorge Mateu, and Carolina Romero-García. A mechanistic spatio-temporal
[6] Wen-Hao Chiang, Xueying Liu, and George Mohler. Hawkes process modeling of covid-19 with mobility
leading indicators and spatial covariates. International journal of forecasting, 38(2):505–520, 2022.
[7] Antonio Comi, Luca Persia, Agostino Nuzzolo, and Antonio Polimeni. Exploring temporal and spatial structure of urban road accidents: Some empirical evidences from rome. In The 4th Conference on Sustainable
Urban Mobility, pages 147–155. Springer, 2018.
[8] Daryl J Daley and David Vere-Jones. An introduction to the theory of point processes. Vol. I. Probability and
its Applications, 2003.
[9] Peter J Diggle. Statistical analysis of spatial and spatio-temporal point patterns. CRC press, 2013.
[10] Gianni Dominici. Per una seconda fase degli open data in italia. PRISMA Economia-Società-Lavoro, 2015.
[11] Nicoletta D’Angelo, Giada Adelfio, Antonino Abbruzzo, and Jorge Mateu. Inhomogeneous spatio-temporal
point processes on linear networks for visitors’ stops data. The Annals of Applied Statistics, 16(2):791–815,
2022.
RIFERIMENTI BIBLIOGRAFICI
RIFERIMENTI BIBLIOGRAFICI
[12] Nicoletta D’Angelo, David Payares, Giada Adelfio, and Jorge Mateu. Self-exciting point process modelling
[13] Alan G Hawkes. Point spectra of some mutually exciting point processes. Journal of the Royal Statistical
Society: Series B (Methodological), 33(3):438–443, 1971.
[14] Alan G Hawkes. Hawkes processes and their applications to finance: a review. Quantitative Finance,
18(2):193–198, 2018.
[15] Kieran Kalair, Colm Connaughton, and Pierfrancesco Alaimo Di Loro. A non-parametric hawkes process
model of primary and secondary accidents on a uk smart motorway. Journal of the Royal Statistical Society:
Series C (Applied Statistics), 2020.
[16] Kieran Kalair, Colm Connaughton, and Pierfrancesco Alaimo Di Loro. A non-parametric hawkes process
model of primary and secondary accidents on a uk smart motorway. Journal of the Royal Statistical Society
Series C: Applied Statistics, 70(1):80–97, 2021.
[17] Gerhard Koekemoer and Jan WH Swanepoel. Transformation kernel density estimation with applications.
Journal of Computational and Graphical Statistics, 17(3):750–769, 2008.
[18] Zhongping Li, Lirong Cui, and Jianhui Chen. Traffic accident modelling via self-exciting point processes.
Reliab. Eng. Syst. Safe., 180:312 – 320, 2018.
[19] James Stephen Marron and David Ruppert. Transformations to reduce boundary bias in kernel density
estimation. Journal of the Royal Statistical Society: Series B (Methodological), 56(4):653–671, 1994.
[20] George O Mohler, Martin B Short, P Jeffrey Brantingham, Frederic Paik Schoenberg, and George E Tita. Selfexciting point process modeling of crime. Journal of the American Statistical Association, 106(493):100–
108, 2011.
[21] Yosihiko Ogata. Statistical models for earthquake occurrences and residual analysis for point processes.
Journal of the American Statistical association, 83(401):9–27, 1988.
[22] Jiancang Zhuang. Second-order residual analysis of spatiotemporal point processes and applications in model
evaluation. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 68(4):635–653, 2006.
[23] Jiancang Zhuang and Jorge Mateu. A semiparametric spatiotemporal hawkes-type point process model with
periodic background for crime data. Journal of the Royal Statistical Society: Series A (Statistics in Society),
182(3):919–942, 2019.
[24] Jiancang Zhuang, Yosihiko Ogata, and David Vere-Jones. Stochastic declustering of space-time earthquake
occurrences. Journal of the American Statistical Association, 97(458):369–380, 2002.
[25] Jiancang Zhuang, Yosihiko Ogata, and David Vere-Jones. Analyzing earthquake clustering features by using
stochastic reconstruction. Journal of Geophysical Research: Solid Earth, 109(B5), 2004.