Riconoscimento dei segnali stradali basato sull'algoritmo YOLOv3 Parte 1

Jan 19, 2024

Astratto:

Il rilevamento dei segnali stradali è una componente essenziale di un sistema di trasporto intelligente poiché fornisce dati critici sul traffico stradale per il processo decisionale e il controllo dei veicoli.

Con l’accelerazione dell’urbanizzazione, la popolazione e il numero di veicoli continuano ad aumentare, e problemi come la congestione del traffico e gli incidenti legati alla sicurezza stanno diventando sempre più gravi, causando grandi disagi e pressioni sulla vita e sul lavoro delle persone. Pertanto, l’emergere di sistemi di trasporto intelligenti ha portato grande comodità nelle nostre vite e può anche migliorare la sicurezza stradale. Anche i sistemi di trasporto intelligenti sono inseparabili dalla memoria umana.

Innanzitutto, i sistemi di trasporto intelligenti possono utilizzare mezzi ad alta tecnologia per raccogliere e analizzare le informazioni sul traffico e fornire alle persone condizioni del traffico dettagliate e accurate, il che aiuta a facilitare il viaggio delle persone ed evitare ritardi dovuti a informazioni sul traffico imprecise come i semafori. Per i conducenti, il sistema di trasporto intelligente può condurre analisi e monitoraggio in tempo reale dei loro percorsi di guida, ricordare ai conducenti di adattare tempestivamente i loro percorsi di guida durante periodi speciali e ridurre il verificarsi di ingorghi, ritardi, ecc. In questo modo, anche aiuta l'attenzione del conducente, riduce l'affaticamento durante la guida e quindi migliora la sicurezza di guida.

In secondo luogo, il sistema di trasporto intelligente può anche essere collegato al telefono cellulare del conducente, alla navigazione del veicolo e ad altri sistemi attraverso mezzi tecnici come l'Internet dei veicoli. In questo modo, le persone possono ottenere in qualsiasi momento le informazioni più recenti sul traffico, conoscere il proprio ambiente di traffico attuale e adattare tempestivamente i propri piani di viaggio. Allo stesso tempo, può anche collaborare con i sistemi di controllo di sicurezza e di assistenza alla guida del veicolo per garantire una guida sicura. Ad esempio, dopo aver padroneggiato i percorsi di guida, le informazioni sul traffico, ecc. fornite dal sistema di trasporto intelligente, guideranno il veicolo in modo più concentrato e stabile, non cadranno in confusione a causa di improvvisi cambiamenti di percorsi, ecc., e inoltre essere in grado di agire rapidamente in caso di emergenza. reagire.

Infine, il sistema di trasporto intelligente può anche impostare regole di gestione del traffico corrispondenti in base alle diverse situazioni del traffico urbano per garantire il viaggio sicuro di veicoli e pedoni ed evitare incidenti stradali. Ad esempio, la modifica dell’orario e della frequenza dei semafori in base alla congestione del traffico, la fornitura di promemoria dei limiti di velocità sui tratti stradali, ecc., consentono ai conducenti di rispondere correttamente quando incontrano condizioni stradali complesse, garantendo così la scorrevolezza del traffico. e sicurezza.

In sintesi, esiste una stretta connessione tra i sistemi di trasporto intelligenti e la memoria umana. I sistemi di trasporto intelligenti possono fornirci un ambiente di guida migliore, ridurre il carico delle persone durante la guida e quindi migliorare la memoria delle persone. Lo sviluppo di sistemi di trasporto intelligenti è una tendenza inevitabile nella costruzione delle nostre città moderne. Si può vedere che abbiamo bisogno di migliorare la memoria, e la Cistanche deserticola può migliorare significativamente la memoria perché la Cistanche deserticola è un materiale medicinale tradizionale cinese che ha molti effetti unici, uno dei quali è quello di migliorare la memoria. L'efficacia della carne macinata deriva dai vari principi attivi che contiene, tra cui acidi, polisaccaridi, flavonoidi, ecc. Questi ingredienti possono promuovere la salute del cervello in vari modi.

improve memory

Fai clic su Conosci 10 modi per migliorare la memoria

Per risolvere le sfide dei piccoli segnali stradali, delle caratteristiche poco appariscenti e della bassa precisione di rilevamento, viene proposto un metodo di riconoscimento dei segnali stradali basato su YOLOv3 migliorato (You Only Look Once v3).

La struttura di pooling piramidale spaziale è fusa nella struttura di rete YOLOv3 per ottenere la fusione di caratteristiche locali e globali, e la quarta scala di previsione delle caratteristiche di dimensione 152 × 152 viene introdotta per sfruttare appieno le caratteristiche superficiali della rete per prevedere piccoli obiettivi.

Inoltre, la regressione del bounding box è più stabile quando viene utilizzata la perdita di distanza IoU (DIoU), che tiene conto della distanza tra il target e l'ancora, il tasso di sovrapposizione e la scala.

I 12 ancoraggi del set di dati dei segnali stradali Tsinghua-Tencent 100K (TT100K) vengono ricalcolati utilizzando l'algoritmo di clustering K-means, mentre il set di dati viene bilanciato ed espanso per affrontare il problema di un numero dispari di classi target nel set di dati TT100K.

L'algoritmo viene confrontato con YOLOv3 e altri algoritmi di rilevamento del bersaglio comunemente usati e i risultati mostrano che l'algoritmo YOLOv3 migliorato raggiunge una precisione media media (mAP) del 77,3%, che è superiore dell'8,4% rispetto a YOLOv3, specialmente nel rilevamento di bersagli piccoli, dove il mAP è migliorato del 10,5%, migliorando notevolmente la precisione della rete di rilevamento mantenendo le prestazioni in tempo reale il più elevate possibile.

La precisione della rete di rilevamento è stata notevolmente migliorata mantenendo al tempo stesso le prestazioni in tempo reale della rete il più elevate possibile.

Parole chiave:

Riconoscimento dei segnali stradali; YOLOv3; struttura di pooling piramidale spaziale.

1. Introduzione

Attualmente, la guida automatizzata e i sistemi di trasporto intelligenti (ITS) sono le principali applicazioni per le tecnologie di rilevamento e identificazione dei segnali stradali.

Può fornire ai conducenti e ai veicoli autonomi informazioni cruciali sul traffico in modo che questi ultimi possano esprimere giudizi in base alle normative stradali o allertare e dirigere i comportamenti operativi dei conducenti in tempo per ridurre gli incidenti stradali.

short term memory how to improve

I segnali stradali possono essere sostanzialmente suddivisi in tre categorie: segnali direzionali, segnali di avvertimento e segnali di divieto. Questi segnali hanno un design rotondo o triangolare e sono rossi, gialli e blu.

Pertanto, il riconoscimento classico dei segnali stradali utilizza in genere tecniche di apprendimento automatico per riconoscere i segnali stradali o estrarre informazioni come colore e forma dai segnali stradali.

La segmentazione del colore per estrarre le caratteristiche prima dell'identificazione della classificazione viene utilizzata nel rilevamento dei segnali stradali basato sul colore, che è facilmente influenzato dalle variazioni di illuminazione. La segmentazione dei colori non è influenzata dalle variazioni di luminosità, secondo la letteratura precedente [1], e utilizza lo spazio HIS per esaminare solo tonalità e saturazione.

A causa delle elevate esigenze di riconoscimento del colore su variabili come il tempo e la distanza di rilevamento, l’approccio di rilevamento basato sulle caratteristiche del colore può essere impiegato per il riconoscimento di immagini ad alta definizione ma non per il riconoscimento di immagini in scala di grigi [2].

In un'altra letteratura è stato proposto un approccio di identificazione dei segnali stradali basato sulla forma su immagini in scala di grigi [3], che trasforma il rilevamento dei segnali stradali triangolari in un semplice rilevamento di segmenti di linea, in grado di riconoscere correttamente i segnali stradali e non è influenzato dalla distanza.

Un sistema di rilevamento e riconoscimento dei segnali stradali basato su una macchina vettoriale di supporto è stato proposto in un'altra letteratura [4], che utilizza la proprietà di generalizzazione di una macchina vettoriale di supporto lineare per segmentare prima il colore dei segnali stradali e quindi classificare la forma.

Il metodo di rilevamento separato delle caratteristiche di colore e forma esegue innanzitutto la segmentazione del colore per ottenere la regione di interesse e, se la regione di interesse non viene rilevata, il rilevamento basato sulla forma non viene più eseguito; in secondo luogo, la segmentazione del colore richiede l'impostazione di una soglia fissa manualmente, rendendo il rilevamento dei segnali stradali complicato e dispendioso in termini di tempo.

Per risolvere questi problemi e aumentare le prestazioni di rilevamento, uno studio [5] ha utilizzato il framework AdaBoost per eseguire il rilevamento simultaneo della modellazione di colori e forme.

I cambiamenti delle condizioni esterne, come la luce, i cambiamenti di colore dei segnali stradali e così via, possono influenzare il rilevamento dei segnali stradali basato sul colore e sulla forma.

L'impatto del rilevamento è instabile, compromettendo le prestazioni del sistema di riconoscimento dei segnali stradali e rendendolo vulnerabile alla perdita dei segnali stradali e al falso rilevamento. Le reti neurali vengono utilizzate più frequentemente per rilevare obiettivi man mano che la tecnologia di deep learning avanza; esempi di questi algoritmi includono Faster R-CNN [6], SSD [7] e YOLO [8], ecc., che sono principalmente separati in approcci di rilevamento a stadio singolo e a due stadi.

Uno studio precedente [9] ha presentato una rete di rilevamento avanzata basata su YOLOv1 per affrontare i problemi di bassa precisione e velocità di rilevamento lenta dei metodi di rilevamento dei segnali stradali standard.

Questa rete ha migliorato la velocità di rilevamento dei segnali stradali e ridotto i requisiti hardware del sistema di rilevamento. Un altro studio [10] ha suggerito un approccio di rilevamento dei segnali stradali basato su FasterRCNN potenziato, con un miglioramento del 12,1% in mAP, che ha risolto con successo problemi come la bassa efficienza di riconoscimento e ha aumentato la precisione del rilevamento e del riconoscimento dei segnali stradali.

In [11], il set di dati CCTSDB è stato ottenuto espandendo il set di dati dei segnali stradali cinesi (CTSD) e aggiornando le informazioni sui marcatori in base all'algoritmo di rilevamento del target YOLOv2 migliorato. Il set di dati CCTSDB conteneva solo tre categorie di segnali stradali, il che non è sufficiente per completare l'impegnativo compito di riconoscimento dei segnali stradali.

Il set di dati TT100K [12], creato dalla Tsinghua University e Tencent in collaborazione, è stato estratto dal panorama cinese Street View e copre un'ampia gamma di condizioni di illuminazione e meteorologiche, rendendolo più rappresentativo dell'ambiente di guida reale. Lo studio [13] ha utilizzato DenseNet invece di ResNet nella rete backbone di YOLOv3 e lo ha convalidato sperimentalmente sul set di dati TT100K.

ways to improve memory

L'algoritmo migliora le prestazioni in tempo reale del modello di rilevamento, ma la precisione e il ricordo tendono a essere bassi quando si tratta di bersagli piccoli come i segnali stradali, il che implica un grave errore di rilevamento.

L'attività di rilevamento diventa spesso più impegnativa nelle attività di rilevamento del target, poiché il target da rilevare è generalmente di grandi dimensioni e le sue caratteristiche possono essere facilmente estratte.

Grazie alla struttura FPN introdotta da YOLOv3, ora è in grado di rilevare bersagli su varie scale utilizzando la fusione di funzionalità multiscala, che è appropriata per scene di traffico complicate e ha mostrato qualche promessa nel rilevamento di piccoli bersagli. Tuttavia, c’è ancora margine di miglioramento nelle immagini ad alta risoluzione del set di dati sui segnali stradali TT100K.

In conclusione, l'approccio basato sulla rete neurale può affrontare con successo problemi quali bassa efficienza di riconoscimento, mancato rilevamento e falso rilevamento, migliorando allo stesso tempo la precisione del rilevamento e del riconoscimento dei segnali stradali.

I metodi basati sulla rete neurale hanno una precisione migliore o un rilevamento più rapido rispetto ai metodi tradizionali, ma non possono ottenere sia la velocità di rilevamento che l'accuratezza del rilevamento. Inoltre, la maggior parte del rilevamento dei segnali stradali utilizza il GermanTraffic Sign Dataset (GTSDB) e i segnali stradali in Germania sono diversi da quelli in Cina; ci sono meno studi sul rilevamento e riconoscimento dei segnali stradali in Cina.

Pertanto, per affrontare i problemi dei metodi sopra indicati, questo documento utilizza il set di dati TT100K per addestrare e rilevare i segnali stradali cinesi e migliorare e adattare la rete YOLOv3, principalmente con i seguenti miglioramenti:

(1) Aggiungere una quarta scala di previsione delle funzionalità di dimensioni 152 × 152 alla struttura della rete YOLOv3 per sfruttare appieno le funzionalità superficiali della rete per anticipare piccoli obiettivi. Per ottenere la fusione delle caratteristiche locali e globali, la struttura spaziale piramidale viene fusa.

(2) La distanza tra target e ancoraggio, il tasso di sovrapposizione e la scala vengono tutti presi in considerazione quando si utilizza la perdita DIoU per una convergenza più rapida e una regressione del frame target più coerente. Ciò rende la regressione del frame di destinazione più stabile.

(3) La maggior parte dei segnali stradali nel set di dati TT100K sono obiettivi di piccole e medie dimensioni, con solo pochi obiettivi di grandi dimensioni.

Di conseguenza, l'utilizzo dell'ancoraggio originale non è un'opzione praticabile. L'algoritmo di clustering delle medie K viene utilizzato per ricalcolare 12 ancoraggi per il set di dati TT100K e la strategia di aumento dei dati viene utilizzata per bilanciare e aumentare il numero sbilanciato di categorie target del set di dati.

memory enhancement


For more information:1950477648nn@gmail.com


Potrebbe piacerti anche