A marzo 2026 siamo stati a Embedded World a Norimberga — la fiera di riferimento mondiale per i sistemi embedded, con oltre 36.000 visitatori da quasi 90 paesi. Quest'anno il tema dominante era uno solo: l'intelligenza artificiale embedded. Non come concetto teorico, ma come tecnologia pronta per la produzione, integrata direttamente nei microcontrollori che usiamo ogni giorno nei nostri progetti di progettazione elettronica.

Quello che abbiamo visto conferma una direzione che in Nexilica seguiamo da tempo: l'inferenza locale sta sostituendo il cloud in un numero crescente di applicazioni di IoT industriale. In questo articolo condividiamo cosa abbiamo osservato in fiera e come queste tecnologie si traducono in opportunità concrete per PMI, produttori e system integrator.

L'Edge AI porta l'inferenza dei modelli direttamente sul dispositivo: latenza in millisecondi, funzionamento offline, dati che non lasciano mai il device. Con i nuovi microcontrollori dotati di NPU, il machine learning embedded non è più un compromesso — è una scelta progettuale superiore.

Cos'è l'Edge AI e perché cambia le regole

Fino a pochi anni fa, integrare l'intelligenza artificiale in un prodotto significava dipendere dal cloud: il dispositivo raccoglieva i dati, li inviava a un server remoto, e attendeva la risposta. Questo approccio funziona per alcune applicazioni, ma in molti contesti industriali si scontra con quattro limiti strutturali che ne rendono il modello insostenibile.

Il primo è la latenza: il round-trip verso il cloud introduce ritardi incompatibili con il controllo real-time di motori, linee di produzione e robotica, dove ogni millisecondo conta. Il secondo è la connettività — molti ambienti industriali non garantiscono una connessione stabile o a bassa latenza, e i sistemi cloud-dipendenti diventano fragili o inutilizzabili proprio nelle condizioni in cui dovrebbero funzionare meglio. C'è poi il tema della privacy e sicurezza: dati sensibili di produzione o dati personali non dovrebbero mai uscire dal perimetro aziendale, e ogni inferenza in cloud apre una superficie d'attacco aggiuntiva. Infine i costi operativi si accumulano nel tempo — ogni chiamata al cloud ha un costo ricorrente che scala con il numero di dispositivi, trasformando in OpEx perenne quello che potrebbe essere un investimento una tantum.

L'Edge AI risolve questi problemi spostando l'inferenza — cioè l'esecuzione del modello già addestrato — direttamente sull'hardware embedded. Il dispositivo analizza i dati localmente, prende decisioni in autonomia e comunica al cloud solo i risultati rilevanti, quando serve. È il paradigma alla base del deep learning on device.

TinyML: reti neurali su microcontrollore

TinyML è il sottoinsieme dell'AI che si occupa di eseguire modelli di machine learning su microcontrollori con risorse estremamente limitate: pochi KB di RAM, alimentati a batteria, dal costo di pochi euro. Il principio è semplice: non serve un server per capire se una vibrazione è anomala o se un gesto è stato compiuto. In pratica si tratta di far girare una rete neurale su microcontrollore, ottimizzata per occupare pochi kilobyte.

Il workflow tipico per un progetto TinyML prevede:

  1. Raccolta dati: acquisizione di dataset rappresentativi dall'ambiente operativo reale
  2. Addestramento: training del modello su workstation o cloud con framework come TensorFlow o PyTorch
  3. Ottimizzazione: quantizzazione (da float32 a int8), pruning e compressione per ridurre dimensione e complessità computazionale
  4. Deploy on-device: conversione del modello in codice C ottimizzato per il target MCU, integrazione nel firmware embedded
  5. Validazione: test di accuratezza, latenza e consumo energetico sul dispositivo reale tramite banchi di collaudo dedicati

STM32N6: il game-changer visto a Embedded World 2026

Tra le dimostrazioni più impressionanti che abbiamo visto a Norimberga, quelle di STMicroelectronics con l'STM32N6 meritano un capitolo a parte. Si tratta del primo microcontrollore STM32 con NPU integrata: il Neural-ART Accelerator.

I numeri parlano da soli:

  • 600 GOPS (Giga Operations Per Second) di throughput per l'inferenza — 600 volte più di un STM32H7
  • Core Cortex-M55 a 800 MHz, il più veloce della famiglia STM32
  • Fino a 4.2 MB di SRAM on-chip — sufficiente per modelli di visione, audio e serie temporali
  • Supporto nativo per camera interface fino a 16 Mpixel, pensato per applicazioni di computer vision embedded
Il team Nexilica a Embedded World 2026 a Norimberga

A Embedded World 2026, ST ha mostrato oltre 50 demo live con l'STM32N6: rilevamento anomalie su segnali vibrazionali, riconoscimento oggetti con telecamera, classificazione audio ambientale — tutto in esecuzione locale sul microcontrollore, senza alcuna connessione cloud. Dalle demo di STMicroelectronics alle soluzioni di Texas Instruments con il nuovo TinyEngine NPU, il messaggio della fiera era chiaro: l'inferenza locale non è più un esperimento — è lo standard di progettazione per la prossima generazione di dispositivi industriali, IoT e automotive.

Per Nexilica, essere presenti a Norimberga significa restare al centro dell'ecosistema embedded europeo e portare queste tecnologie direttamente nei progetti dei nostri clienti.

Casi d'uso concreti per l'industria

L'intelligenza artificiale embedded non è una tecnologia in cerca di applicazione — le applicazioni esistono già e stanno entrando in produzione:

Manutenzione predittiva IoT

Sensori di vibrazione, temperatura e corrente alimentano un modello locale che rileva anomalie nel comportamento di motori, pompe e compressori prima che si verifichi un guasto. Il vantaggio della manutenzione predittiva IoT rispetto al monitoraggio tradizionale: il modello impara il pattern “sano” specifico di quella macchina e segnala deviazioni sottili che le soglie fisse non catturano.

Controllo qualità automatico

Telecamere integrate nella linea di produzione, collegate a un MCU con NPU, eseguono il controllo qualità automatico in tempo reale — graffi, componenti mancanti, saldature fredde — senza inviare immagini a server esterni. Latenza sotto i 50 ms, privacy dei dati di produzione garantita.

Interfacce uomo-macchina

Riconoscimento gesture e comandi vocali eseguiti localmente su dispositivi wearable o pannelli di controllo industriali. Funzionamento offline completo, risposta istantanea, nessuna infrastruttura cloud necessaria.

Sensori ambientali intelligenti

Nodi IoT industriale che classificano suoni, vibrazioni o pattern ambientali direttamente sul campo, trasmettendo solo eventi significativi. Riduzione del traffico dati fino al 99%, durata della batteria moltiplicata.

Cyber Resilience Act: l'AI embedded nel contesto normativo 2026

Un tema trasversale a Embedded World 2026 è stato il Cyber Resilience Act (CRA) europeo, la cui prima scadenza operativa — l'obbligo di segnalazione vulnerabilità entro 24 ore — scatta a settembre 2026. Per chi progetta dispositivi con intelligenza artificiale embedded il CRA cambia le regole del gioco fin dalle prime fasi del progetto.

Il primo punto fermo è che secure boot e firmware update firmati non sono più una opzione di gamma alta ma un requisito di base: ogni dispositivo immesso sul mercato europeo deve garantire l'integrità del codice eseguito e la verifica crittografica degli aggiornamenti. A questo si aggiunge una considerazione specifica per l'AI on-edge: il modello stesso — non solo il firmware che lo esegue — deve essere aggiornabile in modo sicuro via OTA, con validazione crittografica della pipeline che lo distribuisce. Un modello obsoleto o compromesso è un vettore di attacco, esattamente come una vulnerabilità nel firmware. Infine, il regolamento richiede di mantenere un Software Bill of Materials (SBOM) aggiornato, che per i prodotti con AI deve includere anche le dipendenze del framework di machine learning, le librerie di runtime e le versioni dei modelli stessi: ogni componente del sistema deve essere tracciabile e patchable in caso di vulnerabilità segnalata.

L'STM32N6 integra nativamente meccanismi di secure boot, aggiornamento firmware sicuro e generazione SBOM — un vantaggio concreto per chi deve progettare prodotti CRA-compliant. Il nostro servizio di consulenza tecnologica include il supporto alla conformità normativa fin dalle prime fasi del progetto.

L'approccio Nexilica al machine learning embedded

In Nexilica, l'integrazione dell'AI nei sistemi embedded non è un servizio a sé stante — è parte del nostro approccio progettuale end-to-end. Quando un progetto richiede intelligenza locale, lavoriamo su tre livelli simultaneamente.

Sul piano hardware selezioniamo il microcontrollore — con o senza NPU — sulla base dei requisiti di performance, consumo e costo, e curiamo una progettazione PCB ottimizzata per il sensing: posizionamento dei sensori, schermatura, alimentazione pulita. Sul piano firmware integriamo il runtime di inferenza nel firmware embedded, gestiamo il ciclo di vita del modello e l'aggiornamento OTA sicuro. Sul piano del modello collaboriamo con il cliente nella raccolta dati, ottimizziamo la rete neurale per il target hardware (quantizzazione, pruning) e validiamo le performance sul dispositivo reale, non solo in laboratorio.

Il vantaggio di avere un unico partner che gestisce hardware, firmware e modello è che le decisioni progettuali sono coerenti fin dall'inizio. Non si progetta un PCB per poi scoprire che il microcontrollore non ha abbastanza SRAM per il modello, o che il layout introduce rumore sul segnale del sensore.

L'AI on-edge non è più una promessa — è una tecnologia matura, pronta per la produzione industriale. Con microcontrollori come l'STM32N6, il rapporto costo/prestazioni è finalmente accessibile anche per volumi medio-bassi. Se stai valutando di integrare intelligenza artificiale nel tuo prossimo prodotto embedded, contattaci: possiamo aiutarti dalla selezione della piattaforma fino alla produzione in serie.