Nell’era dell’Intelligenza Artificiale, che sta trasformando in modo sostanziale i modelli di business, l’adozione di infrastrutture locali e distribuite è fondamentale per gestire workload specifici e mission-critical. In questo contesto, Azure Local si presenta come una soluzione innovativa in grado di colmare il divario tra il cloud e l’edge computing, portando applicazioni, dati e servizi di AI esattamente dove servono. In questo articolo analizzeremo gli scenari reali in cui Azure Local, abbinato ad Azure Arc, consente l’elaborazione dei dati in tempo reale “alla fonte” e l’implementazione di soluzioni avanzate di intelligenza artificiale. Approfondiremo anche i nuovi servizi Azure AI progettati per Azure Local, focalizzati sulla possibilità di sfruttare al meglio i dati on-premises.
Nei paragrafi successivi, esploriamo alcuni esempi concreti che mostrano come Azure Local, in sinergia con Azure Arc, risponda in modo efficace alle esigenze di infrastruttura distribuita, garantendo bassa latenza, sicurezza e continuità operativa in diversi contesti aziendali e industriali.
In molte situazioni, analizzare i dati in tempo reale direttamente all’ edge (ad esempio, all’interno di un punto vendita o di un impianto industriale) offre vantaggi notevoli in termini di latenza e di riduzione dell’uso di banda. Azure Local consente di processare i dati in loco, evitando di doverli trasferire tutti nel cloud prima di effettuare analisi critiche. Ecco alcuni esempi:
Continuità operativa in ambienti mission-critical
La capacità di garantire la continuità del business in caso di interruzioni di rete o di alimentazione è un elemento cruciale. Con Azure Local è possibile implementare sistemi robusti per preservare l’operatività anche quando la connettività al cloud è limitata o assente. Alcuni esempi:
Sistemi di controllo e Near Real-Time Processing
Alcuni ambienti industriali, finanziari e sanitari richiedono tempi di risposta estremamente bassi per evitare errori, garantire la sicurezza o massimizzare le prestazioni. Azure Local, in abbinamento ad Azure Arc, può gestire queste esigenze di latenza:
Conformità normativa e connettività DDIL (Disconnected, Degraded, Intermittent, Limited)
Per molte realtà (governative, militari, o per chi lavora con infrastrutture critiche), la protezione dei dati e la gestione sicura anche in assenza di una connessione affidabile rappresentano un’esigenza prioritaria. Azure Local supporta la necessità di mantenere i dati e il controllo in sede:
L’adaptive cloud approach di Microsoft, abilitato da Azure Arc, aiuta le organizzazioni a unificare infrastrutture ibride, multicloud ed edge all’interno di Azure. Grazie ad Azure Arc, le stesse esperienze e funzionalità tipiche del cloud (come sicurezza, aggiornamenti, gestione, scalabilità) possono essere estese a qualsiasi luogo: dai data center locali fino alle sedi distribuite.
Un punto chiave è la presenza di Azure Kubernetes Service (AKS), la soluzione Kubernetes gestita da Microsoft. Su Azure Local, AKS può essere configurato e aggiornato automaticamente, fornendo tutto il necessario (driver storage, immagini container per Linux e Windows, ecc.) per supportare applicazioni containerizzate. Inoltre, ogni cluster è automaticamente abilitato con Azure Arc, consentendo l’integrazione con servizi come Microsoft Defender for Containers, Azure Monitor e GitOps per la continuous delivery.
Ricerca sui dati on-premises con AI generativa
Negli ultimi anni, l’AI generativa ha compiuto enormi passi avanti, grazie all’introduzione di modelli linguistici (come GPT) in grado di interpretare e generare testo in linguaggio naturale. Gli strumenti pubblici come ChatGPT funzionano molto bene per interrogazioni di conoscenza generale, ma non possono rispondere a quesiti relativi ai dati aziendali privati su cui non sono stati addestrati. Per colmare questa lacuna, è stato introdotto il concetto di Retrieval Augmented Generation (RAG), una tecnica che “arricchisce” i modelli linguistici con dati proprietari, aprendo così la strada a casi d’uso più avanzati e personalizzati.
Nell’ambito di Azure Local, Microsoft ha annunciato un nuovo servizio che porta l’AI generativa e RAG direttamente dove risiedono i dati, ovvero all’edge. In pochi minuti, è possibile distribuire (tramite un’estensione di Azure Arc) tutto il necessario per porre domande sui propri dati on-premises, tra cui:
Questa funzionalità è già disponibile in anteprima privata per i clienti che utilizzano Azure Local e, nel prossimo futuro, Microsoft prevede di renderla fruibile anche su altre piattaforme Arc-enabled.
“Edge RAG”: l’ecosistema di Retrieval-Augmented Generation in locale
Questo nuovo servizio, definito “Edge RAG”, si inserisce nell’ecosistema di Azure come un blocco centrale che può contemplare diversi componenti in ingresso, quali:
Grazie a questi elementi, “Edge RAG” offre un flusso integrato: dall’ingestione dei dati fino all’inferenza e alla presentazione dei risultati via chat o altre modalità di sviluppo. Ciò abilita la creazione di chatbot, strumenti di knowledge discovery e altre soluzioni di AI che sfruttano il patrimonio informativo interno dell’azienda, in un ambiente sicuro, personalizzabile e conforme.
Distribuzione di modelli AI open source tramite Azure Arc
Un altro aspetto fondamentale dell’offerta Azure AI è la disponibilità di un catalogo di modelli AI testati, validati e garantiti da Microsoft pronti per il deployment e con endpoint di inferenza consistenti. Questa esigenza si rispecchia anche all’edge, dove Microsoft rende ora disponibili una selezione di modelli direttamente dal portale Azure:
Tutti questi modelli possono essere distribuiti in pochi passaggi su un cluster Arc AKS che gira on-premises. In particolare, la maggior parte richiedono esclusivamente una CPU, ma per Phi-3.5 e Mistral 7B è disponibile anche il supporto alle GPU, offrendo performance superiori per scenari di inferenza più intensivi.
L’approccio di Microsoft copre l’intero spettro di funzionalità di AI, offrendo servizi e strumenti che possono essere erogati nel cloud Azure oppure “estesi” in ambienti on-premises o edge tramite Azure Arc. Questa offerta si compone di quattro pilastri principali:
La strategia di Microsoft si fonda sulla volontà di portare il meglio del cloud “ovunque”. Azure Local è l’emblema di questa visione: una soluzione che offre tutti i vantaggi del cloud – agilità, scalabilità, sicurezza – direttamente in ambiente locale, soddisfacendo esigenze di bassa latenza, continuità operativa e conformità normativa.
Grazie ad Azure Arc, le organizzazioni possono sfruttare servizi Azure AI come modelli di linguaggio avanzati, pipeline di Retrieval-Augmented Generation (RAG), e strumenti di ML Ops in modalità ibrida. Le applicazioni sono innumerevoli: dal controllo di qualità in fabbrica alla prevenzione di furti in negozio, dai sistemi critici nei data center governativi al monitoraggio di infrastrutture energetiche.
In un mondo in cui i dati continuano a crescere esponenzialmente e la necessità di analizzarli “sul posto” si fa sempre più pressante, soluzioni come Azure Local rappresentano il passo successivo verso una nuova generazione di infrastrutture distribuite. È così che Microsoft risponde alla sfida di unire il potenziale del cloud con la realtà on-premises, creando opportunità di innovazione e di crescita per ogni settore.