Al CloudConf 2026 con gli occhi di chi costruisce

15 maggio 2026

L'evento si è aperto con un pianista che suonava sul palco. In sala giravano un migliaio di persone, sessioni fitte, il ronzio dell'entusiasmo attorno a container, Kubernetes e intelligenza artificiale - eppure qualcuno ha deciso che la prima cosa che valesse la pena ascoltare fosse un concerto. Un gesto che pare fuori contesto, ma che forse non lo è: forse l’idea era proprio quella di chiedere attenzione rallentando, in un momento storico per la tecnologia così pieno di hype. Ci piacerebbe sapere chi fosse il musicista.

I nostri Massimiliano e Federico hanno portato DonQ al CloudConf, come interlocutori più che come spettatori, con le proprie domande, i propri cantieri aperti, le proprie posizioni già formate su certi temi. Il tipo di ascolto che rende un evento effettivamente utile - riportando poi l’esperienza a noi colleghi durante l’usuale appuntamento del Caffè del Venerdì.

Il pianoforte

L'apertura con il concerto Massimiliano l'ha interpretata come un invito implicito a ridimensionare l'hype corrente. Siamo in un periodo in cui sembra che tutto ciò che facciamo sia la versione migliore del genere umano, AI compresa. Un pianoforte, strumento che esiste da centinaia di anni, messo lì all'inizio era, nella sua lettura, anche un modo di ricordare che cose interessanti sono state fatte anche prima. Chissà se fosse l’intento degli organizzatori, chiederemo.

I talk

Il primo appunto - derivato dal talk di Natale Vinto e Kevin Dubois “Self-Healing Rollouts: Automating Production Fixes with Agentic AI” - riguarda Argo CD, un operator di Kubernetes per automatizzare la gestione dei deploy. Il funzionamento: verifica in autonomia se un deploy è andato a buon fine; in caso contrario, esegue il rollback alla versione precedente e - ed è questo il punto interessante - cerca di capire qual è il problema che ha generato l'errore. Se è risolvibile in automatico, apre una pull request con la fix già pronta; altrimenti apre una issue dettagliata per l'intervento manuale. Non è uno strumento nuovo in senso assoluto, ma si inserisce in un processo sempre più guidato dall'automazione, e l'AI inizia a giocare un ruolo anche dove prima le automazioni deterministiche facevano fatica.

Un altro elemento che ha colpito è stato il riconoscersi nei temi trattati: la gestione della conoscenza interna tramite AI, la strutturazione dei requisiti, erano presenti al CloudConf non come argomenti consolidati, ma come pratiche ancora di frontiera. La percezione è stata quella di stare lavorando nella direzione giusta, anche se il passo successivo - implementare davvero queste best practice - resta quello più difficile.

Il talk che ha generato più ragionamento tecnico è stato quello di Lara Rachidi di OpenAI, “Designing Realtime Voice Applications for Production” sul voice real time, particolarmente rilevante per un progetto di cui parleremo presto, appena rilasciato in produzione. Lei stessa ha messo in chiaro un limite del modello real time di OpenAI: non è particolarmente smart dal punto di vista del reasoning. La proposta era di affiancarlo a un modello più complesso, lasciando al real time la gestione delle parti tecnicamente più delicate - STT, TTS, VAD, quindi tutto ciò che riguarda la rilevazione della voce, i silenzi, il segnale - e delegando il reasoning a un modello separato. Un'architettura ibrida che, tra l'altro, è coerente con alcune scelte già fatte internamente sul progetto appena menzionato. Il fatto di sentirla presentata come direzione credibile da qualcuno che lavora direttamente su quei modelli è stato utile, non tanto come validazione, ma perché aiuta a capire dove si stanno spostando i vincoli reali di quelle tecnologie.

Diversa la ricezione del talk di Stripe, che ha presentato un nuovo protocollo per l'integrazione di sistemi di pagamento e agenti in contesti e-commerce. L’abbiamo trovata un filo fuori contesto rispetto al momento: un approccio tutto centrato sull'automazione del consumo - un agente che prenota il ristorante, calcola la quota, manda un SMS agli amici a 5 cent a messaggio - portato su un palco in cui ci si aspetterebbe più spazio per temi di sostenibilità o di etica applicata. Forse più una nota del percepito dei nostri, ma che riteniamo rilevante condividere. Una nota interna, a commento, è arrivata secca: pur con tutta l'AI disponibile, spesso è ancora difficile farsi fare una fattura dal bar in cui si passa al volo! Contrasto non voluto, ma perfetto.

Inferenza locale

Un tema su cui DonQ ci stiamo muovendo è quello di motori di inferenza locale, portato sullo stage da Francesco Corti con il talk “The Future of AI Is Hybrid: Cloud, Local, and Everything In Between”. Oggi l'AI, per noi come per la maggior parte delle realtà, è essenzialmente un'API da chiamare. I contratti sono a consumo, il che significa costi variabili difficili da prevedere - e i limiti di spesa, una volta raggiunti, non sono una vera soluzione, perché l'alternativa a spostarli in su è smettere di lavorare. Con un modello locale, il ragionamento cambia: il costo è fisso, che sia in noleggio o in ammortamento, e questo sposta la domanda da "quanto spendiamo?" a "come sfruttiamo al meglio quello che abbiamo?". È stato portato l'esempio del macchinario industriale: perché dovrebbe stare fermo di notte? Farlo girare sui repository per analisi di sicurezza o refactoring notturno diventa un'opzione concreta. E ci sono anche scenari ibridi - modelli cloud per l'orchestrazione complessa, modelli locali per task più specifici e ripetitivi - che però vanno testati con attenzione prima di essere adottati.

Abbiamo aggiunto una riflessione più strutturale derivata dalle tante considerazioni raccolte dai talk: l'AI non semplifica i processi, aggiunge un livello di complessità. Quando è entrato il cloud, ha portato vantaggi ma anche complessità tecnica nuova. L'AI sta facendo qualcosa di simile, ma più pervasivo: richiede processi ben strutturati per produrre valore reale, altrimenti rischia di diventare solo un’ennesima spesa. E l'ecosistema che ne risulta - orchestrazione di modelli dentro architetture che includono già tutto quello che c'era prima - richiede competenze specifiche che non si improvvisano.

Su questo si è innestato il riferimento al talk di Enrico Zimuel, “Context Engineering and Agentic AI development”: ha sollevato il fatto che i sistemi LLM attualmente in produzione sono stati testati, nella migliore delle ipotesi, per una frazione minuscola dei casi d'uso reali. È una tecnologia che per sua natura produce output non deterministici, e questo richiede un cambio di paradigma su cosa significa testare e garantire affidabilità. Che non vuole essere una critica, bensì un'osservazione di chi guarda la cosa da fuori con occhi metodici.

Non potendo proporre un report sull’intera giornata, menzioniamo rapidamente anche l’intervento di Serena Sensini “Sei davvero così senior come pensi?” e di Alexio Cassani “Harness Engineering: portare Claude Code in produzione su codebase reali”.

Serena ha portato sul tavolo una delle tematiche che stiamo affrontando tutti nel settore, più o meno consapevolmente: quali le competenze che nel futuro prossimo saranno richieste al dev senior e quali ai junior? Quali saranno i rapporti tra le due figure? Probabilmente nel momento in cui il codice diventerà commodity perché prodotto dall’AI, tutti gli altri attori dovranno scalare verso l’alto (il senior dovrà avere più soft skill legate ad un livello di governance dei processi e probabilmente più conoscenze generali in ambito architetturale, i junior dovranno abbracciare competenze di containerizzazione e struttura dei dati, per fare degli esempi). Argomento interessante, che seguiremo nel tempo anche noi perché ci riguarda da vicino.

Alexio nei suoi interventi ha spostato il focus della discussione dalla domanda “usiamo gli AI agent?” alla questione successiva del come renderli affidabili in produzione. In generale il suo approccio è molto simile al nostro: in questo momento storico non serve avere una strategia AI perfetta dall’inizio, ma il più sostenibile e ragionata possibile perché si possa iniziare e non rimandare - dato che stare immobili comporta rischi molto più alti nella perdita di vantaggi competitivi.

Insomma, una giornata piena e interessante e per chiudere, vale la pena notare, a margine, che la presenza femminile al CloudConf quest'anno era visibilmente più alta rispetto ad altri eventi simili: non ancora un 50 e 50, ma un passo avanti che si nota. Avanti così.

scopri altri post