Nel 2026 l'AI non rende la modernizzazione legacy facile. La rende finalmente industrializzabile, ma solo se governata con metodo. Su sistemi mission-critical, un agente lasciato in autonomia produce risultati che superano i test sintattici e divergono silenziosamente dal comportamento di produzione. CATALYST è la modernization factory che chiude questo gap — orchestrando i frontier model, non sostituendoli.
DORA, AI Act, NIS2, BCBS 239, FRIA, Banca d'Italia Circ. 285, AGID e Legge 132/2025 trattati come input di disegno. Evidenze pronte all'audit per ciascun dominio.
Replay del traffico di produzione, side-by-side execution, diff con threshold dichiarati ex ante e sign-off del business owner. Niente cutover senza proof formale.
Lavoro probabilistico → agente LLM. Lavoro deterministico (schema, build, grep, AST) → script no-LLM. I gate tra le fasi sono machine-checkable, non checklist soggettive.
Programma reale su ~80 applicazioni desktop di un'assicurazione di un primario gruppo bancario italiano. Target .NET 9, C# 13. Non è un PowerPoint.
Velocità di change in calo. Concentrazione del rischio in pochi SME prossimi al pensionamento. Pressione regolatoria crescente. Sistemi che nel 2020 erano “vecchi ma funzionanti” oggi sono passività regolamentari documentate.
Programmi di modernizzazione strutturati che falliscono o sforano significativamente (McKinsey 2025; Standish CHAOS Beyond Infinity).
Banche e assicurazioni IT su mainframe COBOL/PL-I + desktop VB6/.NET Framework + front-end moderni con business logic embedded nel core.
DORA, EU AI Act, NIS2, Banca d'Italia Circ. 285, AGID Linee Guida — tutte in enforcement tra 2025-2027. Sanzioni fino al 7% del turnover globale.
Penetrazione AI: 70% assicurazioni, 59% banche italiane. Solo il 16% ha framework di governance strutturato (Banca d'Italia + OCSE, apr. 2026).
Derivati dall'esecuzione su programmi reali, dalla letteratura indipendente e dall'esegesi delle norme europee e italiane. Insieme costituiscono il contratto del framework con il cliente.
Trasformazioni reversibili. Pattern strangler fig. Il legacy resta in piedi come fallback fino al sign-off di equivalenza.
Review singola / dual control / four-eyes — spettro graduato per livello di rischio AI Act. Codificato in hook bloccanti.
Senza copertura del comportamento legacy in produzione, la migrazione è un atto di fede. Niente migrazione senza Test Foundation.
Niente cutover senza proof formale: replay del traffico di produzione, side-by-side execution, diff con threshold dichiarati ex ante.
Lavoro probabilistico → agente LLM. Lavoro deterministico (schema, build, grep, AST) → script no-LLM. I gate sono machine-checkable.
Ogni artefatto tracciato a prompt, modello, agente, revisore, hash del contesto. Requisito DORA Art. 9 e AI Act Art. 12.
Naming, pattern, checklist e workflow del cliente sono input di configurazione, non vincoli a posteriori. Project context come contratto epistemico.
Knowledge curator agent come watchdog continuo: ogni applicazione migliora le successive. Asset di metodo trasferibile al cliente.
DORA, AI Act, NIS2, GDPR sono input di disegno. Ogni dominio produce evidenze pronte all'audit nei formati richiesti.
Ogni dominio ha un obiettivo, input richiesti, capability, output strutturato e un gate di uscita verso il successivo. Convergono operativamente nelle tre fasi di pipeline.
Mappatura completa del sistema legacy, dipendenze, business logic embedded e rischi di migrazione. Reverse engineering accelerato con tagging epistemico esplicito.
Specifica per la migrazione, record-keeping per AI Act Art. 12, asset di conoscenza per il team del cliente. Documentazione bilateralmente collegata al simbolo di codice.
Trasformazione nel target stack preservando esattamente la logica di business attiva. Parità funzionale non negoziabile. Ottimizzazioni segnalate come raccomandazioni post-migrazione.
Il dominio dove il framework prende la posizione più forte. L'equivalenza non è raccomandazione — è gate non negoziabile. Senza prova formale, niente cutover in produzione.
Sicurezza del codice modernizzato e conformità normativa. Attenzione esplicita alla superficie MCP — trattata come superficie di attacco, non come capability acquisita.
La modernizzazione AI-driven fallisce silenziosamente quando il sistema modernizzato compila e supera test sintattici ma diverge dal comportamento di produzione sugli edge case che il codice legacy ha accumulato in decenni. CATALYST rende la prova formale di equivalenza un gate obbligatorio, non una raccomandazione.
Registrazione di un campione rappresentativo di transazioni — tipicamente una settimana di produzione + i casi limite identificati in DISCOVER. SQL Profiler · application log · transaction journal.
Ambiente pre-produzione con dati allineati. Stessi input, due sistemi, due set di output capturati: funzionali · query SQL emesse · log · stato finale del database.
Output testuali → exact match (diff hex se richiesto). Output numerici → range di tolleranza firmato dal business owner. Log → diff strutturale: stessi event, stessi level, payload tollerato.
Pacchetto firmato con tutti i diff residui dichiarati e classificati come atteso / non atteso / da indagare. Compliance evidence per AI Act Art. 14 (human oversight) e Art. 15 (accuracy, robustness).
Pattern industriale di parallel execution legacy ↔ cloud, con replay live di eventi di produzione e cifra di equivalenza funzionale. Caso reale documentato: Intesa Sanpaolo — la stessa metodologia con cui ha dichiarato pubblicamente di aver ottenuto l'approvazione del regolatore sulla migrazione del proprio core.
La fase Validate di IBM watsonx Code Assistant for Z formalizza un pattern equivalente per il mainframe Z, con sistemi side-by-side e validazione progressiva. CATALYST lo eredita e lo specializza come procedura obbligatoria a livello di gate.
Liu et al. 2025/2026, “Preserving Business Logic in Legacy System Modernization”. Zhang et al. (IBM Research, ICSE 2026), pipeline ibride neuro-simboliche per traduzione COBOL→Java. Il consenso indipendente è netto: equivalenza comportamentale o niente.
“Questa firma del business owner contribuisce alla compliance evidence per AI Act Art. 14 (human oversight) e Art. 15 (accuracy & robustness). Per workload bancari il pattern operativo dimostrato come efficace è il confronto SQL Profiler-based, side-by-side, su pre-produzione con dati reali.”
Il problema legacy non è specifico di una banca o di un linguaggio. Il framework è strutturato come strumento generale a cui si applica lo specifico del cliente — non come implementazione ad-hoc che si replica copiando-incollando.
Definisce come la pipeline lavora, indipendentemente da cosa migra. Skill generiche, agent orchestratori, hook deterministici, schema YAML dei contratti operativi. Vocabolario obbligatoriamente neutro: “controllo UI”, “event handler”, “business rule embedded”.
Specializza la pipeline core su uno stack specifico. Domain expert agent (oracle read-only), detection rules grep-able, migration pattern documentati. Aggiungere un nuovo stack = scrivere un nuovo Layer 2, senza toccare il core.
Ospita lo specifico del cliente: project context (convenzioni, vincoli, infrastruttura), knowledge base accumulata, documentation per applicazione e stato operativo del programma. Cresce con il progetto.
Separazione netta: skill no-LLM per lavoro deterministico (grep, AST, schema, build). Agent LLM per lavoro interpretativo (cluster escalation, semantic drift, judgement).
Protezione legacy · gate enforcement · write perimeter · auto-build debounced · load memory for stack. Non passano dal modello, non possono allucinare.
legacy-analyzer · migration-executor · verifier-semantic · knowledge-curator. Opus 4.7 max effort sui task critici; Sonnet 4.6 high per la curation.
Mai grep su prosa per estrarre stato. Tre YAML schema-validati come Single Source of Truth: apps.yaml · batch.yaml · work-order.yaml.
Ogni fase produce due artefatti distinti: un contratto operativo YAML (machine-readable, schema validato) e un deliverable narrativo Markdown. La separazione è strutturale: niente fase chiude senza che la skill deterministica /check-phase abbia esito PASS o bypass tracciato con motivazione.
Un gate FAIL bloccante è bypassabile solo via --force --reason "motivo concreto". Ogni bypass viene loggato in bypass.yaml e incluso come WARNING permanente nei report a valle.
/batch-prep identifica shared library, native binding e DAG di dipendenze; /batch-order calcola topological sort (Kahn) producendo wave parallelizzabili.
Su Claude Code (CLAUDE.md + Skills + Hooks + Subagents + Plugins). Replicabile su Codex CLI via AGENTS.md per scenari multi-vendor.
Un caso reale (anonimizzato) di trasformazione: un job di quietanzamento massivo scritto in VB.NET BackgroundWorker con connection string hardcoded e UI freeze su 250k+ polizze, modernizzato in un service C# 13 / .NET 9 con DbContextFactory, async pipeline, cancellation token e logging strutturato. La stored procedure non viene modificata — è vincolo del cliente.
BackgroundWorker → async/await + CancellationToken
Secret hardcoded → IOptions + secret store
EF6 EDMX → EF Core 9 code-first via factory
Solo perf (sync→async); output identico
Anthropic, IBM, Google e AWS pubblicano playbook agentici tecnicamente solidi. Nessuno di essi affronta sistematicamente DORA Art. 6-30, EU AI Act Art. 9-72, NIS2, BCBS 239, FRIA, Banca d'Italia Circ. 285 e le Linee Guida AGID. Il vuoto è materiale — ed è quello che il framework riempie.
Specializzazione regolatoria by design · Equivalenza comportamentale come gate · Implementazione già in produzione
L'ecosistema Model Context Protocol è in espansione rapida — oltre 9.400 server pubblici nel registry a metà aprile 2026, donato alla Linux Foundation Agentic AI Foundation a dicembre 2025 — ma ha mostrato vulnerabilità strutturali significative tra dicembre 2025 e maggio 2026. La policy del framework è netta.
Anthropic registry · Linux Foundation MCP registry · registry self-hosted del cliente · vendor enterprise certificati. Mai server da repo personali o community non verificati.
Si preferisce HTTP-SSE con TLS 1.3 + OAuth 2.1 + PKCE. Quando STDIO è inevitabile, il container è full-sandboxed con outbound network bloccato.
Ogni server MCP gira in container con permessi minimi, allowlist esplicita di endpoint, no shell access.
Per progetti enterprise: tutto il traffico LLM ↔ MCP passa da un gateway che centralizza autenticazione, audit logging, rate limiting. Niente connessioni dirette agente ↔ server esterno.
Per workload Annex III high-risk: guardrail di terze parti (Palo Alto Prisma AIRS, Capsule Security) sul flusso LLM ↔ tool ↔ response, con detection di prompt injection ed exfiltration.
Logging di ogni invocazione MCP (server, tool, parametri, risultato) in sistema SIEM-compatibile. Retention 5+ anni allineata a DORA Art. 9 e AI Act Art. 12.
Trattata come classe di rischio SaaS, non come singola CVE. Aggiornamento continuo del registro via threat intelligence; review trimestrale della superficie MCP del progetto.
Anthropic ha rifiutato di patchare il difetto STDIO a livello di protocollo, definendo il comportamento “expected”. Implicazione operativa per workload regolati: STDIO MCP è untrusted by default.
MCP Gateway commerciali maturi: MintMCP, Truto. Runtime guardrail: Palo Alto Prisma AIRS, Capsule Security. Stack di hardening ricostruibile, non da inventare.
Nessuno dei competitor in ambito modernizzazione AI-driven (Anthropic Playbook, Google Mainframe Rewrite, AWS Transform, IBM Project Bob) dichiara una policy MCP equivalente. È una scelta di metodo esplicita del framework.
Il 23 febbraio 2026 Anthropic ha pubblicato il Code Modernization Playbook. Il giorno della pubblicazione il titolo IBM ha perso il 13% intraday — il mercato ha letto l'annuncio come un cambio di equilibrio. CATALYST si posiziona come estensione e specializzazione del Playbook per il contesto banking/insurance dell'Unione Europea — con tre estensioni concrete e due divergenze esplicite.
Il Playbook Anthropic copre COBOL→Java/Python come caso esemplare. CATALYST tratta il vero parco legacy italiano: .NET Framework, VB6, FoxPro, Clipper, PHP legacy, oltre al COBOL mainframe.
Il Playbook indica il "parallel run" come buona pratica ma non ne formalizza la procedura. CATALYST la rende obbligatoria: replay produzione, side-by-side, diff, sign-off, in coerenza con Google Dual Run e IBM Validate.
Il Playbook tratta i test come parte del workflow agentico. CATALYST li separa architetturalmente (skill no-LLM vs agent LLM) e li mette come gate obbligatorio tra le fasi: nessuna fase chiude senza esito PASS o bypass tracciato.
Il Playbook non discute DORA, AI Act, NIS2, BCBS 239, FRIA, e non affronta la doppia natura per cui il sistema modernizzato può essere Annex III e l'agent che lo migra è un GPAI. CATALYST è regulatory-by-design.
Il Playbook tratta MCP come capability acquisita. CATALYST lo tratta come superficie d'attacco con riferimento esplicito alle CVE 2025-2026 e presidi runtime obbligatori per workload Annex III high-risk.
| Vendor | Modello / prodotto | Punto di forza per legacy modernization | Caveat per banking/insurance EU |
|---|---|---|---|
| Anthropic | Claude Opus 4.7 · Sonnet 4.6 | Runtime locale eccellente · subagent + MCP · multi-agent orchestrator · Code Modernization Playbook (feb. 2026) | Cowork escluso da workload FSI/HIPAA/FedRAMP per dichiarazione vendor · STDIO MCP rifiutato patch design |
| OpenAI | GPT-5.5 · GPT-5.3-Codex | Stack agentico più coerente cross-surface · Skills · Apps SDK · MCP nativo · Codex App/CLI/IDE | API diretta non offre EU sovereign autonomo · via Azure OpenAI con Data Zone Standard EUR |
| Gemini 3.1 Pro · Antigravity | Dual Run è benchmark di equivalenza comportamentale · casi reali banking documentati (Intesa Sanpaolo, Santander) | Antigravity ancora preview, exploited entro 24h dal lancio · sovereignty su S3NS PREMI3NS H2 2026 | |
| IBM | Project Bob (GA 28 apr. 2026) | Adiacenza mainframe Z/i · multi-model nativo con Claude routato · Bob Premium Package for Z (private preview) | Bobcoins pricing trasparente ma non mappa pubblicamente a token · on-prem disponibile |
| AWS | Transform · Reforge · Mainframe Modernization | Pricing "agent minute" $0.035/min innovativo · casi banking documentati (Allianz, Generali, Danske, BNP Paribas) | ESC eusc-de-east-1 non offre Claude (solo Nova Lite/Pro) · CLOUD Act resta esposto |
| Microsoft / GitHub | Copilot agent mode · Bankdata · Azure MCP | Distribuzione enterprise ubiqua · framework Bankdata open source banking-grade · Semantic Kernel-based | "Mainframe MCP server" non è prodotto a sé · EU Data Boundary opt-in |
| Cognition | Devin | "Autonomous teammate" narrazione forte · casi Goldman Sachs / Mercedes-Benz | Benchmark pubblici comparabili meno chiari del marketing · richiede stringenti gate HiL in regolato |
| Mistral | Codestral 25.08 · Devstral 2 123B | Hybrid/on-prem/in-VPC · EU-headquartered · profilo migliore per sovereign EU | Quality gap su SWE-Bench rispetto a frontier US · Cohere post-merger Aleph Alpha apre opzione DE |
Java + Python · GA marzo 2026 · air-gapped · coverage 81% line / 61% mutation
AST recipes · 5.000+ ricette · self-hosted · MCP-callable · auditabile
Knowledge graph deterministico · FedRAMP-ready · zero allucinazioni via simbolico
Standard de-facto per scope mainframe · alimenta WCA4Z e Bob
Il framework è progettato come strumento generale. Aggiungere il supporto a un nuovo stack significa scrivere un nuovo domain adapter, non modificare il core. Otto stack documentati, altri in evoluzione attiva.
| Tecnologia sorgente | Target primario | Target alternativo | |
|---|---|---|---|
| COBOL / CICS / IMS | → | Java / Spring Boot | Kotlin / .NET Core |
| PL/SQL / Oracle Forms | → | Java / Python | PostgreSQL + REST API |
| Natural / Adabas | → | Java / Spring | .NET / cloud-native |
| RPG / AS400 | → | Java / cloud | Python / serverless |
| VB6 / .NET legacy (3.5–4.x) | → | .NET 9 / C# 13 / WPF | Blazor / .NET MAUI |
| PowerBuilder | → | Java / Angular | React / Vue.js |
| Struts / EJB 2.x | → | Spring Boot 3 | Quarkus / Micronaut |
| PHP legacy (5.x / 7.x) | → | PHP 8.x + Symfony 7+ | Laravel 11+ |
Primario gruppo bancario IT — programma in produzione
In funzione di dimensione e complessità
Inclusi cicli di validazione esterni del cliente
Moduli Annex III AI Act high-risk
Il business case si costruisce su sei voci misurabili prima e dopo, non su una singola percentuale di produttività. Il cliente può calibrarle sul proprio baseline reale durante il pilot.
Il pricing emergente 2026 — AWS “agent minute” $0.035/min, IBM Bobcoins, GitHub Copilot usage-based — sposta il mercato dal Time & Material verso modelli ibridi orientati al risultato. Il framework si posiziona dove il mercato sta andando.
Audit tecnico del portafoglio applicativo. Risk classification preliminare Annex III vs standard. Dichiarazione del threat model. Selezione del domain adapter Layer 2.
Esecuzione completa delle tre fasi su 1 applicazione di complessità medio-bassa. Deliverable concreti + baseline di metriche reali condivise col cliente.
Definizione del piano per 5–15 applicazioni successive. Throughput e team adattati. Knowledge curator attivo come watchdog continuo.
Trasferimento integrale della knowledge base al team interno del cliente: sub-agent, skill, hook, pattern, glossario di dominio, decisioni archiviate.
L'architettura a tre strati permette di applicare il framework a domini diversi modificando solo Layer 2 (domain adapter per stack) e Layer 3 (knowledge project-level). I principi restano invariati; gli adattamenti operativi sono specifici.
Piano Triennale ICT 2024-2026 → 75% PA migrate al cloud entro 2026. PSN (TIM, Leonardo, CDP Equity, Sogei) come spina dorsale.
INPS / INAIL su COBOL/PL-I + DB2. Agenzia Entrate / Sogei su monoliti di anagrafe tributaria. Sistemi sanitari regionali eterogenei.
AGID Determinazione 17/2025 + 43/2026. NIS2 con ispezioni ACN da ottobre 2026. Livelli QC1-QC4 di qualificazione cloud. Responsabilità umana non delegabile (CAD Art. 71 + L. 132/2025 Art. 14).
DISCOVER + DOCUMENT prezioso per recuperare la conoscenza tacita da sistemi soggetti a brain drain dei sistemisti storici. SECURE è l'argomento di NIS2-readiness.
Procurement via cataloghi cloud qualificati ACN o framework SPC. CATALYST come metodologia all'interno di contratti-quadro, non come licenza stand-alone.
FSE 2.0 fase 3 di piena operatività dal 31 marzo 2026 — alimentazione strutturata CDA2/HL7-FHIR entro 5 giorni. Sogei/AGID/MEF + Min. Salute + Agenas + Regioni.
HIS, LIS, PACS/RIS datati, spesso isolati. Mix di Java EE vecchio, .NET Framework, vendor proprietari.
MDR (UE 2017/745) + IVDR (2017/746) per software medical device. MDCG 2025-6: Medical Device AI è high-risk quando il device richiede notified body. GDPR Art. 9. PLD presunzioni di causalità per software difettosi.
VALIDATE configurato per generare test esaustivi sul legacy con dati sintetici GDPR-conformi. Differential trace analysis per ogni traduzione in microservizi. Tracciati legacy → API HL7-FHIR native per inserimento one-click nel FSE 2.0.
Doppia compliance MDR + AI Act è onerosa e richiede partner notified body. Per moduli life-critical il principio HiL si applica al grado massimo (four-eyes obbligatorio, FRIA esteso).
Convergenza IT/OT in espansione (smart meter, rinnovabili, dispatching). Iberdrola con €58B 2025-2028 (IA4TES per modernizzazione reti).
SCADA, EMS/DMS su architetture decennali in C/C++ o logiche PLC. Sopra: ERP, CRM, Billing utility, piattaforme di mercato dell'energia.
NIS2 con energia in Annex I come entità essenziali (D.Lgs. 138/2024). ISO/IEC 27019 baseline SCADA. Network Code on Cybersecurity (Reg. UE 2024/1366) — DORA non si applica all'energia, NCCS riempie il gap. AI Act Annex III §2 per safety component.
Le porzioni IT (billing, CRM, batch consumi) → pipeline standard. Le porzioni OT/SCADA → adattamento severo: pattern Strangler con wrapper API che incapsula il legacy SCADA per il cloud, mantenendo il controllo real-time governato dal legacy.
Compliance ARERA + NCCS aggiunge un livello regolatorio non presente in banking. OT/SCADA richiede competenze ingegneristiche (IEC 61508/61511) — CATALYST è componibile con un partner di safety engineering, non sostitutivo.

“Un team di builder, non una consulting firm camuffata.
Il framework è scritto, eseguito e iterato da un team che gira AI coding agents in produzione su un cliente reale, ogni giorno.”
DORA, AI Act, NIS2, BCBS 239, FRIA, Banca d'Italia Circ. 285, AGID, Legge 132/2025 — input di disegno, non vincoli a posteriori.
Procedura formale obbligatoria: replay produzione, side-by-side, diff con threshold ex ante, sign-off del business owner.
Programma operativo su ~80 applicazioni desktop di un'assicurazione appartenente a un primario gruppo bancario italiano.