Agent Sandboxing: Un tutorial pratico per operazioni AI sicure

📖 13 min read•2,519 words•Updated Apr 4, 2026

Introduzione al Sandboxing degli Agenti

Man mano che gli agenti di intelligenza artificiale diventano sempre più sofisticati e autonomi, la necessità di solide misure di sicurezza diventa fondamentale. Una delle tecniche più critiche per garantire la sicurezza degli agenti AI, in particolare quelli che interagiscono con sistemi esterni o dati sensibili, è il sandboxing. Il sandboxing degli agenti implica la creazione di un ambiente isolato in cui un agente può operare senza avere accesso diretto o la capacità di influenzare in modo malevolo il sistema host o altre risorse di rete. Questo tutorial esplorerà gli aspetti pratici del sandboxing degli agenti, fornendo esempi pratici e migliori pratiche per garantire che le tue distribuzioni AI siano sicure e affidabili.

Il principio centrale alla base del sandboxing è il minor privilegio: un agente dovrebbe avere solo i permessi minimi necessari per svolgere le sue funzioni previste. Limitando un agente a un sandbox, riduci i rischi come:

Esecuzione di Codice Malevolo: Prevenire che un agente (sia per design che a causa di una vulnerabilità) esegua comandi arbitrari sul sistema host.
Esfiltrazione di Dati: Limitare la capacità di un agente di leggere o trasmettere dati sensibili al di fuori del suo ambito designato.
Abuso delle Risorse: Limitare un agente dall’utilizzare eccessivamente CPU, memoria o larghezza di banda di rete, il che potrebbe portare ad attacchi di denial-of-service o instabilità del sistema.
Manomissione del Sistema: Proteggere i file di sistema critici, le configurazioni e le impostazioni di rete da modifiche non autorizzate.

Questo tutorial si concentra su metodi pratici e accessibili per il sandboxing, principalmente utilizzando strumenti basati su Linux e Python per lo sviluppo degli agenti, poiché sono scelte comuni negli ambienti di sviluppo AI.

Comprendere il Modello di Minaccia per gli Agenti AI

Prima di esplorare l’implementazione tecnica, è fondamentale comprendere il modello di minaccia unico associato agli agenti AI. A differenza del software tradizionale, gli agenti AI, soprattutto quelli che utilizzano modelli di linguaggio di grandi dimensioni (LLM) o complessi algoritmi di apprendimento per rinforzo, possono presentare comportamenti emergenti. Possono:

Malinterpretare le Istruzioni: Portare a azioni indesiderate che, senza sandboxing, potrebbero avere gravi conseguenze.
Essere Soggetti a Iniezione di Prompt: Un attore esterno potrebbe manipolare il comportamento dell’agente attraverso input progettati, facendolo deviare dal suo scopo previsto.
Scoprire Vulnerabilità: Attraverso interazioni e osservazioni estese, un agente potrebbe identificare vulnerabilità nei sistemi con cui interagisce, se non adeguatamente isolato.
Propagare Dati Malevoli: Se un agente elabora dati esterni non affidabili, potrebbe diventare involontariamente un vettore per diffondere malware o disinformazione se non contenuto.

Quindi, il sandboxing non riguarda solo la protezione contro attaccanti esterni, ma anche il contenimento del potenziale comportamento malevolo indesiderato o emergente dall’agente stesso.

Scegliere i Tuoi Strumenti di Sandboxing

Esistono diversi strumenti e tecniche disponibili per il sandboxing degli agenti. La scelta dipende spesso dal livello di isolamento richiesto, dalla complessità del tuo agente e dall’ambiente di distribuzione. Ecco alcuni approcci comuni:

1. Containerizzazione Linux (Docker, Podman)

I container sono forse il metodo più popolare e versatile per sandboxare applicazioni, inclusi gli agenti AI. Forniscono ambienti leggeri e isolati con il proprio filesystem, processi e interfacce di rete. Docker e Podman sono i runtime di container principali.

2. Macchine Virtuali (VM)

Le VM offrono il massimo isolamento poiché emulano un intero sistema hardware. Pur essendo più intensive in termini di risorse rispetto ai container, sono adatte per agenti che richiedono una sicurezza estrema o configurazioni hardware specifiche.

3. Namespaces e cgroups di Linux

Queste sono le tecnologie sottostanti che alimentano i container. Puoi usarle direttamente per un controllo dettagliato sull’isolamento di processo, rete, utente e filesystem (namespaces) e sui limiti delle risorse (cgroups).

4. Chroot Jails

Una forma più semplice di isolamento del filesystem, chroot cambia la directory root apparente per un processo in esecuzione e i suoi figli. È meno approfondito rispetto ai container, ma efficace per un isolamento di base del filesystem.

5. Sandbox Specifiche per Linguaggi di Programmazione (ad es., `subprocess` di Python con restrizioni)

Sebbene non sia un sandbox di sistema completo, le funzionalità del linguaggio possono offrire un certo livello di controllo su cosa un agente può eseguire o accedere all’interno dell’ambiente di esecuzione del linguaggio.

Per questo tutorial, ci concentreremo principalmente su Docker grazie alla sua ampia diffusione, facilità d’uso e un buon set di funzionalità per creare ambienti sandbox sicuri.

Esempio Pratico: Sandboxing di un Agente AI Python con Docker

Immaginiamo di avere un semplice agente AI Python che prende un prompt dell’utente, lo elabora (magari utilizzando un LLM locale o qualche analisi dei dati) e poi dovrebbe salvare il suo output in una directory specifica. Senza il sandboxing, questo agente potrebbe potenzialmente:

Leggere file arbitrari dal filesystem host.
Eseguire comandi di shell arbitrari se è vulnerabile all’iniezione di prompt o ha un difetto.
Effettuare richieste di rete non autorizzate.

Passo 1: L’Agente Non Sandboxed (per dimostrazione)

Per prima cosa, creiamo uno script minimo per l’agente Python, agent.py:

# agent.py
import os
import sys
import subprocess

def process_prompt(prompt):
 print(f"Agente ha ricevuto il prompt: {prompt}")
 
 # Simula un'elaborazione (ad es., chiamando uno strumento esterno o un'inferenza LLM)
 # ATTENZIONE: Questo è un esempio MOLTO PERICOLOSO senza sandboxing!
 # Se 'prompt' contiene comandi shell, verranno eseguiti sull'host.
 try:
 # Esempio di un'operazione pericolosa: eseguire direttamente l'input dell'utente
 # In uno scenario reale, questo potrebbe essere una chiamata a un LLM o a un altro servizio
 # ma per dimostrazione, mostriamo l'esecuzione diretta di comandi.
 result = subprocess.run(prompt, shell=True, capture_output=True, text=True, check=True)
 output = result.stdout.strip()
 error = result.stderr.strip()
 print(f"Output del comando: {output}")
 if error: print(f"Errore del comando: {error}")
 except subprocess.CalledProcessError as e:
 output = f"Errore durante l'esecuzione del comando: {e}"
 error = e.stderr.strip()
 print(output)
 if error: print(f"Errore del comando: {error}")
 except Exception as e:
 output = f"Si è verificato un errore imprevisto: {e}"
 print(output)

 # Simula il salvataggio dell'output in un file
 output_dir = os.environ.get('AGENT_OUTPUT_DIR', '/tmp/agent_outputs')
 os.makedirs(output_dir, exist_ok=True)
 output_file = os.path.join(output_dir, 'agent_response.txt')
 
 with open(output_file, 'w') as f:
 f.write(f"Prompt elaborato: {prompt}\n")
 f.write(f"Risposta dell'agente: {output}\n")
 print(f"Output dell'agente salvato in {output_file}")

 # Esempio di tentativo di accesso a file sensibili dell'host (fallirà nel sandbox)
 try:
 with open('/etc/shadow', 'r') as f:
 print("!!! PERICOLO: Agente ha accesso a /etc/shadow sull'host!!!")
 print(f.read()[:50] + "...")
 except FileNotFoundError:
 print("L'agente non è riuscito a trovare /etc/shadow (atteso nel sandbox).")
 except PermissionError:
 print("L'agente non aveva il permesso per leggere /etc/shadow (atteso nel sandbox).")

if __name__ == '__main__':
 if len(sys.argv) < 2:
 print("Utilizzo: python agent.py <prompt>")
 sys.exit(1)
 user_prompt = sys.argv[1]
 process_prompt(user_prompt)

Se esegui questo script direttamente sul tuo host con un prompt malevolo come python agent.py "ls -la /; rm -rf /tmp/test", eseguirà quei comandi sul tuo host! NON ESEGUIRE QUESTO NON SANDBOXED CON INPUT MALEVOLI SU UN SISTEMA DI PRODUZIONE.

Passo 2: Creazione di un Dockerfile per l’Agente

Ora, creiamo un Dockerfile per sandboxare questo agente. Utilizzeremo diverse funzionalità di Docker per l’isolamento:

Immagine Base Minima: Inizia con un’immagine base piccola e sicura (ad es., alpine/python).
Utente Non Root: Esegui l’agente come utente non root all’interno del container.
Filesystem Root Solo Lettura: Impedisci all’agente di scrivere in directory di sistema critiche all’interno del container.
Montaggio di Volumi (Controllato): Monta solo directory specifiche a cui l’agente deve accedere.
Restrizioni di Rete: Limita l’accesso alla rete se l’agente non ne ha bisogno.

Crea un file chiamato Dockerfile nella stessa directory di agent.py:

# Dockerfile

# Usa un'immagine base minima
FROM python:3.9-slim-buster

# Imposta la directory di lavoro all'interno del container
WORKDIR /app

# Copia lo script dell'agente e i requisiti
COPY agent.py .
# Se hai requisiti, aggiungeresti un requirements.txt e li installeresti:
# COPY requirements.txt .
# RUN pip install -r requirements.txt

# Crea un utente dedicato non root per l'agente
RUN useradd --create-home --shell /bin/bash agentuser
USER agentuser

# Crea una directory per gli output che l'agenteuser può scrivere
# Questa directory sarà di default all'interno del filesystem del container
# Montiamo successivamente una directory host su questa se necessitiamo di persistenza
RUN mkdir -p /app/outputs
RUN chown agentuser:agentuser /app/outputs

# Imposta la variabile d'ambiente per la directory di output
ENV AGENT_OUTPUT_DIR=/app/outputs

# Definisci il comando per eseguire l'agente
ENTRYPOINT ["python", "agent.py"]

Passo 3: Creazione dell’Immagine Docker

Naviga nella directory contenente il tuo Dockerfile e agent.py, quindi costruisci l’immagine Docker:

docker build -t sandboxed-agent .

Passo 4: Esecuzione dell’Agente Isolato

Ora, eseguiamo l’agente con vari prompt e osserviamo l’isolamento in azione.

Scenario 1: Prompt Inoffensivo

docker run --rm sandboxed-agent "echo Hello from the sandbox!"

Output Atteso: L’agente dovrebbe elaborare il prompt e salvare il suo output in /app/outputs/agent_response.txt *all’interno del container*. Dovrebbe segnalare di non aver trovato o di non aver potuto accedere a /etc/shadow.


L'agente ha ricevuto il prompt: echo Hello from the sandbox!
Output del comando: Hello from the sandbox!
L'agente non ha potuto trovare /etc/shadow (atteso nell'isolamento).
Output dell'agente salvato in /app/outputs/agent_response.txt

Scenario 2: Prompt Maligno (Tentativo di Accesso a File)

Prova a far leggere all’agente un file dell’host:

docker run --rm sandboxed-agent "cat /etc/passwd"

Output Atteso: L’agente leggerà il /etc/passwd *dall’interno del container*, non dall’host. Questo dimostra l’isolamento del filesystem. Non può ancora accedere a /etc/shadow a causa delle autorizzazioni utente e dell’ambiente ristretto.

Scenario 3: Prompt Maligno (Tentativo di Comando di Sistema dell’Host)

Prova a eseguire un comando che modificherebbe il sistema host:

docker run --rm sandboxed-agent "rm -rf /host/important/data"

Output Atteso: Questo comando fallirà perché /host/important/data non esiste all’interno del container. Anche se esistesse, l’agentuser all’interno del container probabilmente non avrebbe le autorizzazioni per eliminare file di sistema critici all’interno del proprio filesystem radice (se fosse, ad esempio, in sola lettura, il che aggiungeremo dopo).

Passo 5: Migliorare l’Isolamento con Opzioni di Esecuzione di Docker

Docker fornisce potenti opzioni per docker run per ulteriormente indurire l’isolamento:

a. Limitare l’Accesso al Filesystem (Root Sola Lettura)

Per impostazione predefinita, i container hanno un filesystem scrivibile. Possiamo rendere il filesystem di root in sola lettura, costringendo l’agente a scrivere solo in volumi montati esplicitamente o in directory scrivibili designate.

docker run --rm --read-only sandboxed-agent "echo This will fail to write if output dir is not mounted or special."

Problema: Ora fallirà perché l’agente prova a scrivere in /app/outputs, che è parte del filesystem di root in sola lettura. Abbiamo bisogno di un modo per permettere all’agente di mantenere il proprio output.

b. Montaggio di Volumi Controllato per la Persistenza

Per consentire all’agente di scrivere il proprio output in una specifica directory dell’host mantenendo il resto del container in sola lettura, utilizziamo un montaggio bind.

Per prima cosa, crea una directory sul tuo host per l’output dell’agente:

mkdir -p ./agent_host_outputs

Ora, esegui l’agente con --read-only e monta la directory di output dell’host:

docker run --rm --read-only \
 -v ./agent_host_outputs:/app/outputs \
 sandboxed-agent "ls -la /app/outputs; echo Host output test!"

Output Atteso: L’agente scriverà con successo in /app/outputs/agent_response.txt all’interno del container, e questo file apparirà nella directory ./agent_host_outputs del tuo host. Il tentativo di accedere a /etc/shadow fallirà ancora.

Controlla la directory del tuo host:

cat ./agent_host_outputs/agent_response.txt

c. Limitare l’Accesso alla Rete

Se il tuo agente non ha bisogno di accesso alla rete, puoi disabilitarlo completamente o limitarlo.

Nessuna Rete: --network none
Rete Isolata: Crea una rete Docker personalizzata e collega solo i container necessari ad essa.

docker run --rm --read-only --network none \
 -v ./agent_host_outputs:/app/outputs \
 sandboxed-agent "ping -c 1 google.com"

Output Atteso: Il comando ping fallirà con un errore relativo alla rete (ad esempio, “Nome o servizio sconosciuto”), dimostrando l’isolamento della rete.

d. Limitare le Risorse (CPU, Memoria)

Prevenire l’esaurimento delle risorse limitando CPU e memoria:

--cpus 0.5: Limita al 50% di un core CPU.
--memory 256m: Limita a 256 MB di RAM.

docker run --rm --read-only --network none \
 --cpus 0.5 --memory 256m \
 -v ./agent_host_outputs:/app/outputs \
 sandboxed-agent "echo Running with limited resources"

Se l’agente cerca di consumare più di questi limiti, verrà limitato o terminato da Docker.

e. Eliminare Capabilities e Profili Seccomp

I container Docker, per impostazione predefinita, vengono eseguiti con un set ridotto di capacità Linux, ma puoi eliminarne anche di più per indurirli ulteriormente. Ad esempio, se il tuo agente non ha bisogno di creare socket raw o manipolare la proprietà dei file, puoi eliminare quelle capacità.

docker run --rm --cap-drop ALL \
 -v ./agent_host_outputs:/app/outputs \
 sandboxed-agent "echo Capabilities dropped"

--cap-drop ALL è molto aggressivo e potrebbe rompere funzionalità legittime. Di solito elimini capacità specifiche che sai non essere necessarie (ad esempio, --cap-drop SETUID --cap-drop SETGID).

Seccomp (Secure Computing Mode) i profili consentono di limitare le chiamate di sistema che un container può effettuare. Docker applica un profilo seccomp predefinito, che di solito è sufficiente, ma puoi personalizzarlo per esigenze di sicurezza estreme. Questo è un argomento avanzato oltre questo tutorial, ma sii consapevole della sua esistenza.

Considerazioni Avanzate sull’Isolamento

1. Comunicazione tra Agenti

Se il tuo ecosistema AI coinvolge più agenti che devono comunicare, progetta questa comunicazione con attenzione. Invece di accedere direttamente alla rete tra agenti isolati, considera di utilizzare code di messaggi (ad esempio, RabbitMQ, Kafka) o un’apposita API gateway, dove ogni canale di comunicazione è esplicitamente definito e protetto.

2. Gestione e Sanificazione dei Dati

Qualsiasi dato ingerito da un agente AI, soprattutto da fonti non affidabili, dovrebbe essere rigorosamente convalidato e sanificato *prima* di raggiungere l’agente. Allo stesso modo, l’output di un agente dovrebbe essere convalidato prima di essere utilizzato da altri sistemi o visualizzato agli utenti.

3. Audit e Registrazione

una registrazione dettagliata delle azioni dell’agente, delle chiamate di sistema e dell’utilizzo delle risorse è cruciale per rilevare comportamenti anomali. I dati di registrazione dovrebbero essere inviati a un sistema di registrazione centralizzato e sicuro al di fuori dell’isolamento dell’agente.

4. Monitoraggio in Tempo Reale

Implementa strumenti di monitoraggio in tempo reale che possono rilevare deviazioni dal comportamento atteso dell’agente. Questo potrebbe includere il monitoraggio dei picchi di CPU/memoria, connessioni di rete insolite o tentativi di accesso a file non autorizzati.

5. Audit di Sicurezza Regolari

Rivedi periodicamente le tue configurazioni di isolamento, il codice dell’agente e l’infrastruttura sottostante per vulnerabilità. Mantieni aggiornate le tue immagini di base e il demone Docker.

Conclusione

Isolare gli agenti non è una ‘caratteristica accessoria’ ma un requisito fondamentale per distribuire agenti AI sicuri e affidabili, specialmente man mano che le loro capacità crescono. Utilizzando strumenti come Docker e applicando principi di minimo privilegio, puoi creare ambienti isolati solidi che mitigano una vasta gamma di rischi per la sicurezza. Questo tutorial ha fornito una guida pratica utilizzando Docker, dimostrando come confinare il filesystem, la rete, le risorse e i privilegi di esecuzione di un agente. Ricorda che la sicurezza è un processo continuo e che vigilanza costante, unita a un isolamento ben implementato, è fondamentale per proteggere le tue distribuzioni AI.

🕒 Published: April 4, 2026

✍️

Written by Jake Chen

AI technology writer and researcher.

Learn more →