Sto combattendo contro dei bot sul mio forum di retro-informatica.

📖 10 min read•1,994 words•Updated Apr 4, 2026

D’accord, amici, Pat Reeves qui vi parla direttamente da botsec.net. Siamo il 23 marzo 2026, e di recente mi sono trovato di fronte a un certo tipo di mal di testa legato ai bot. Non il tipo sofisticato sponsorizzato da uno stato-nazione – anche se quelli sono sempre divertenti da analizzare – ma quella seccatura automatizzata leggermente troppo intelligente che prende di mira uno dei miei progetti collaterali.

Per dare un po’ di contesto, il mio progetto collaterale è un piccolo forum di nicchia per appassionati di informatica retro. Niente di particolare, solo un posto per noi, i veterani, per lamentarci delle CPU moderne e discutere su come emulare al meglio un Amiga. Il traffico non è enorme, ma è appassionato, e per mesi è stato libero da bot. Fino al mese scorso.

All’improvviso, bot di registrazione. Non solo un drappello, ma onde. Centinaia di falsi account, tutti con nomi utente leggermente randomizzati, indirizzi email generici (spesso provenienti da domini di recente registrazione), e assolutamente nessun storico di post. Non spammavano immediatamente, il che era strano. Si limitavano a… registrarsi. E a riempire il mio database utenti, rendendo la sua gestione fastidiosa e, francamente, facendomi sentire che il mio piccolo angolo digitale era invaso.

Quindi, questo mese parliamo di Vulnerabilità: L’ascesa silenziosa – Perché le registrazioni di bot a basso sforzo rappresentano una minaccia maggiore di quanto pensiate (e come fermarle).

Noia che diventa una minaccia

Potresti pensare, “Pat, sono solo registrazioni. Non è un grosso problema, giusto? Eliminali e passa oltre.” E per un certo periodo, è stato esattamente il mio ragionamento. Ho impostato un cron job per eliminare gli account senza post dopo 24 ore. Problema risolto, giusto? Sbagliato.

I bot si sono adattati. Hanno iniziato a fare un unico, semplice posto inoffensivo. “Ciao!” o “Felice di essere qui.” Nulla che attivasse i miei filtri anti-spam. Justo abbastanza per evitare la cancellazione degli account senza post. Ora, avevo centinaia di account con un post inutile, che continuavano a ingombrare il mio database, necessitando ancora di una revisione manuale.

Non è solo un semplice fastidio. È un attacco sottile e insidioso. Ecco perché:

Esaurimento delle risorse: Ogni registrazione, ogni voce nel database, ogni piccolo post consuma risorse server. Per un sito piccolo come il mio, non è trascurabile. Se il volume aumenta, può portare a un degrado delle prestazioni o persino a un diniego di servizio per gli utenti legittimi.
Inquinamento dei dati: Le mie tabelle utenti erano un disastro. Trovare veri utenti, analizzare l’attività, o anche semplicemente fare il backup del database, è diventato più noioso.
Rischi per la reputazione: Se questi account cominciassero improvvisamente a spamare o a fare phishing, la reputazione del mio forum potrebbe risentirne. I motori di ricerca non amano i siti associati ad attività malevole.
Preludio a attacchi più grandi: Spesso, i bot di registrazione a basso sforzo sono una fase di ricognizione. Testano le acque, identificano le debolezze e pongono le basi per attacchi più sofisticati successivi, come il credential stuffing o persino il phishing mirato di veri utenti.
Rischi di Credential Stuffing e di Account Takeover (ATO): Questo è il problema principale. Se un bot registra un account, e un utente legittimo cerca poi di registrarsi con lo stesso nome utente/email (o uno comune), l’operatore del bot ha ora una potenziale vittima per il credential stuffing se ha acquisito credenziali da un’altra violazione. Può provare queste credenziali sul mio sito.

Quindi, ciò che è iniziato come un problema “meh, pulirò tutto più tardi” si è rapidamente trasformato in una situazione “deve finire ora”.

Le mie prime (fallite) tentativi: La trappola CAPTCHA

La mia reazione iniziale, come molti, è stata di aggiungere un CAPTCHA. Specificamente, reCAPTCHA v2. Tutti conoscono reCAPTCHA, giusto? La casella da spuntare “Non sono un robot”, forse alcuni segnali stradali sfocati.

L’ho implementato. Per circa tre giorni, le registrazioni sono scese a praticamente zero. Mi sono dato una pacca sulla spalla. “Aha! Risolto!”

Poi, sono tornati. Non così tanti, ma abbastanza. Come? Beh, per reCAPTCHA v2, ci sono servizi che pagano umani in centesimi per risolvere i CAPTCHA. Oppure, sempre di più, i modelli di IA stanno diventando abbastanza bravi da decifrarli, specialmente quelli più semplici. È un gioco del gatto e del topo, e per un sito a basso traffico, non ne valeva il costo di reCAPTCHA v3 (che può essere un incubo da configurare senza che gli utenti legittimi vengano segnalati).

Inoltre, gli utenti legittimi odiano i CAPTCHA. Ho ricevuto alcune lamentele. Il mio pubblico appassionato di informatica retro, Dio li benedica, non è sempre il più paziente con le seccature del web moderno. Avevo bisogno di qualcosa di meno intrusivo, più efficace contro i bot e meno noioso per gli umani.

Oltre la casella da spuntare: Difese pratiche

Dopo aver abbandonato il CAPTCHA visibile, ho iniziato a riflettere su cosa renda un umano un umano, e un bot un bot, oltre al semplice cliccare su una casella. Ecco cosa ha funzionato davvero per me:

1. Il campo Honeypot

È un classico per un motivo. È semplice, efficace e completamente invisibile per gli utenti umani. L’idea è di aggiungere un campo aggiuntivo, nascosto, al tuo modulo di registrazione. I bot, essendo meno sofisticati degli umani, cercheranno spesso di riempire ogni campo che trovano. Gli umani non lo vedranno, quindi non lo riempiranno.

Ecco un esempio semplificato di ciò che ho aggiunto al mio modulo di registrazione HTML:


<form action="/register" method="POST">
 <label for="username">Nome utente:</label>
 <input type="text" id="username" name="username" required>
 
 <label for="email">Email:</label>
 <input type="email" id="email" name="email" required>
 
 <!-- Campo Honeypot -->
 <div style="display:none;">
 <label for="fax_number">Numero di fax (lasciare vuoto):</label>
 <input type="text" id="fax_number" name="fax_number" tabindex="-1" autocomplete="off">
 </div>
 
 <label for="password">Password:</label>
 <input type="password" id="password" name="password" required>
 
 <button type="submit">Registrati</button>
</form>

E dal lato server (usando un esempio Python/Flask, ma la logica si applica universalmente):


@app.route('/register', methods=['POST'])
def register():
 # Controllare il campo honeypot
 if request.form.get('fax_number'):
 # Bot rilevato! Registralo, magari blocca l'IP, e restituisci un errore
 print(f"Honeypot attivato dall'IP: {request.remote_addr}")
 return "Registrazione fallita. Per favore, riprova.", 400 # O un messaggio di successo generico per confondere i bot
 
 username = request.form.get('username')
 email = request.form.get('email')
 password = request.form.get('password')
 
 # ... resto della tua logica di registrazione ...
 
 return "Registrazione riuscita!"

Il display:none; lo rende invisibile. tabindex="-1" impedisce la navigazione tramite tastiera. autocomplete="off" aiuta a impedire ai browser di compilarlo automaticamente. Ho scelto “fax_number” perché è un campo superato che non ha senso in un modulo di registrazione moderno, rendendolo un buon “appetito”.

2. Analisi basata sul tempo (controllo dell’ora)

I bot inviano spesso moduli incredibilmente rapidamente. Gli umani impiegano almeno qualche secondo per compilare anche un semplice modulo. Registrerò il tempo di caricamento del modulo e il tempo di invio.

Quando il modulo di registrazione viene servito:


<form action="/register" method="POST">
 <!-- Altri campi del modulo -->
 <input type="hidden" name="form_load_time" value="{{ current_timestamp_in_seconds }}">
 <button type="submit">Registrati</button>
</form>

Dal lato server:


import time

@app.route('/register', methods=['POST'])
def register():
 form_load_time = int(request.form.get('form_load_time', 0))
 submission_time = int(time.time())
 
 time_taken = submission_time - form_load_time
 
 # Se il modulo è stato inviato troppo rapidamente (ad esempio, meno di 5 secondi)
 if time_taken < 5: 
 print(f"Invio troppo rapido dall'IP : {request.remote_addr}, ha impiegato {time_taken}s")
 return "Registrazione fallita. Per favore riprova.", 400
 
 # ... resto della tua logica di registrazione ...
 
 return "Registrazione riuscita!"

Ho optato per un minimo di 5 secondi. Questo ha immediatamente catturato una buona parte dei bot rimanenti. Attenzione a non impostare questa soglia troppo alta, poiché utenti autentici potrebbero digitare rapidamente o avere moduli precompilati.

3. Limitazione del traffico per IP (con un tocco)

La limitazione standard del traffico IP è buona: “Non più di 5 registrazioni da questo IP all’ora.” Ma i bot usano spesso proxy o cambiano gli IP. Quindi, ho aggiunto un tocco: impronta IP e User-Agent.

Ho iniziato a registrare la stringa User-Agent con l’indirizzo IP. Se notavo un improvviso aumento delle registrazioni provenienti da diversi IP ma con la stessa stringa User-Agent, leggermente insolita, questo era un forte indicatore di un botnet o di un singolo bot che cambiava gli IP. Questo mi ha permesso di bloccare temporaneamente o segnalare non solo l’IP, ma anche il User-Agent se era chiaramente non-browser o ripetuto in modo sospetto.

Questo non è un frammento di codice che puoi semplicemente inserire, poiché richiede una certa registrazione e un’analisi lato backend. Ma concettualmente, si tratta di osservare i modelli oltre l’IP sorgente. Molti firewall per applicazioni web (WAF) offrono questo tipo di limitazione avanzata del traffico e rilevamento di anomalie.

4. Verifica del dominio email (utilizzando dati pubblici)

Molte registrazioni di bot provengono da domini email recentemente registrati, spesso usa e getta. Ho implementato una verifica contro una piccola lista selezionata di fornitori di email usa e getta noti, ma in modo più efficace, ho iniziato a guardare l’età del dominio email stesso.

Esistono API (alcune a pagamento, altre gratuite con limitazioni) che possono dirti quando un dominio è stato registrato. Se un’indirizzo email proviene da un dominio registrato negli ultimi 30 giorni, è un enorme campanello d’allarme. Non è infallibile – nuovi siti legittimi vengono lanciati tutto il tempo – ma combinato con altri segnali, è potente.

Per il mio forum, ho preso una decisione pragmatica: se il dominio aveva meno di 60 giorni E altri segnali di bot erano presenti (honeypot attivato, invio troppo rapido), bloccherei direttamente la registrazione. Per i domini di meno di 30 giorni, li segnalerò per una revisione manuale e potrei richiedere una conferma via email prima dell’attivazione.

I Risultati: La Pace (Quasi) Ristabilita

L’implementazione di questi passaggi non è stata una soluzione istantanea, ma è stata incredibilmente efficace. L’honeypot e le verifiche basate sul tempo hanno immediatamente ridotto la maggior parte delle registrazioni automatizzate. L’analisi dei modelli di IP/User-Agent mi ha aiutato a identificare e bloccare gli operatori di bot più persistenti.

Il mio database utenti è di nuovo pulito. I miei log del server sono meno rumorosi. E posso concentrarmi sulla moderazione delle discussioni sulla superiorità del chipset SID del Commodore 64, invece di eliminare centinaia di falsi account.

È importante capire che non è una soluzione “da impostare e dimenticare”. I bot evolvono. Gli aggressori trovano nuovi metodi. Dovrò monitorare e adattarmi. Ma per ora, questi metodi pratici e a basso costo mi hanno riportato il controllo del mio piccolo angolo di internet.

Punti da Ricordare

Se ti trovi di fronte a registrazioni di bot poco impegnative o a disturbi automatizzati simili, ecco cosa dovresti fare subito:

Implementa un Honeypot: È incredibilmente semplice, efficace e invisibile per gli utenti. Procedi.
Aggiungi una Verifica Temporale: Misura il tempo tra il caricamento del modulo e l’invio. Blocca le submission che sono anormalmente rapide.
Vai oltre il Semplice Blocco dell’IP: Cerca modelli nelle stringhe User-Agent, nei referenti e in altri header di richiesta per identificare bot sofisticati che cambiano gli IP. Considera un WAF se il tuo traffico lo giustifica.
Valida i Domini delle Email: Controlla i fornitori di email usa e getta noti e considera l’età del dominio per le nuove registrazioni.
Monitora e Adatta: I bot evolvono sempre. Tieni d’occhio i tuoi log, analizza le attività sospette e sii pronto ad aggiustare le tue difese.
Non Disturbare gli Utenti Reali: Dai priorità all’esperienza utente. Evita CAPTCHAs eccessivamente restrittivi o regole troppo severe che potrebbero bloccare registrazioni legittime. La migliore difesa contro i bot è quella che gli esseri umani non notano nemmeno.

Stai attento là fuori e tieni lontani questi bot!

Sto combattendo contro dei bot sul mio forum di retro-informatica.

Noia che diventa una minaccia

Le mie prime (fallite) tentativi: La trappola CAPTCHA

Oltre la casella da spuntare: Difese pratiche

1. Il campo Honeypot

2. Analisi basata sul tempo (controllo dell’ora)

3. Limitazione del traffico per IP (con un tocco)

4. Verifica del dominio email (utilizzando dati pubblici)

I Risultati: La Pace (Quasi) Ristabilita

Punti da Ricordare

Articoli Correlati

Related Articles

Noia che diventa una minaccia

Le mie prime (fallite) tentativi: La trappola CAPTCHA

Oltre la casella da spuntare: Difese pratiche

1. Il campo Honeypot

2. Analisi basata sul tempo (controllo dell’ora)

3. Limitazione del traffico per IP (con un tocco)

4. Verifica del dominio email (utilizzando dati pubblici)

I Risultati: La Pace (Quasi) Ristabilita

Punti da Ricordare

Articoli Correlati

You May Also Like

📚 You Might Also Like

Related Articles