Sto combattendo contro dei bot sul mio forum di retro-informatica.

📖 11 min read•2,012 words•Updated Apr 4, 2026

D’accord, amici, Pat Reeves qui vi parla tramite botsec.net. Oggi è il 23 marzo 2026, e recentemente ho affrontato un certo tipo di mal di testa legato ai bot. Non quello sofisticato sponsorizzato da uno stato-nazione – anche se quelli sono sempre divertenti da analizzare – ma il fastidio automatizzato leggermente troppo intelligente che colpisce uno dei miei progetti collaterali.

Per dare un po’ di contesto, il mio progetto collaterale è un piccolo forum di nicchia per appassionati di informatica retro. Niente di notevole, solo un posto per noi, i vecchi del mestiere, per lamentarci dei moderni processori e discutere del modo migliore per emulare un Amiga. Il traffico non è enorme, ma è appassionato, e per mesi è stato libero da bot. Fino al mese scorso.

All’improvviso, bot di registrazione. Non solo un rivolo, ma onde. Centinaia di falsi account, tutti con nomi utente leggermente randomizzati, indirizzi e-mail generici (spesso provenienti da domini appena registrati), e assolutamente nessun storico di post. Non spamavano immediatamente, il che era strano. Si limitavano a… registrarsi. E a riempire il mio database utenti, rendendo la sua gestione fastidiosa e, francamente, facendomi sentire che il mio piccolo rifugio digitale era invaso.

Quindi, questo mese parliamo di Vulnerabilità: L’ascesa silenziosa – Perché le iscrizioni di bot a basso sforzo rappresentano una minaccia più grande di quanto pensiate (e come fermarle).

Il fastidio che diventa minaccia

Potreste pensare, “Pat, sono solo registrazioni. Non è il caso di farne un dramma, vero? Eliminali e passa oltre.” E per un certo periodo, questo era esattamente il mio ragionamento. Ho impostato un cron job per eliminare gli account senza post dopo 24 ore. Problema risolto, giusto? Falso.

I bot si sono adattati. Hanno cominciato a fare un unico, innocuo, post. “Ciao!” oppure “Contento di essere qui.” Niente che attivasse i miei filtri anti-spam. Giusto abbastanza per evitare la purga degli account senza post. Ora avevo centinaia di account con un post inutile, che continuavano a ingombrare il mio database, necessitando ancora di una revisione manuale.

Non è solo un semplice fastidio. È un attacco sottile e insidioso. Ecco perché:

Esaurimento delle risorse: Ogni registrazione, ogni voce nel database, ogni piccolo post consuma risorse server. Per un piccolo sito come il mio, non è trascurabile. Se il volume aumenta, potrebbe portare a una degradazione delle prestazioni o persino a un diniego di servizio per gli utenti legittimi.
Inquinamento dei dati: Le mie tabelle utenti erano un disastro. Trovare utenti reali, analizzare l’attività, o anche solo eseguire il backup del database è diventato più faticoso.
Rischi per la reputazione: Se questi account iniziassero improvvisamente a fare spam o phishing, la reputazione del mio forum potrebbe risentirne. I motori di ricerca non apprezzano i siti associati ad attività dannose.
Predecessore a attacchi più importanti: Spesso, i bot di registrazione a basso sforzo sono un passo di riconoscimento. Testano le acque, identificano le debolezze e stabiliscono una base per attacchi più sofisticati successivamente, come il credential stuffing o anche il phishing mirato di utenti reali.
Rischi di Credential Stuffing e Account Takeover (ATO): Questo è il problema più grande. Se un bot registra un account, e un utente legittimo prova poi a registrarsi con lo stesso nome utente/email (o uno comune), l’operatore del bot ha ora un obiettivo potenziale per il credential stuffing se ha acquisito credenziali da una altra violazione. Può provare queste credenziali sul mio sito.

Quindi, ciò che era iniziato come un problema “meh, lo pulirò più tardi” si è rapidamente trasformato in una situazione “deve fermarsi ora”.

I miei primi (falliti) tentativi: La trappola CAPTCHA

La mia reazione iniziale, come molti, è stata quella di inserire un CAPTCHA. Specificamente, reCAPTCHA v2. Tutti conoscono reCAPTCHA, giusto? La casella da spuntare “Non sono un robot”, forse alcuni segnali stradali sfocati.

Lo ho implementato. Per circa tre giorni, le registrazioni sono scese a quasi zero. Mi sono dato una pacca sulla spalla. “Aha! Risolto!”

Poi, sono tornati. Non tanto, ma abbastanza. Come? Beh, per reCAPTCHA v2, ci sono servizi che pagano umani pochi centesimi per risolvere i CAPTCHA. Oppure, sempre di più, i modelli di IA stanno diventando sufficientemente bravi da decifrarli, specialmente quelli più semplici. È un gioco del gatto e del topo, e su un sito a basso traffico, non valeva il costo di reCAPTCHA v3 (che può diventare un incubo da sistemare senza che utenti legittimi vengano flaggati).

Inoltre, gli utenti legittimi odiano i CAPTCHA. Ho ricevuto alcune lamentele. Il mio pubblico appassionato di informatica retro, Dio li benedica, non è sempre il più paziente con i fastidi del web moderno. Avevo bisogno di qualcosa di meno invasivo, più efficace contro i bot, e meno noioso per gli umani.

Oltre la casella da spuntare: Difese pratiche

Dopo aver abbandonato il CAPTCHA visibile, ho iniziato a riflettere su cosa faccia di un umano un umano, e di un bot un bot, oltre al semplice cliccare su una casella. Ecco cosa ha davvero funzionato per me:

1. Il campo Honeypot

È un classico per una ragione. È semplice, efficace e completamente invisibile per gli utenti umani. L’idea è quella di aggiungere un campo extra, nascosto, al tuo modulo di registrazione. I bot, essendo meno sofisticati degli umani, cercheranno spesso di compilare ogni campo che trovano. Gli umani non lo vedranno, quindi non lo compileranno.

Ecco un esempio semplificato di ciò che ho aggiunto al mio modulo di registrazione HTML:


<form action="/register" method="POST">
 <label for="username">Nome utente:</label>
 <input type="text" id="username" name="username" required>
 
 <label for="email">Email:</label>
 <input type="email" id="email" name="email" required>
 
 <!-- Campo Honeypot -->
 <div style="display:none;">
 <label for="fax_number">Numero di fax (lasciare vuoto):</label>
 <input type="text" id="fax_number" name="fax_number" tabindex="-1" autocomplete="off">
 </div>
 
 <label for="password">Password:</label>
 <input type="password" id="password" name="password" required>
 
 <button type="submit">Registrati</button>
</form>

E dal lato server (usando un esempio Python/Flask, ma la logica si applica universalmente):


@app.route('/register', methods=['POST'])
def register():
 # Verificare il campo honeypot
 if request.form.get('fax_number'):
 # Bot rilevato! Registralo, blocca forse l'IP, e restituisci un errore
 print(f"Honeypot attivato dall'IP: {request.remote_addr}")
 return "Registrazione fallita. Per favore riprova.", 400 # Oppure un messaggio di successo generico per confondere i bot
 
 username = request.form.get('username')
 email = request.form.get('email')
 password = request.form.get('password')
 
 # ... resto della tua logica di registrazione ...
 
 return "Registrazione avvenuta con successo!"

Il display:none; lo rende invisibile. tabindex="-1" impedisce la navigazione da tastiera verso di esso. autocomplete="off" aiuta a impedire che i browser lo compilino automaticamente. Ho scelto “fax_number” perché è un campo vecchio che non ha posto in un modulo di registrazione moderno, il che lo rende un buon “esca”.

2. Analisi basata sul tempo (verifica del timestamp)

I bot inviano spesso moduli incredibilmente rapidamente. Gli umani impiegano almeno alcuni secondi a compilare anche un semplice modulo. Registro il tempo di caricamento del modulo e il tempo di invio.

Quando il modulo di registrazione viene servito:


<form action="/register" method="POST">
 <!-- Altri campi del modulo -->
 <input type="hidden" name="form_load_time" value="{{ current_timestamp_in_seconds }}">
 <button type="submit">Registrati</button>
</form>

Dal lato server:


import time

@app.route('/register', methods=['POST'])
def register():
 form_load_time = int(request.form.get('form_load_time', 0))
 submission_time = int(time.time())
 
 time_taken = submission_time - form_load_time
 
 # Se il modulo è stato inviato troppo rapidamente (ad esempio, meno di 5 secondi)
 if time_taken < 5: 
 print(f"Invio troppo rapido dall'IP: {request.remote_addr}, ci ha messo {time_taken}s")
 return "Registrazione fallita. Riprova.", 400
 
 # ... resto della tua logica di registrazione ...
 
 return "Registrazione avvenuta con successo!"

Ho optato per un minimo di 5 secondi. Questo ha immediatamente catturato una buona parte dei bot rimasti. Attenzione a non impostare questa soglia troppo alta, poiché utenti autentici potrebbero digitare velocemente o avere moduli precompilati.

3. Limitazione del traffico per IP (con un tocco)

La limitazione standard del traffico IP è buona: “Non più di 5 registrazioni da questo IP all’ora.” Ma i bot usano spesso proxy o cambiano gli IP. Quindi, ho aggiunto un tocco: impronta IP e User-Agent.

Ho iniziato a registrare la stringa User-Agent con l’indirizzo IP. Se notavo un’improvvisa impennata delle registrazioni provenienti da diversi IP ma con la stessa stringa User-Agent, leggermente insolita, era un forte indicatore di un botnet o di un singolo bot che faceva girare gli IP. Questo mi ha permesso di bloccare temporaneamente o segnalare non solo l’IP, ma anche lo User-Agent se risultava chiaramente non-browser o ripetuto in modo sospetto.

Non si tratta di un estratto di codice che puoi semplicemente inserire, poiché richiede un certo registrazione e analisi lato backend. Ma concettualmente, si tratta di esaminare i modelli oltre l’IP sorgente. Molti firewall per applicazioni web (WAF) offrono questo tipo di limitazione avanzata del traffico e rilevamento delle anomalie.

4. Verifica del dominio email (utilizzando dati pubblici)

Molte registrazioni di bot provengono da domini email appena registrati, spesso usa e getta. Ho implementato una verifica contro un piccolo elenco selezionato di fornitori di email usa e getta noti, ma più efficacemente, ho iniziato a controllare l’età del dominio email stesso.

Esistono APIs (alcune a pagamento, altre gratuite con limiti) che possono dirti quando un dominio è stato registrato. Se un indirizzo email proviene da un dominio registrato negli ultimi 30 giorni, è un enorme segnale di allerta. Non è infallibile – nuovi siti legittimi vengono lanciati continuamente – ma combinato con altri segnali, è potente.

Per il mio forum, ho preso una decisione pragmatica: se il dominio aveva meno di 60 giorni E se erano presenti altri segnali di bot (honeypot attivato, invio troppo rapido), bloccerei direttamente la registrazione. Per i domini di meno di 30 giorni, li segnalerei per una revisione manuale e richiederei potenzialmente una conferma via email prima dell’attivazione.

I Risultati: La Pace (Quasi) Ripristinata

L’implementazione di questi passaggi non è stata una soluzione istantanea, ma è stata incredibilmente efficace. L’honeypot e le verifiche basate sul tempo hanno immediatamente ridotto la maggior parte delle registrazioni automatizzate. L’analisi dei modelli di IP/User-Agent mi ha aiutato a identificare e bloccare gli operatori di bot più persistenti.

Il mio database utenti è di nuovo pulito. I miei log di server sono meno rumorosi. E posso concentrarmi sulla moderazione delle discussioni sulla superiorità del chipset SID del Commodore 64, invece di eliminare centinaia di falsi account.

È importante capire che non si tratta di una soluzione “da impostare e dimenticare”. I bot si evolvono. Gli aggressori trovano nuovi metodi. Dovrò monitorare e adattarmi. Ma per ora, questi metodi pratici e a basso costo mi hanno restituito il controllo del mio piccolo angolo di internet.

Punti da Ricordare

Se ti trovi di fronte a registrazioni di bot poco impegnative o a disturbi automatizzati simili, ecco cosa dovresti fare subito:

Implementa un Honeypot: È incredibilmente semplice, efficace e invisibile per gli utenti. Vai!
Aggiungi una Verifica Temporale: Misura il tempo tra il caricamento del modulo e l’invio. Blocca le submission che sono anormalmente veloci.
Vai oltre il Semplice Blocco di IP: Cerca modelli nelle stringhe User-Agent, nei riferimenti e in altre intestazioni di richiesta per identificare bot sofisticati che cambiano IP. Considera un WAF se il tuo traffico lo giustifica.
Valida i Domini delle Email: Controlla i fornitori di email usa e getta noti e considera l’età del dominio per le nuove registrazioni.
Monitora e Adatta: I bot si evolvono sempre. Tieni d’occhio i tuoi log, analizza le attività sospette e sii pronto ad adattare le tue difese.
Non Disturbare gli Utenti Reali: Dai priorità all’esperienza utente. Evita CAPTCHAs troppo restrittivi o regole eccessivamente rigide che potrebbero bloccare registrazioni legittime. La migliore difesa contro i bot è quella che gli esseri umani nemmeno notano.

Stai attento là fuori, e tieni lontani questi bot!

Sto combattendo contro dei bot sul mio forum di retro-informatica.

Il fastidio che diventa minaccia

I miei primi (falliti) tentativi: La trappola CAPTCHA

Oltre la casella da spuntare: Difese pratiche

1. Il campo Honeypot

2. Analisi basata sul tempo (verifica del timestamp)

3. Limitazione del traffico per IP (con un tocco)

4. Verifica del dominio email (utilizzando dati pubblici)

I Risultati: La Pace (Quasi) Ripristinata

Punti da Ricordare

Articoli Correlati

Related Articles

Il fastidio che diventa minaccia

I miei primi (falliti) tentativi: La trappola CAPTCHA

Oltre la casella da spuntare: Difese pratiche

1. Il campo Honeypot

2. Analisi basata sul tempo (verifica del timestamp)

3. Limitazione del traffico per IP (con un tocco)

4. Verifica del dominio email (utilizzando dati pubblici)

I Risultati: La Pace (Quasi) Ripristinata

Punti da Ricordare

Articoli Correlati

You May Also Like

📚 You Might Also Like

Related Articles