Bun un CloudFlare la casa omului. Serviciile gratuite sunt suficient de generoase încât să acopere o diversitate de nevoi, nu doar CDN și edge caching cât și cloud storage pentru atașamente la forum, de exemplu. Dar serviciul de traffic proxying și protecție la abuzuri este minunat, în primul rând fiindcă oferă vizibilitate și interpretare pentru datele de trafic care altfel ar fi rămas îngropate ca adrese IP random în niște fișiere log, în al doilea rând că oferă și uneltele prin care să filtrezi traficul nedorit.
Știam că conținutul forumului este consumat de web scrapers pentru a-și face training la AI language models? Nu știam, și cam am o problemă cu asta, că nu-i un search engine de la care să avem vreun beneficiu indirect. CloudFlare oferă un filtru care să-i blocheze automat, țac pac adio.
Știam că e plin netul de boți care încearcă să abuzeze de vulnerabilități software și să facă takeover la un domeniu ca să trimită spam? Da, știam, și singura protecție pe care o aveam era să am abonament de suport activ cu care să pot descărca imediat orice versiune mai nouă de forum sau plugin sau altceva care peticește ceva vulnerabilități anterioare. Mai aveam și un plugin StopForumSpam care folosește o bază de date centralizată actualizată în timp real pentru a identifica spam boții pe forum, însă doar la nivel reactiv pentru a cere validarea lor manuală după ce își înregistrează cont pe forum. Dar prin CloudFlare pot filtra direct de la nivel de acces aceste surse de trafic, ca nici măcar să nu mai poată accesa forumul.
Știam că traficul uman pe forum este minoritar? Nu știam, dar acum am aflat câte mii de conexiuni pe oră vin dinspre cloud provideri și datacentere vs. câteva sute pe zi dinspre forumiști. Și cam râcâie curiozitatea și întrebarea de ce încearcă Alibaba cloud să indexeze la rând profilele userilor de pe forum, sau de ce Singapore este a 3-a sursă de accesări ale forumului, sau de ce niște mașini virtuale de la un datacenter din rusia au subit o obsesie cu topicul Internet Zapp Prepaid din 2012, sau de ce ar trebui să permit accesul la diverși SEO crawlers care nu respectă directivele explicite de acces din robots.txt și apoi fac un întreg business din datele colectate. Și majoritatea încercărilor de abuz vin prin TOR (pus filtru în CloudFlare care acoperă toate gateway-urile TOR din lume) și prin VPN provideri (pus filtru în CloudFlare pentru ASN-urile diverselor datacentere și cloud provideri, care în 2 zile a ajuns la 33 ASN-uri și deci sute de subneturi). Forumul e pentru oameni, nu pentru boți și servere.
Au trecut vremurile când a ține un forum pe un hosting chior și complet expus la internet era echivalentul statului cu pantalonii în vine. Acuma e ca și când ai avea doar o frunzuliță legată cu sfoară...
Exemplu de azi dimineață: