Des del dimecres 10 de juny, per la vesprada, hem experimentat problemes a l'equipament que ens done connexió redundant a Internet. El divendres dia 12 de juny es va posar en marxa el pla de contingència, el cual implica la substitució de l'esmentat equipament i la connexió cap a Internet amb una sola línia (RedIRIS).
Des del cap de setmana ens trobem en procés d'anàlisi per tal d'esbrinar quin és el problema. Una vegada identificat, passarem a la substitució o reconfiguració del equipament, per tal de restablir la connexió redundant cap a la xarxa.
Pèrdues intermitents d'accés a Internet
El dimecres 10 de juny de 2009, des de les 17:10 hores, laccés a Internet va sofrir pèrdues intermitents de tràfic HTTP, aparentment degudes a un funcionament incorrecte del RAD LinkProof 1000 màster (RR0). Laltre (esclau, TD0), inexplicablement, no va entrar automàticament en servei i el dijous 11 de juny de 2009 a les 9:00 hores, va ser parat.
Es va parar el segon accés a Internet (xarxa de Cableuropa, S.A.U. (ONO)) i es va haver de parar i encendre (dijous 11 de juny de 2009 a les 10:05 hores) el màster perquè funciones de nou (encara que de forma degradada).
A les 11h es va sospitar del antivirus que aplica el Fortinet Fortigate 3600 i en parar-lo tot va començar a funcionar millor. No obstant, a les 14:00 hores el màster va deixar de funcionar; es va recuperar el servei a les 15:00 hores en arrancar lesclau, mantenint laccés a la xarxa dONO baixat.
Els tècnics de Fujitsu primer i RADware posteriorment, van estar treballant en els equips.
Finalment, a les 14:00 hores, una maniobra daquest últim va deixar lesclau fora de servei, sent necessari dur a terme una maniobra, contemplada en el pla de contingència, per deixar leixida a Internet sols a través de RedIRIS.
No obstant, això significava que, degut a la persistència dels DNS (TTL 6h), els usuaris externs que no feren servir el DNS de la Universitat Jaume I (150.128.98.10) podrien experimentar problemes per accedir als servidors de lUJI; de fet això va ser el que va ocórrer i el servei no va començar a normalitzar-se, en les xarxes dels diferents ISP, fins a les 21:35 hores; a les 04:45 hores del dissabte ja estava normalitzat.
A falta de muntar una maqueta per a reproduir el problema, tot apunta a un problema en els Fortinet Fortigate 3600, semblant al que es va sofrir el passat 28 de març de 2008 (problema en la funcionalitat de traffic shaping i es va haver de deshabilitar).
