Blog

Nova alarma de temperatura al CPD del D6

Avui hem tornat a patir una pujada de la temperatura del CPD del D6 per avaria de l'aire condicionat que refrigera la sala. Afortunadament el màxim de temperatura assolit (37.9 graus) no ha fet necessària l'aturada d'emergència dels diferents servidors, i hem pogut reduir la temperatura del CPD i normalitzar-la en el transcurs del matí després de que els tècnics de manteniment revisessin de nou la màquina d'aire condicionat del D6.

Sembla clar que l'aturada elèctrica programada a tot el campus el dia 11 d'agost ha espatllat quelcom de l'aire condicionat de l'edifici. La màquina havia funcionat sense cap incidència durant més d'un any fins l'esmentada aturada. A partir de llavors ja hem tingut quatre avaries: el mateix dia 12 d'agost, el dia 22, ahir i finalment avui mateix...

Avaria del SAI del D6

Com a conseqüència de l'alarma de temperatura d'ahir, un dels SAIs de l'edifici D6 s'ha avariat. Els tècnics ja han vingut a revisar-lo i confiem que ens facin arribar aviat un pressupost per a la reparació.

El SAI avariat està en bypass: això vol dir que deixa passar el corrent que li vé d'entrada, però que en cas de tall del subministrament, no proveirà corrent als equips que hi estiguin connectats. La majoria d'equips criítics del CPD ja tenen redundada l'alimentació elèctrica cap a ambdós SAIs de l'edifici.

En cas de tall del subministrament elèctric, a més de molts dels equips del CPD, també es veurien afectades totes les preses de corrent estabilitzada de l'edifici D6, que són alimentades precisament pel SAI avariat.

Problemes de temperatura al CPD del D6

Aquest diumenge dia 4 s'han tornat a produir problemes de refrigeració a la sala de màquines del D6. La temperatura màxima enregistrada ha estat de 46.2 graus a les 17:10h. Arribats a aquest punt el sistema ha iniciat una aturada d'emergència de la majoria de serveis no crítics, cPanel i clusters inclosos, per tal de reduir el risc d'avaries hardware. També ha estat aturat el servidor de correu d'entrada. Tots els correus entrants han estat redirigits cap al servidor de correu de continuïtat.

A les 9:30h d'avui dilluns dia 5 la majoria de serveis ja han estat posats en marxa, i tots els correus entrants que ja han estat entregats al servidor de correu habitual. Falta el servei de cPanel, els clusters i alguns servidors secundaris no crítics (brull i grau) que no han arrencat correctament.

Hem creat una incidència a manteniment per a tractar d'aclarir per què la temperatura de la sala de màquines ha pujat d'aquesta manera. Presumiblement es tractarà d'un problema amb l'aire condicionat, que està fallant força sovint darrerament coincidint amb l'aturada elèctrica de tot el campus del mes d'agost.

* Actualització 10:15h: cPanel ha estat posat en marxa.

* Actualització 10:55h: Tots els serveis en funcionament.

Actualización de BSCW

Hoy hemos actualizado la versión de BSCW y pasamos a tener la última disponible (BSCW 4.5.5).

Al integrarse en el nuevo sistema web, el URL oficial del servicio cambia a: http://www.ac.upc.edu/app/bscw (durante un tiempo habrá una redirección, pero es conveniente que actualicéis vuestro bookmark si lo usáis).

Con el nuevo URL ya no pasamos por el proxy antiguo que reescribía el HTML y que hacía que a veces desde las redes externas el BSCW no funcionara lo bien que sería de esperar.

Nueva versión de Webmail

Hoy hemos puesto en marcha una nueva versión del servicio de acceso al correo vía Web:

  • Seguimos usando Webmail aunque con la versión de software actualizada
  • Ahora funciona en la nueva plataforma de ejecución en máquina virtual, monitorización, etc. Esto permite disminuir el tiempo sin servicio (por avería, actualizaciones, etc.).
  • Acceso a través del nuevo sistema de Web (tal como publicamos ayer).  El cambio visible es que el url siempre es "http://www.ac.upc.edu/app/webmail", aunque internamente el servicio lo ofrezca otro servidor.

El nou www ja està aquí

Portem un temps dissenyant el que serà el nou servei del gw, especialment pel que fa al seu paper respecte al web. En aquest sentit avui hem posat en producció el nou www. Si no heu notat cap canvi és perquè els canvis que s'han produït no són visibles. Però aquests canvis ens facilitaran la reorganització de l'espai d'adreces dels diferents serveis web institucionals sota el paraigua de www. A més a més, això també ens permetrà eliminar el pas pel gw per accedir a la intranet.

Altre cop problemes amb l'aire condicionat

Avui al matí s'ha tornat a produir un problema amb l'aire condicionat del centre de càlcul del D6 i la temperatura ha tornat a pujar per sobre dels 40 graus. Com a conseqüència hem hagut d'aturar els clústers i ventilar la sala fins que els tècnics de manteniment han pogut tornar a posar en marxa la refrigeració.

 

Ara mateix la sala s'està refredant i en pic haguem pogut comprovar que l'aire condicionat no s'atura i la temperatura baixa raonablement, tornarem a posar en marxa els clústers.

 

Actualització [13:45]: hem posat en marxa de nou els clústers, trets dels nodes més nous de salvat, que encendrem demà.

Actualització del disc centralitzat

Aquest matí hem dut a terme una actualització del programari de gestió del disc centralitzat. L'actuació comprenia realment dues actualitzacions tant de software com de firmware de cadascun dels nodes del disc centralitzat, i ha tardat unes 5 hores en completar-se.

Afortunadament, gràcies a la configuració en cluster d'alta disponibiitat del sistema de disc centralitzat, l'actuació ha pogut efectuar-se sense interrupció del servei.

Aturada per problemes aire condicionat 12/08/2011

Aquest matí al arribar ens hem trobat que la sala de màquines del D6 estava amb un temperatura superior als 40 graus en alguns punts, fet que havia provocat l'aturada automàtica dels serveis no crítics:

 

   * Clusters

   * Servidors de NFS, SMB, impressores, etc

El problema havia estat que amb l'aturada programada d'ahir dijous, el sensor de temperatura de l'aire condicionat s'havia espatllat. Els tècnics han vingut ràpidament a reparar-ho i a les 9:00 ja tornaven a estar en marxa tots els serveis excepte els clusters, que estem esperant que la sala agafi un llindar de temperatura adeqüat.

 

Actualització 11:00: Els clusters ferrer i salvat tornen a estar operatius.

Nou servidor de Windows

Hem posat en marxa un nou servidor de windows anomentat 'amargos'. Les característiques del mateix són:

   * S.O: Windows Server 2008 R2

   * Memòria 4GB

   * 200GB de disc.

   * 100MB de quota d'usuari.

   * Darreres versions dels paquets ofimàtics.

El servidor està en fase de proves ara mateix i podeu accedir a ell igual que ho feu a Robert o Sindreu.

Un cop finalitzada la fase de proves després de l'estiu, procedirem a actualitzar el servidor Robert per a que tingui les mateixes característiques que el nou servidor 'amargos'.

Reboot del servidor de continuïtat

El proper dimecres dia 20 de juliol de 10 a 11h reiniciarem el servidor de continuïtat de correu i disc per a fer efectives unes actualitzacions instal·lades recentment, i també per a resoldre una incidència que hi ha actualment amb el mòdul de gestió remota.

Manteniment de la Intranet

El proper dijous dia 14 de juliol realitzarem un manteniment software del servidor que allotja la intranet institucional. L'actuació començarà a les 8:00h. La intranet estarà completament aturada fins a les 10:00h. A partir de les 10:00h i fins a les 14:00h anirem restablint el funcionament de cadascuna de les aplicacions allotjades.

Aquest és el llistat d'aplicacions que es veuran afectades:

  • Usuari únic
  • Signatura electrònica
  • Gestió docent
  • Reports de recerca
  • Gestió bibliogràfica
  • Viatges
  • Pantalles informatives
  • Inventari
  • Repositori de documentació d'Usuari únic
  • Repositori de documentació de l'Equip directiu
  • Reserves de sales i recursos
  • Permisos del PAS

Reboot del servidor sites (cPanel)

El proper dimecres 6 de juliol a les 08:00, procedirem a realitzar un reboot del servidor sites per tal de completar l'actualització d'alguns paquets bàsics del sistema. L'aturada durarà aproximadament 15 minuts i els serveis afectats seran els següents:

  • Pàgines personals
  • Zones web de recerca i docència
  • Tots els serveis associats al cPanel

Salut i dispenseu les molèsties,

Serveis TIC

Nou servidor de SAMBA

El dilluns 4 de juliol es procedeix a actualitzar el servidor de samba. La nova versió és la 3.4.7 i s'executarà en un servidor totalment renovat.

El canvi es realitzarà entre les 8:00 i les 9:00 i en principi serà totalment transparent i no s'hauria de notar cap tall en el servei.

És convenient recordar, que tots els usuaris s'han de connectar a samba indicant que el servidor és: smbserver.ac.upc.es. Si teniu posat un altre nom o una IP, fora convenient canviar-lo per evitar errors una vegada s'aturi el servidor antic.

Condicionament acústic i de seguretat de la nevera del D6

La setmana passada es van realitzar treballs de condicionament acústic i de
seguretat a la sala de servidors de l'edifici D6.

Les millores incloen noves portes més aïllants, robustes i segures i la
instal·lació de nous vidres, sense retirar els que ja hi han col·locats.

En aquestes fotos s'aprecien les novetats:

Portes noves al D6-S101

 

Nous vidres al D6-S101 - Detall

Ampliació de l'autonomia del nou sai del D6

Avui s'ha realitzat una ampliació al SAI nou de l'edifici D6 per tal de doblar la seva autonomia (a igual càrrega de treball).

El resultat és un nou armari que, tot i ser més petit que l'anterior, conté les mateixes bateries, tal i com s'aprecia en aquesta imatge:

Ampliació de l'autonomia del SAI D6-2

Nou servidor d'impressió

S'ha actualitzat el servidor d'impressió, passant de la versió cups-1.3.4 a cups-1.4.3. Podeu veure els detalls dels canvis que implica aquesta versió al site oficial de CUPS:

   http://www.cups.org/documentation.php/doc-1.4/whatsnew.html

També s'ha canviat de màquina a la que s'executava, executant-se ara en una màquina exclusiva de serveis on no tenen accés els usuaris, de forma que s'evita que problemes d'una execució d'un usuari afectin a un servei del departament.

 

Actualització: El servidor antic estarà actiu encara fins el dilluns 3/7/2011 per si algun usuari feia servir la IP o nom de l'antic serivdor, enlloc del nom genèric: printserver.ac.upc.es

reboot del servidor ribot1 (ftp, code i webmail)

Demà dijous 16 de juny a les 08:00, procedirem a realitzar el reboot del servidor ribot1 per tal de poder ampliar el disc on estan hostatjats els projectes del servei code. L'aturada durarà aproximadament 15 minuts i els serveis afectats seran els següents:

  • FTP
  • Webmail (Horde/IMP)
  • Code: Hostatgeria de projectes (Trac/SVN/Hg/Git)

Actualització [08:10]: disc ampliat, ampliant filesystem...

Actualització [08:16]: filesystem ampliat, serveis disponibles, acaba l'actuació.

Parada d'Usuari Únic

El proper dimarts 14/6/2011, de 8:00 a 9:30, es produirà una aturada de l'aplicatiu d'Usuari Únic, per tal

d'efectuar un canvi de servidor.

 

Aquesta aturada afectarà a l'aplicatiu web així com a totes les aplicacions/serveis que en depenen, com per

exemple signatura electrònica, quies, etc.

Reboot del servidor ribot4 (webera.e)

Per tal de completar l'actualització de diversos paquets del sistema al servidor ribot6 (webera.e) el proper dijous procedirem a realitzar un reboot a les 08:00. L'aturada no hauria de durar més de 15  minuts.

Les zones web afectades són les següents:

  • arco
  • cpd
  • dmag
  • dsg
  • jcsd2010
  • pan-vg
  • seecs
  • wikiapc

Els responsables de les zones web han estats notificats per correu de l'actuació.

Actualització [08:10]: el reboot s'ha efectuat correctament i tots els serveis tornen a funcionar.

Actualització del servidor Robert

El servidor de WinCenter de nom "Robert" feia alguns dies que anava molt lent. Avui, després d'alguns problemes, s'ha actualitzat el sistema i alguns programes i s'ha reiniciat, cosa que ha ajudat a rebaixar la càrrega de treball i a alliberar memòria correctament. Ara el servidor funciona més fluïd. Hem reiniciat el servidor cap a les 15:30 hores i ha trigat uns minuts en tornar a estar operatiu. Tots els usuaris que restaven connectats han estat avisats i han pogut tancar la sessió corresponent.

Manteniment a la sala del SAI del D6

El proper dia 25 de maig a les 15h tindrà lloc una actuació de manteniment a la sala del SAI del D6. Es desplaçaran uns quadres elèctrics i també un component del deshumidificador de la sala per a fer espai per al mòdul d'ampliació de bateries del nou SAI, el qual s'instal·larà properament.

L'actuació no comporta tall del subministrament elèctric, per la qual cosa el no hi haurà interrupció del servei. L'actuació finalitzarà a les 17h.

Reboot del servidor sites (cPanel)

Demà dimecres 4 de maig a les 08:00, procedirem a realitzar un reboot del servidor sites per tal de completar l'actualització d'alguns paquets bàsics del sistema. L'aturada durarà aproximadament 15 minuts i els serveis afectats seran els següents:

  • Pàgines personals
  • Zones web de recerca i docència
  • Tots els serveis associats al cPanel

Salut i dispenseu les molèsties,

Serveis TIC

 

Actualització [4 maig 08:05]: el reboot s'ha completat correctament.

Reorganització dels rangs d'IPs externes

Aprofitant l'aturada programada d'ahir, vam completar el procés de reorganització dels rangs d'adreces IP de la xarxa externa (fora del firewall departamental). El resultat final és que el nombre d'adreces IP dinàmiques s'ha vist incrementat notablement.

Confiem en què, a partir d'ara, sigui força més difícil arribar al límit de IPs dinàmiques concedides en un moment determinat, com ha succeït en algunes ocasions recentment.

Us recordem que la configuració de xarxa recomanada per als vostres equips és que useu assignació automàtica d'adreça IP mitjançant DHCP, independentment de què tingueu assignada una IP fixa o no; el servidor ja s'encarregarà d'atorgar-vos la vostra adreça reservada, si s'escau. Us recordem també la necessitat d'enregistrar convenientment els vostres equips a la xarxa.

Interrupción del suministro eléctrico en el D6 (20 de Abril)

Hace unos meses mantenimiento de Campus detectó una avería en la acometida eléctrica del edificio D6. En concreto,el cable neutro estaba dañado.

El miércoles día 20 de Abril se realizará la reparación de esta avería, por lo cual durante unas horas el edificio no dispondrá de suministro eléctrico. Esto afectará a todos los servicios TIC del DAC (incluído red del C6).

Aprovecharemos la parada para realizar una pequeña mejora en la instalación eléctrica del CPD del D6. Esta mejora permitirá que el rack donde están instaladas las máquinas de servicios puedan alimentarse de los dos SAIs simultáneamente.

Actualitzación: La actuación eléctrica se realizará entre las 10:00 y las 13:00 por lo que el horario de actuaciones será el siguiente:

  •  8:00: Inicio parada de servidores y comunicaciones
  • 10:00: Inicio de la reparación
  • 13:00: Finalización de la reparación (conexión de la electricidad en el edificio)
  • 13:00: Inicio pequeña instalación en CPD
  • 13:01: Inicio puesta en marcha de los servidores y comunicaciones
  • 15:00: Todos los servicios disponibles

Documentación de los Servicios TIC

Desde el viernes (18 de marzo) está disponible la nueva versión de la documentación de los Servicios TIC del DAC. Los cambios más destacados son:

  • El web principal se encuentra el la red externa de forma que es más fácilmente accesible
  • Utilizamos la misma plantilla que el Web del DAC por lo que ahora tiene el mismo aspecto corporativo
  • El blog tiene RSS y al estar en la red externa puede leerse con cualquier lector
  • Modificación de algunas páginas para mejorar la usabilidad

Afegint nodes al cluster salvat

Han arribat 40 nodes nous per incrementar la potència de càlcul del cluster del DAC. Actualment hem treballat per a poder integrar els nous nodes al cluster salvat, amb el mateix sistema, de forma que en breu veureu que el número de nodes va incrementant-se. En uns mesos, està prevista la resintal·lació total, tant dels nodes nous com dels vells per un sistema actualitzat. Actualització 17/11/2010: Ja hi han operatius 20 dels 40 nodes. Els detalls els teniu a http://www.ac.upc.edu/lcac/i/wiki/Clusters/Users/salvat Actualització 19/11/2010: S'han afegit 10 nodes més al cluster, pel que ja hi han operatius 30 dels 40 nodes. Actualització 22/11/2010: Ja estan operatius els 40 nodes nous. La integració amb el cluster salvat està finalitzada. El proper any està previst que es faci l'actualització del sistema dels nodes a una versió actual de tot el software.

Continuitat de disc

S'ha posat en marxa el servei de continuitat de disc que permet accedir a les dades del compte personal en cas d'un problema (tall de corrent, avaria, etc) amb el disc principal.

Les dades es sincronitzen diariament, pel que pot haver un desfase de fins a 24 hores entre les dades reals i la réplica que s'emmagatzema encriptada a un servidor situat a l'edifici Omega de la UPC.

Es poden recuperar les dades mitjançant scp/sftp accedint al servidor disc-dac.upc.edu, fent servir el username i contrasenya habituals del DAC. Ex:

     sftp user@disc-dac.upc.edu

Teniu més detalls a: http://www.ac.upc.edu/lcac/i/wiki/Continuitat/Disc/Usuaris/InstruccionsUs

Impressora c6p2b en servei provisionalment

La impressora de la segona planta de l'edifici C6 (c6p2b) ha estat substituïda per una impressora del mateix model que hi havia en unes altres dependències del departament. Les cues d'impressió respectives ja tornen a ser operatives de nou.

Desafortunadament, la qualitat d'impressió de la mateixa no és òptima, així que us recomanem que no hi llenceu treballs que hagin de tenir una alta qualitat de presentació, però almenys servirà per a mitigar l'impacte que suposa estar tants dies sense la impressora de planta.

Per utilitzar aquesta impressora des del servidor de Windows de nom "robert" caldrà afegir-la manualment, degut a un problema pel qual de moment no s'ha trobat una solució.

Us anirem informant de l'evolució de la incidència.

Actualització 16/12/2010: La qualitat d'impressió ja és òptima. Ja es pot fer servir normalment.

 

Actualització del disc centralitzat

El proper dilluns dia 17 de gener a les 8:00h durem a terme l'actualització del firmware del disc centralitzat, deixant-lo amb la darrera versió disponible del programari. La durada prevista per a l'actuació és d'1:30h, i podrà dur-se a terme sense interrupció del servei. És possible que durant aquest temps es produeixin petits talls de connectivitat amb el disc centralitzat d'uns 30 segons de durada.

Actualització 17/1, 8:00h: Comencem l'actuació.

Actualització 17/1, 8:55h: El servidor d'imatges i boot dels terminals ha caigut (hervas). Ha calgut reiniciar-lo i afinar els timeouts de connexió amb el disc centralitzat.

Actualització 17/1, 9:25h: Ha finalitzat l'actualització del firmware. Els clients NFS bosch, fabre i planas han reportat algun missatge d'error que podria tenir a veure amb l'actualització. Aquests clients NFS corren versions obsoletes del sistema operatiu.

Actualització 17/1, 9:30h: El problema de planas ha estat solventat remuntant els filesystems remots.

Actualització 17/1, 9:50h: Ha estat necessari rebootar bosch i fabre per a remuntar correctament els filesystems remots. fabre ha tardat 5 minuts, però bosch s'ha demorat més degut ha que feia molts dies que no es reiniciava i ha calgut comprovar la integritat dels seus discs locals.

Actualització 17/1, 9:55h: Tots els serveis funcionen amb normalitat.