Vés al contingut (premeu Retorn)

Sou a: Inici / Nosaltres / Serveis TIC / Blog

Blog

Servidor de VPN averiado

El viernes dejó de prestar servicio de forma definitiva y no controlada el servidor principal de VPN.

 

Para aquellos que estan teniendo problemas de conexión recomendamos bajarse la última versión del fichero de configuración . Esta incluye el servidor secundario que se puso ya hace tiempo.

 

Actualmente se está trabajando para virtualizar el servidor principal. Pedimos disculpas por las molestias que este incidente puede haber causado.

 

[ Actualización ] Mañana martes a las 08:00h se procederá a rebotar la máquina que ofrece el servicio de las páginas web para poder solucionar el problema sucedido con el servidor principal de VPN. Se prevé que la actuación dure apróximadamente unos 5 minutos.


Impressora c6p1g retirada (sala C6-124)

A la sala C6-124 hi han dues impressores, la multifunció c6p1f (de la marca Ricoh) i la impressora en blanc i negre c6p1g (de la marca Kyocera).

 

Aquesta última impressora ha estat retirada amb caràcter definitiu degut a una avaria que s'ha decidit no reparar.

 

Les cues d'aquesta impressora han estat esborrades i ja no estan disponibles. Qui la tingui instal·lada ha d'eliminar-la manualment del seu sistema operatiu per a evitar errors.

Canvi de switch als servidors crítics

Demà dimecres 23 a les 08:00 procedirem a canviar la connexió dels servidors crítics al switch principal del router, que disposa de font d'alimentació redundada. Els servidors següents poden patir petits talls de connexió però haurien de recuperar-se immediatament sense que arribi a afectar el servei:

  • gaudi: DNS, DHCP, VLAN
  • sert: SMTP extern
  • roura: SMTP intern
  • thos: IMAP, POP
  • gw: Web SSO, SSH, SMTS, IMAPS, POPS

Actualització [08:15]: El canvi de switch s'ha realitzat sense cap problema.

Actualización gestor de tareas de Administración del DAC

Se ha realizado la migración/actualización del servicio de 'request-tracker' de administración.

 

El servicio se hospeda ahora en la máquina intranet-1, que es una máquina virtualizada, con los beneficios

que ello proporciona.

 

En cuanto a la actualización del software, se pasa de la versión 3.6.1 a la 3.8.7, que corrige multitud de bugs

y que ofrece un layout pensado para pantallas panorámicas.

 

La nueva URL del gestor de tareas de administración es la siguiente: https://www.ac.upc.edu/app/rt-admac

 

Por favor, notificar cualquier problema que os surja a: suport.tic@ac.upc.edu

Reboot del servidor "recursos"

Demà divendres dia 18 de novembre a les 8:00h rebootarem el servidor "recursos" per a fer efectives les darreres actualitzacions instal·lades recentment.

L'aturada durarà aproximadament 10 minuts i els serveis afectats seran els següents:

  • Samba per a impressions.
  • Samba per a unitats de xarxa.
  • Qualsevol tipus d'impressions.

Nou servei de webmail

El servei de webmail ha estat renovat amb millores significatives envers la versió actual, tals com:

  • l'ús de preferències personalitzades
  • la integració d'una eina gràfica per a la gestió dels filtres de correu

Teniu els detalls sobre el nou servei a https://www.ac.upc.edu/app/wiki/serveis-tic/Correu/Webmail

El nou servei és accessible en període de proves a http://intranet.ac.upc.edu/horde3

El servei actual romandrà accessible a http://www.ac.upc.edu/app/webmail fins el proper dijous dia 5 de març a les 8:30h. A partir d'aquest moment, l'enllaç oficial del servei serà actualitzat cap el nou programari.

*** Actualització 4/3/2009 17h: Per dificultats tècniques, demà al matí no farem el canvi de l'enllaç oficial al servei de webmail. El període de proves s'estén fins a nou avís.

Reboot del servidor "xarxes-1"

El proper dimecres dia 16 de novembre a les 8:00h rebootarem el servidor "xarxes-1" per a fer efectives les darreres actualitzacions instal·lades recentment. L'actuació durarà uns 10 minuts.

Aquest servidor serà, en un futur immediat, el que concentrarà la majoria de serveis bàsics de xarxa. Actualment però únicament ofereix el servei d'autenticació de MACs a la xarxa ethernet. Per aquest motiu, durant el temps en què duri l'actuació, els equips que siguin connectats a la xarxa en aquell precís instant no podran ser autenticats, i per tant no tindran connectivitat. És important notar que això no afectarà als equips que ja hagin estat autenticats abans de l'actuació.

Fallada del servidor màquines virtuals "vm-users-3"

El servidor de màquines virtuals d'usuari vm-users-3 ha patit un malfuncionament software aquest dissabte i ha deixat de respondre. Les màquines virtuals hostatjades en aquest servidor també han quedat inaccessibles.

Ha estat necessari reiniciar el servidor per a reestablir el servei. Tots aquells de vosaltres que hi tingueu màquines virtuals hostatjades, sisplau connecteu-vos-hi per a verificar-ne el correcte funcionament, ja que les màquines virtuals no han estat aturades de forma ordenada. Si no hi podeu accedir, proveu a connectar-vos al servidor (vm-users-3) des de VMware vSphere Client, i a partir d'allí accediu a la consola de la vostra màquina. És possible que aquesta continuï apagada, o estigui donant un missatge de manteniment a la consola per al qual calguin privilegis d'administrador local.

Dijous 10 de novembre: reboot del servidor sites (cPanel/moodle)

El proper dijous 10 de novembre a les 8:00, procedirem a realitzar un reboot del servidor sites per tal de completar l'actualització d'alguns paquets bàsics del sistema.

L'aturada durarà aproximadament 25 minuts i els serveis afectats seran els següents:

  • Pàgines personals
  • Zones web de recerca i docència
  • Tots els serveis associats al cPanel
  • Moodles de docència

[Actualització 8:27] El servidor torna a estar operatiu amb les actualitzacions completades.

Actualització del servidor de bases de dades

El proper dilluns dia 31 d'octubre a les 8:00h durem a terme una actualització rutinària del programari del servidor intern de bases de dades. Com a conseqüència, les aplicacions que s'hi connecten no estaran disponibles durant el temps que duri l'actuació, que estimem en uns 15 minuts.

Aquestes són les aplicacions afectades:

  • Intranet institucional
  • Usuari Únic
  • Reserva de sales
  • Gestió docent
  • Gestió bibliogràfica
  • Gestió de tickets d'Administració
  • Gestió de contactes d'Administració

Reparació d'un dels dos SAI del C6

Aquesta setmana s'ha reparat un dels dos SAI que dóna servei a l'edifici C6
(veure foto al final d'aquest apunt).

El SAI en qüestió va deixar de funcionar completament a causa d'una avaria en
alguns components elèctrics, i ja els han substituït de manera satisfactòria.
Mentre no es va fer la reparació, l'altre SAI va absorbir sense problemes la
càrrega addicional del SAI avariat. Tot i que no hi van haver problemes, el
cert és que es va quedar fregant el llindar màxim de càrrega.

A hores d'ara ambdós SAI funcionen correctament i amb una càrrega equitativa.

SAI #2 C6 ja reparat.

Actualización del firmware de los switches (y II)

Tan solo faltan 4 switches para realizar el upgrade completo. Se trata de los switches que utilizan algunos de los servidores por lo que hemos preferido dejarlos para el martes día 11 a las 7:00 de la mañana.

En principio los servidores serán capaces de recuperar las conexiones en unos 5 minutos.

[Actualización 7:10]: Todos los servidores recuperados después del minicorte

Actualización del firmware de los switches

Con el fin de mejorar ciertos aspectos de la seguridad de nuestros switches del D6 y C6 estamos realizando una actualización de firmware en todos ellos. Entre otras cosas, añadiremos soporte Secure Shell al login de configuración.

Para que esta actualización tenga efecto reiniciaremos los switches de forma automática el lunes día 10 a las 7:00 de la mañana, por lo que durante 2 minutos se interrumpirá la red.

Normalmente, los PCs y servidores recuperan la conexión con normalidad transcurrido el reboot.

[Actualización 7:30] Todos los switches de acceso actualizados. El corte ha sido de unos dos minutos. El enlace C6-D6 ha reiniciado un poco más tarde (por diferencia en el reloj).

Actualización del firmware de los switches

Con el fin de mejorar ciertos aspectos de la seguridad de nuestros switches del D6 y C6 estamos realizando una actualización de firmware en todos ellos. Entre otras cosas, añadiremos soporte Secure Shell al login de configuración.

Para que esta actualización tenga efecto reiniciaremos los switches de forma automática el lunes día 10 a las 7:00 de la mañana, por lo que durante 2 minutos se interrumpirá la red.

Normalmente, los PCs y servidores recuperan la conexión con normalidad transcurrido el reboot.

Reboot de servidors

El proper dimarts dia 4 de setembre de 2011 a les 8:00 hores es procedirà a reiniciar els servidors  "sites", "intranet" i "www-1" per tal de completar l'actualització d'alguns paquets bàsics del sistema. S'ha previst que l'aturada duri uns 15 minuts.

Els serveis afectats seran els següents:

  • Intranet del DAC
  • Webmail
  • Pàgines personals
  • Zones web de recerca i docència
  • Tots els serveis associats al cPanel

Actualització [08:13]: Reboot finalitzat.

Instalación del nuevo SAI en el D6

El SAI principal del D6 es bastante obsoleto y tocaba renovarlo. De hecho, no nos equivocamos en la previsión ya que justo apenas unas semanas sufrió una avería bastante importante.

Recordad que este SAI alimenta lo siguiente:

  • CPD
  • Cuadros de planta protegidos (enchufes con etiqueta naranja)

El nuevo equipo es un Emerson 80-NET de 100KvA de potencia (la misma que el anterior), pero con una tecnología mucho más precisa para estabilizar la corriente. Por supuesto, las baterías también son nuevas.

La conexión la realizaremos el martes día 27.

En principio la mayoría de servicios funcionará:

  • correo
  • web
  • disco centralizado
  • cluster

Otros en cambio no lo harán:

  • conexión ethernet en despachos
  • conexión wireless en el edificio
  • servidores de usuario (WinCenter, Unix)

Intentaremos que funcione alguno más de estos servicios, así que comprobad el blog para más información.

Planificación:

  • 8h : paramos los servicios previstos
  • 8:30h : conexión del SAI
  • 11:00h: finalización de la conexión del SAI y puesta en marcha de los servicios
  • 12h: todos los servicios funcionando

Recomendamos que de 8h a 12h se paren todos los PCs y equipos de los despachos.

Actualización 28/9: A partir de las 12h el SAI está Instalado y funcionando!

Nuevo SAI (exterior)Nuevo SAI D6 (Display)Nuevo SAI D6 (puerta interior)

Actualització del wiki de Serveis TIC

Aquest matí hem realitzat la migració del wiki de Serveis TIC a un nou servidor sense aturada del servei. El canvi de versió del programari ha realitzat una conversió automàtica a la darrera versió de la sintaxi, però pot passar que algunes pàgines no es vegin del tot bé. Si detecteu algun cas, feu-nos-ho saber amb un correu a suport.tic@ac.upc.edu i ho corregirem.

El nou wiki està disponible a la URL: https://www.ac.upc.edu/app/wiki/serveis-tic

Aturada programada del servidor web institucional

Demà dimecres dia 21 de setembre a les 8:00h aturarem el servidor principal del web institucional per manteniment del sistema. L'actuació durarà uns 30 minuts, i confiem que a les 8:30h el servei ja hagi estat reestablert.

Aquests són els continguts i aplicatius que no estaran disponibles:

  • web institucional
  • intranet
  • moodle
  • reports de recerca públics
  • vigilància d'examens
  • oficina oberta

El servidor principal del web institucional és actualment una màquina virtual que corre sobre un host amb emmagatzematge local al propi host. L'actuació consisteix en migrar completament la VM cap a una de nova (en un nou host) per a la qual el seu emmagatzematge estigui al disc centralitzat. Això ens permet desvincular la VM del host i poder-ne realitzar migracions en calent en cas de sobrecàrrega del host.

Durant els propers dies realitzarem actuacions similars sobre altres VMs que allotgen diferents continguts del web institucional. Les anirem anunciant convenientment en aquest blog.

* Actualització 8:35h: El servei ha estat reestablert amb èxit.

Reboot del servidor "sites" (cPanel)

Demà dijous dia 15 de setembre a les 8:00h procedirem a realitzar un reboot del servidor "sites" per tal de completar l'actualització d'alguns paquets bàsics del sistema. L'aturada durarà aproximadament 15 minuts i els serveis afectats seran els següents:

  • Pàgines personals
  • Zones web de recerca i docència
  • Tots els serveis associats al cPanel

Actualització: A les 7:30h tambè rebotarem Webmail (pèl mateix motiu que sites).

Actualització [07:32]: Servidor webmail operatiu.

Actualització [08:08]: Servidor sites operatiu.

Canvi d'un disc al servidor gaudi

Degut al tall de corrent d'ahir, un dels discs en RAID del servidor gaudi va començar a donar errors i el RAID no es podia reconstruir. Avui hem rebut un disc de substitució i demà dia 14 pel matí a les 08:00 procedirem a canviar-lo. L'aturada durarà com a molt 15 minuts i els serveis afectats seran els següents:

  • servei DHCP (assignació dinàmica d'IP)
  • servei primari de DNS (el secundari seguirà funcionant)
  • servei de VMPS (assignació de VLAN a les rosetes)
  • servei de llicències Simics
  • servei de canvi de contrasenya
  • servei d'alta d'IP

Actualització [08:10]: hem canviat el disc i reiniciat el servidor.

Actualització [10:22]: la reconstrucció del RAID ha finalitzat.

Caída de tensión eléctrica en el D6

Hoy a media mañana ha habido una caída en la tensión del edificio D6. A 13:50 aprox. se ha restablecido totalmente el servicio.

Qué ha ocurrido? El SAI principal del D6 estaba averiado (llevamos unos días así en espera de unas piezas). Hoy ha venido el técnico a reparlo y al conectar la placa nueva la alimentación se ha venido abajo.

Placa del SAI averiada

El fallo ha sido bastante importante ya que no sólo ha caído la alimentación de nuestro edificio sino la de parte del anillo del Campus Nord (otros dos edificios más).

Como dentro de dos semanas está previsto instalar un SAI nuevo se ha decidido eliminar éste ya que el riesgo de que vuelva a caer es demasiado grande (y realmente no saben dónde está la avería), así que se ha iniciado el bypass externo.

El bypass externo consiste en aislar electricamente el SAI de forma que éste no reciba ni envíe corriente. De esta forma podemos sustituirlo sin problema. Esta operación se puede realizar normalmente sin paso por cero, pero hoy nos ha vuelto a tirar la instalación.

Finalmente mantenimiento ha conseguido realizar el bypass y ahora, aunque no disponemos de SAI, al menos las conexiones son estables y no tenemos en el circuito ningún elemento que nos pueda producir malfuncionamiento.

Fallada del servidor de repositoris de codi

El servidor code.ac.upc.edu, el qual allotja els repositoris de codi dels vostres projectes amb el programari Trac, svn, mercurial i git, ha patit un malfuncionament software aquesta matinada i ha estat necessari reiniciar-lo aquest matí a primera hora a les 8:09h.

Tot i que alguns serveis sí que han estat reestablerts, com ara la navegació pels repositoris mitjançant el Trac, el funcionament del propi repositori via el programari VCS corresponent no funciona correctament, i a hores d'ara no és possible efectuar operacions sobre el mateix.

Estem investigant quina és l'arrel del problema. En pic tinguem novetats al respecte actualitzarem convenientment aquesta entrada. Us demanem disculpes per les molèsties ocasionades.

* Actualització [14:10h]: Ja hem trobat i solucionat el problema. Es tractava d'una inconsistència al filesystem arrel de la màquina, que no havia deixat cap rastre als logs donat que ha forçat a muntar el read-only el sistema de fitxers. Un cop solucionats els errors, el servei ha estat completament reestablert.

Nova alarma de temperatura al CPD del D6

Avui hem tornat a patir una pujada de la temperatura del CPD del D6 per avaria de l'aire condicionat que refrigera la sala. Afortunadament el màxim de temperatura assolit (37.9 graus) no ha fet necessària l'aturada d'emergència dels diferents servidors, i hem pogut reduir la temperatura del CPD i normalitzar-la en el transcurs del matí després de que els tècnics de manteniment revisessin de nou la màquina d'aire condicionat del D6.

Sembla clar que l'aturada elèctrica programada a tot el campus el dia 11 d'agost ha espatllat quelcom de l'aire condicionat de l'edifici. La màquina havia funcionat sense cap incidència durant més d'un any fins l'esmentada aturada. A partir de llavors ja hem tingut quatre avaries: el mateix dia 12 d'agost, el dia 22, ahir i finalment avui mateix...

Avaria del SAI del D6

Com a conseqüència de l'alarma de temperatura d'ahir, un dels SAIs de l'edifici D6 s'ha avariat. Els tècnics ja han vingut a revisar-lo i confiem que ens facin arribar aviat un pressupost per a la reparació.

El SAI avariat està en bypass: això vol dir que deixa passar el corrent que li vé d'entrada, però que en cas de tall del subministrament, no proveirà corrent als equips que hi estiguin connectats. La majoria d'equips criítics del CPD ja tenen redundada l'alimentació elèctrica cap a ambdós SAIs de l'edifici.

En cas de tall del subministrament elèctric, a més de molts dels equips del CPD, també es veurien afectades totes les preses de corrent estabilitzada de l'edifici D6, que són alimentades precisament pel SAI avariat.

Problemes de temperatura al CPD del D6

Aquest diumenge dia 4 s'han tornat a produir problemes de refrigeració a la sala de màquines del D6. La temperatura màxima enregistrada ha estat de 46.2 graus a les 17:10h. Arribats a aquest punt el sistema ha iniciat una aturada d'emergència de la majoria de serveis no crítics, cPanel i clusters inclosos, per tal de reduir el risc d'avaries hardware. També ha estat aturat el servidor de correu d'entrada. Tots els correus entrants han estat redirigits cap al servidor de correu de continuïtat.

A les 9:30h d'avui dilluns dia 5 la majoria de serveis ja han estat posats en marxa, i tots els correus entrants que ja han estat entregats al servidor de correu habitual. Falta el servei de cPanel, els clusters i alguns servidors secundaris no crítics (brull i grau) que no han arrencat correctament.

Hem creat una incidència a manteniment per a tractar d'aclarir per què la temperatura de la sala de màquines ha pujat d'aquesta manera. Presumiblement es tractarà d'un problema amb l'aire condicionat, que està fallant força sovint darrerament coincidint amb l'aturada elèctrica de tot el campus del mes d'agost.

* Actualització 10:15h: cPanel ha estat posat en marxa.

* Actualització 10:55h: Tots els serveis en funcionament.

Actualización de BSCW

Hoy hemos actualizado la versión de BSCW y pasamos a tener la última disponible (BSCW 4.5.5).

Al integrarse en el nuevo sistema web, el URL oficial del servicio cambia a: http://www.ac.upc.edu/app/bscw (durante un tiempo habrá una redirección, pero es conveniente que actualicéis vuestro bookmark si lo usáis).

Con el nuevo URL ya no pasamos por el proxy antiguo que reescribía el HTML y que hacía que a veces desde las redes externas el BSCW no funcionara lo bien que sería de esperar.

Nueva versión de Webmail

Hoy hemos puesto en marcha una nueva versión del servicio de acceso al correo vía Web:

  • Seguimos usando Webmail aunque con la versión de software actualizada
  • Ahora funciona en la nueva plataforma de ejecución en máquina virtual, monitorización, etc. Esto permite disminuir el tiempo sin servicio (por avería, actualizaciones, etc.).
  • Acceso a través del nuevo sistema de Web (tal como publicamos ayer).  El cambio visible es que el url siempre es "http://www.ac.upc.edu/app/webmail", aunque internamente el servicio lo ofrezca otro servidor.

El nou www ja està aquí

Portem un temps dissenyant el que serà el nou servei del gw, especialment pel que fa al seu paper respecte al web. En aquest sentit avui hem posat en producció el nou www. Si no heu notat cap canvi és perquè els canvis que s'han produït no són visibles. Però aquests canvis ens facilitaran la reorganització de l'espai d'adreces dels diferents serveis web institucionals sota el paraigua de www. A més a més, això també ens permetrà eliminar el pas pel gw per accedir a la intranet.

Altre cop problemes amb l'aire condicionat

Avui al matí s'ha tornat a produir un problema amb l'aire condicionat del centre de càlcul del D6 i la temperatura ha tornat a pujar per sobre dels 40 graus. Com a conseqüència hem hagut d'aturar els clústers i ventilar la sala fins que els tècnics de manteniment han pogut tornar a posar en marxa la refrigeració.

 

Ara mateix la sala s'està refredant i en pic haguem pogut comprovar que l'aire condicionat no s'atura i la temperatura baixa raonablement, tornarem a posar en marxa els clústers.

 

Actualització [13:45]: hem posat en marxa de nou els clústers, trets dels nodes més nous de salvat, que encendrem demà.

Actualització del disc centralitzat

Aquest matí hem dut a terme una actualització del programari de gestió del disc centralitzat. L'actuació comprenia realment dues actualitzacions tant de software com de firmware de cadascun dels nodes del disc centralitzat, i ha tardat unes 5 hores en completar-se.

Afortunadament, gràcies a la configuració en cluster d'alta disponibiitat del sistema de disc centralitzat, l'actuació ha pogut efectuar-se sense interrupció del servei.