Blog

Reboot del servidor intern de bases de dades

El proper dimecres dia 1 de febrer a les 8:30h reiniciarem el servidor que allotja les bases de dades per a fer efectives les darreres actualitzacions de nucli instal·lades. L'actuació durarà uns 15 minuts.

Els serveis que es veuran afectats són els següents:

  • intranet, i totes les seves aplicacions
  • usuari únic

Proves de xarxa al disc centralitzat

El proper dijous dia 26 de gener de 8:00 a 9:00h durem a terme una sèrie de proves de configuració de xarxa i de connectivitat al sistema de disc centralitzat. Durant aquest període és possible que alguns sistemes pateixin desconnexions intermitents, i inclús que alguns sistemes es reiniciïn per complet, per la qual cosa us preguem que preneu les mesures oportunes.

Aquestes proves són necessàries per a determinar l'origen d'un malfuncionament a nivell de xarxa després de que la darrera actualització aplicada el dia 12. Aquest malfuncionament no afecta a l'operativa habitual del servei, però és desitjable reestablir-ne la normalitat.

Com que la llista de serveis que poden veure's afectats en major o menor mesura és molt extensa, preferim llistar-vos els serveis que no resultaran afectats:

  • resolució de noms (DNS)
  • correu
  • clusters

Us mantindrem informats del resultat de les proves.

Actualització del disc centralitzat

Demà dijous dia 12 de gener a les 8:00h procedirem a l'actualització del sistema de disc centralitzat a la darrera versió disponible. L'actuació tindrà una durada estimada de dues hores, durant les quals no hi haurà interrupció del servei. Tot i això, és possible que percebeu petits talls de connectivitat de pocs segons de durada.

També és possible que els servidors Unix més antics pateixin una desconnexió no recuperable dels discs NFS que allotgen els vostres home directories, i que implica haver-los de reiniciar. Això ha succeït en ocasions anteriors en servidors com planas (Fedora Core 6), mora (Red Hat 7.3) i similars. Si teniu costum de treballar en aquests servidors, us recomanem que durant el període de l'actuació useu un servidor Unix més modern.

Servei de continuïtat de correu

Des d'ahir dilluns està en funcionament el servei de continuïtat de correu, que ens permetrà accedir al nostre correu @ac.upc.edu en cas de que el servidor principal ubicat al D6 no estigui accessible.

Si voleu podeu consultar la documentació d'ús del servei i les seves característiques.

Demà dia 20, durant l'aturada elèctrica programada, serà bon moment per a posar a prova el nou servei. Guardeu-vos un bookmark cap a la URL d'accés: https://correu-dac.upc.edu/app/webmail

 

Actualització 20/4/2010 14:30h: El servei de continuïtat de correu ha entrat en funcionament correctament quan el servei de correu principal ha estat aturat i a hores d'ara, quan el servei principal ja ha estat reestablert, ha estat utilitzat per gairebé una trentena d'usuaris. Confirmem també que ara tots els correus ja han estat reenviats cap al servidor principal.

Durant l'apagada elèctrica però hi ha hagut un tall de xarxa no programat a nivell de tota la UPC entre 11:35h i 12h. La notificació oficial d'UPCnet parla d'una «degradació de la sortida de la UPC a Internet». Aquesta incidència ha ocasionat que els servidors de DNS de la UPC no responguessin adequadament, fent que el servei de continuïtat de correu estés també inaccessible durant aquesta estona. Els correus que no hagin pogut ser lliurats al servidor de continuïtat per aquest motiu hauran estat retinguts als relays anteriors, i seran entregats durant les properes hores al servidor principal.

Tall elèctric al Campus Nord

El passat dissabte dia 24 de desembre a les 5:12h de la matinada hi va haver un tall elèctric generalitzat a tot el Campus Nord degut a una fallada de la línia d'alta tensió. Els dos SAIs del D6 i el SAI del C6 van mantenir inicialment l'alimentació dels edificis, però finalment les bateries es van esgotar i tots els equips es van aturar. El corrent elèctric va ser reestablert a les 6:43h de la matinada.

La majoria de servidors van quedar apagats. Vam engegar-los el mateix dissabte dia 24 a les 19:30h de la tarda. La majoria de serveis crítics van ser reestablerts: xarxa, VPN, web institucional. Però no va ser possible reestablir el servei de correu: el servidor que allotja les bústies IMAP havia quedat en un estat inconsistent i va passar-se unes hores reconstruint el sistema de fitxers, i va requerir de dues actuacions addicionals els dies 25 i 26 per a posar-lo de nou en marxa.

Finalment ahir dia 26 a les 8:04h el servei d'accés a les bústies de correu va quedar completament reestablert.

Hores d'ara tots els serveis estan de nou en funcionament, a excepció del servidor masso, el qual ha patit una avaria elèctrica i no arriba ni a engegar-se. Addicionalment el SAI del C6 també està indicant una avaria, que els tècnics de manteniment estan avaluant si es deu al propi SAI o a la línia elèctrica d'entrada al mòdul. Us mantindrem informats al respecte.

* Actualització 27/12, 11:45h: El SAI de l'edifici C6 torna a estar online.

Actualització i reboot dels servidors bàsics de xarxa

Demà dimecres dia 21 de desembre a partir de les 8:00h durem a terme un manteniment de sistema als servidors que allotgen els serveis bàsics de xarxa (recursos i xarxes-1). Estimem que l'actuació durarà uns 10 minuts. Durant aquest període els següents serveis poden no estar disponibles en la seva totalitat:

  • DHCP
  • DNS dinàmic
  • VMPS
  • Impressores
  • SMB

Actualització [08:10]: reboot realitzat i servidors funcionant amb normalitat

Actualització dels servidors web

Demà dimarts dia 20 de desembre a partir de les 8:00h durem a terme un manteniment de sistema als servidors web institucionals (www-1 i intranet-1). Estimem que l'actuació durarà uns 20 minuts. Durant aquest temps la web institucional pot no estar disponible en la seva totalitat.

Renovació del servei de hosting de màquines virtuals

Aquest estiu el servei de hosting de màquines virtuals ha estat posat al dia amb nou maquinari i noves versions de programari. Aquest servei us permet gaudir d'una màquina virtual completament a la vostra disposició per a instal·lar-hi el sistema i el programari que volgueu, i administrar-la segons les vostres necessitats, sense haver-vos de preocupar sobre avaries de maquinari.

Aquestes són les característiques més destacables del nou servei:

  • 2 nous servidors amb 24 GB de RAM cadascun
  • el disc de les màquines virtuals s'allotja al disc centralitzat
  • hi ha possibilitat de fer backups de les dades de les màquines virtuals

A la nostra wiki podreu trobar la descripció completa del nou servei.

NOTA IMPORTANT per als que tingueu màquines virtuals allotjades als antics servidors: Si voleu que les vostres màquines virtuals siguin migrades cap al nou servei, sisplau poseu-vos en contacte amb nosaltres. Els servidors antics seran aturats definitivament i retirats el dia 30 de setembre. Les màquines virtuals que no hagin estat migrades cap als nous servidors seran també aturades i les seves dades seran esborrades.

Servidor de VPN averiado

El viernes dejó de prestar servicio de forma definitiva y no controlada el servidor principal de VPN.

 

Para aquellos que estan teniendo problemas de conexión recomendamos bajarse la última versión del fichero de configuración . Esta incluye el servidor secundario que se puso ya hace tiempo.

 

Actualmente se está trabajando para virtualizar el servidor principal. Pedimos disculpas por las molestias que este incidente puede haber causado.

 

[ Actualización ] Mañana martes a las 08:00h se procederá a rebotar la máquina que ofrece el servicio de las páginas web para poder solucionar el problema sucedido con el servidor principal de VPN. Se prevé que la actuación dure apróximadamente unos 5 minutos.


Impressora c6p1g retirada (sala C6-124)

A la sala C6-124 hi han dues impressores, la multifunció c6p1f (de la marca Ricoh) i la impressora en blanc i negre c6p1g (de la marca Kyocera).

 

Aquesta última impressora ha estat retirada amb caràcter definitiu degut a una avaria que s'ha decidit no reparar.

 

Les cues d'aquesta impressora han estat esborrades i ja no estan disponibles. Qui la tingui instal·lada ha d'eliminar-la manualment del seu sistema operatiu per a evitar errors.

Canvi de switch als servidors crítics

Demà dimecres 23 a les 08:00 procedirem a canviar la connexió dels servidors crítics al switch principal del router, que disposa de font d'alimentació redundada. Els servidors següents poden patir petits talls de connexió però haurien de recuperar-se immediatament sense que arribi a afectar el servei:

  • gaudi: DNS, DHCP, VLAN
  • sert: SMTP extern
  • roura: SMTP intern
  • thos: IMAP, POP
  • gw: Web SSO, SSH, SMTS, IMAPS, POPS

Actualització [08:15]: El canvi de switch s'ha realitzat sense cap problema.

Actualización gestor de tareas de Administración del DAC

Se ha realizado la migración/actualización del servicio de 'request-tracker' de administración.

 

El servicio se hospeda ahora en la máquina intranet-1, que es una máquina virtualizada, con los beneficios

que ello proporciona.

 

En cuanto a la actualización del software, se pasa de la versión 3.6.1 a la 3.8.7, que corrige multitud de bugs

y que ofrece un layout pensado para pantallas panorámicas.

 

La nueva URL del gestor de tareas de administración es la siguiente: https://www.ac.upc.edu/app/rt-admac

 

Por favor, notificar cualquier problema que os surja a: suport.tic@ac.upc.edu

Reboot del servidor "recursos"

Demà divendres dia 18 de novembre a les 8:00h rebootarem el servidor "recursos" per a fer efectives les darreres actualitzacions instal·lades recentment.

L'aturada durarà aproximadament 10 minuts i els serveis afectats seran els següents:

  • Samba per a impressions.
  • Samba per a unitats de xarxa.
  • Qualsevol tipus d'impressions.

Nou servei de webmail

El servei de webmail ha estat renovat amb millores significatives envers la versió actual, tals com:

  • l'ús de preferències personalitzades
  • la integració d'una eina gràfica per a la gestió dels filtres de correu

Teniu els detalls sobre el nou servei a https://www.ac.upc.edu/app/wiki/serveis-tic/Correu/Webmail

El nou servei és accessible en període de proves a http://intranet.ac.upc.edu/horde3

El servei actual romandrà accessible a http://www.ac.upc.edu/app/webmail fins el proper dijous dia 5 de març a les 8:30h. A partir d'aquest moment, l'enllaç oficial del servei serà actualitzat cap el nou programari.

*** Actualització 4/3/2009 17h: Per dificultats tècniques, demà al matí no farem el canvi de l'enllaç oficial al servei de webmail. El període de proves s'estén fins a nou avís.

Reboot del servidor "xarxes-1"

El proper dimecres dia 16 de novembre a les 8:00h rebootarem el servidor "xarxes-1" per a fer efectives les darreres actualitzacions instal·lades recentment. L'actuació durarà uns 10 minuts.

Aquest servidor serà, en un futur immediat, el que concentrarà la majoria de serveis bàsics de xarxa. Actualment però únicament ofereix el servei d'autenticació de MACs a la xarxa ethernet. Per aquest motiu, durant el temps en què duri l'actuació, els equips que siguin connectats a la xarxa en aquell precís instant no podran ser autenticats, i per tant no tindran connectivitat. És important notar que això no afectarà als equips que ja hagin estat autenticats abans de l'actuació.

Fallada del servidor màquines virtuals "vm-users-3"

El servidor de màquines virtuals d'usuari vm-users-3 ha patit un malfuncionament software aquest dissabte i ha deixat de respondre. Les màquines virtuals hostatjades en aquest servidor també han quedat inaccessibles.

Ha estat necessari reiniciar el servidor per a reestablir el servei. Tots aquells de vosaltres que hi tingueu màquines virtuals hostatjades, sisplau connecteu-vos-hi per a verificar-ne el correcte funcionament, ja que les màquines virtuals no han estat aturades de forma ordenada. Si no hi podeu accedir, proveu a connectar-vos al servidor (vm-users-3) des de VMware vSphere Client, i a partir d'allí accediu a la consola de la vostra màquina. És possible que aquesta continuï apagada, o estigui donant un missatge de manteniment a la consola per al qual calguin privilegis d'administrador local.

Dijous 10 de novembre: reboot del servidor sites (cPanel/moodle)

El proper dijous 10 de novembre a les 8:00, procedirem a realitzar un reboot del servidor sites per tal de completar l'actualització d'alguns paquets bàsics del sistema.

L'aturada durarà aproximadament 25 minuts i els serveis afectats seran els següents:

  • Pàgines personals
  • Zones web de recerca i docència
  • Tots els serveis associats al cPanel
  • Moodles de docència

[Actualització 8:27] El servidor torna a estar operatiu amb les actualitzacions completades.

Actualització del servidor de bases de dades

El proper dilluns dia 31 d'octubre a les 8:00h durem a terme una actualització rutinària del programari del servidor intern de bases de dades. Com a conseqüència, les aplicacions que s'hi connecten no estaran disponibles durant el temps que duri l'actuació, que estimem en uns 15 minuts.

Aquestes són les aplicacions afectades:

  • Intranet institucional
  • Usuari Únic
  • Reserva de sales
  • Gestió docent
  • Gestió bibliogràfica
  • Gestió de tickets d'Administració
  • Gestió de contactes d'Administració

Reparació d'un dels dos SAI del C6

Aquesta setmana s'ha reparat un dels dos SAI que dóna servei a l'edifici C6
(veure foto al final d'aquest apunt).

El SAI en qüestió va deixar de funcionar completament a causa d'una avaria en
alguns components elèctrics, i ja els han substituït de manera satisfactòria.
Mentre no es va fer la reparació, l'altre SAI va absorbir sense problemes la
càrrega addicional del SAI avariat. Tot i que no hi van haver problemes, el
cert és que es va quedar fregant el llindar màxim de càrrega.

A hores d'ara ambdós SAI funcionen correctament i amb una càrrega equitativa.

SAI #2 C6 ja reparat.

Actualización del firmware de los switches (y II)

Tan solo faltan 4 switches para realizar el upgrade completo. Se trata de los switches que utilizan algunos de los servidores por lo que hemos preferido dejarlos para el martes día 11 a las 7:00 de la mañana.

En principio los servidores serán capaces de recuperar las conexiones en unos 5 minutos.

[Actualización 7:10]: Todos los servidores recuperados después del minicorte

Actualización del firmware de los switches

Con el fin de mejorar ciertos aspectos de la seguridad de nuestros switches del D6 y C6 estamos realizando una actualización de firmware en todos ellos. Entre otras cosas, añadiremos soporte Secure Shell al login de configuración.

Para que esta actualización tenga efecto reiniciaremos los switches de forma automática el lunes día 10 a las 7:00 de la mañana, por lo que durante 2 minutos se interrumpirá la red.

Normalmente, los PCs y servidores recuperan la conexión con normalidad transcurrido el reboot.

[Actualización 7:30] Todos los switches de acceso actualizados. El corte ha sido de unos dos minutos. El enlace C6-D6 ha reiniciado un poco más tarde (por diferencia en el reloj).

Actualización del firmware de los switches

Con el fin de mejorar ciertos aspectos de la seguridad de nuestros switches del D6 y C6 estamos realizando una actualización de firmware en todos ellos. Entre otras cosas, añadiremos soporte Secure Shell al login de configuración.

Para que esta actualización tenga efecto reiniciaremos los switches de forma automática el lunes día 10 a las 7:00 de la mañana, por lo que durante 2 minutos se interrumpirá la red.

Normalmente, los PCs y servidores recuperan la conexión con normalidad transcurrido el reboot.

Reboot de servidors

El proper dimarts dia 4 de setembre de 2011 a les 8:00 hores es procedirà a reiniciar els servidors  "sites", "intranet" i "www-1" per tal de completar l'actualització d'alguns paquets bàsics del sistema. S'ha previst que l'aturada duri uns 15 minuts.

Els serveis afectats seran els següents:

  • Intranet del DAC
  • Webmail
  • Pàgines personals
  • Zones web de recerca i docència
  • Tots els serveis associats al cPanel

Actualització [08:13]: Reboot finalitzat.

Instalación del nuevo SAI en el D6

El SAI principal del D6 es bastante obsoleto y tocaba renovarlo. De hecho, no nos equivocamos en la previsión ya que justo apenas unas semanas sufrió una avería bastante importante.

Recordad que este SAI alimenta lo siguiente:

  • CPD
  • Cuadros de planta protegidos (enchufes con etiqueta naranja)

El nuevo equipo es un Emerson 80-NET de 100KvA de potencia (la misma que el anterior), pero con una tecnología mucho más precisa para estabilizar la corriente. Por supuesto, las baterías también son nuevas.

La conexión la realizaremos el martes día 27.

En principio la mayoría de servicios funcionará:

  • correo
  • web
  • disco centralizado
  • cluster

Otros en cambio no lo harán:

  • conexión ethernet en despachos
  • conexión wireless en el edificio
  • servidores de usuario (WinCenter, Unix)

Intentaremos que funcione alguno más de estos servicios, así que comprobad el blog para más información.

Planificación:

  • 8h : paramos los servicios previstos
  • 8:30h : conexión del SAI
  • 11:00h: finalización de la conexión del SAI y puesta en marcha de los servicios
  • 12h: todos los servicios funcionando

Recomendamos que de 8h a 12h se paren todos los PCs y equipos de los despachos.

Actualización 28/9: A partir de las 12h el SAI está Instalado y funcionando!

Nuevo SAI (exterior)Nuevo SAI D6 (Display)Nuevo SAI D6 (puerta interior)

Actualització del wiki de Serveis TIC

Aquest matí hem realitzat la migració del wiki de Serveis TIC a un nou servidor sense aturada del servei. El canvi de versió del programari ha realitzat una conversió automàtica a la darrera versió de la sintaxi, però pot passar que algunes pàgines no es vegin del tot bé. Si detecteu algun cas, feu-nos-ho saber amb un correu a suport.tic@ac.upc.edu i ho corregirem.

El nou wiki està disponible a la URL: https://www.ac.upc.edu/app/wiki/serveis-tic

Aturada programada del servidor web institucional

Demà dimecres dia 21 de setembre a les 8:00h aturarem el servidor principal del web institucional per manteniment del sistema. L'actuació durarà uns 30 minuts, i confiem que a les 8:30h el servei ja hagi estat reestablert.

Aquests són els continguts i aplicatius que no estaran disponibles:

  • web institucional
  • intranet
  • moodle
  • reports de recerca públics
  • vigilància d'examens
  • oficina oberta

El servidor principal del web institucional és actualment una màquina virtual que corre sobre un host amb emmagatzematge local al propi host. L'actuació consisteix en migrar completament la VM cap a una de nova (en un nou host) per a la qual el seu emmagatzematge estigui al disc centralitzat. Això ens permet desvincular la VM del host i poder-ne realitzar migracions en calent en cas de sobrecàrrega del host.

Durant els propers dies realitzarem actuacions similars sobre altres VMs que allotgen diferents continguts del web institucional. Les anirem anunciant convenientment en aquest blog.

* Actualització 8:35h: El servei ha estat reestablert amb èxit.

Reboot del servidor "sites" (cPanel)

Demà dijous dia 15 de setembre a les 8:00h procedirem a realitzar un reboot del servidor "sites" per tal de completar l'actualització d'alguns paquets bàsics del sistema. L'aturada durarà aproximadament 15 minuts i els serveis afectats seran els següents:

  • Pàgines personals
  • Zones web de recerca i docència
  • Tots els serveis associats al cPanel

Actualització: A les 7:30h tambè rebotarem Webmail (pèl mateix motiu que sites).

Actualització [07:32]: Servidor webmail operatiu.

Actualització [08:08]: Servidor sites operatiu.

Canvi d'un disc al servidor gaudi

Degut al tall de corrent d'ahir, un dels discs en RAID del servidor gaudi va començar a donar errors i el RAID no es podia reconstruir. Avui hem rebut un disc de substitució i demà dia 14 pel matí a les 08:00 procedirem a canviar-lo. L'aturada durarà com a molt 15 minuts i els serveis afectats seran els següents:

  • servei DHCP (assignació dinàmica d'IP)
  • servei primari de DNS (el secundari seguirà funcionant)
  • servei de VMPS (assignació de VLAN a les rosetes)
  • servei de llicències Simics
  • servei de canvi de contrasenya
  • servei d'alta d'IP

Actualització [08:10]: hem canviat el disc i reiniciat el servidor.

Actualització [10:22]: la reconstrucció del RAID ha finalitzat.

Caída de tensión eléctrica en el D6

Hoy a media mañana ha habido una caída en la tensión del edificio D6. A 13:50 aprox. se ha restablecido totalmente el servicio.

Qué ha ocurrido? El SAI principal del D6 estaba averiado (llevamos unos días así en espera de unas piezas). Hoy ha venido el técnico a reparlo y al conectar la placa nueva la alimentación se ha venido abajo.

Placa del SAI averiada

El fallo ha sido bastante importante ya que no sólo ha caído la alimentación de nuestro edificio sino la de parte del anillo del Campus Nord (otros dos edificios más).

Como dentro de dos semanas está previsto instalar un SAI nuevo se ha decidido eliminar éste ya que el riesgo de que vuelva a caer es demasiado grande (y realmente no saben dónde está la avería), así que se ha iniciado el bypass externo.

El bypass externo consiste en aislar electricamente el SAI de forma que éste no reciba ni envíe corriente. De esta forma podemos sustituirlo sin problema. Esta operación se puede realizar normalmente sin paso por cero, pero hoy nos ha vuelto a tirar la instalación.

Finalmente mantenimiento ha conseguido realizar el bypass y ahora, aunque no disponemos de SAI, al menos las conexiones son estables y no tenemos en el circuito ningún elemento que nos pueda producir malfuncionamiento.

Fallada del servidor de repositoris de codi

El servidor code.ac.upc.edu, el qual allotja els repositoris de codi dels vostres projectes amb el programari Trac, svn, mercurial i git, ha patit un malfuncionament software aquesta matinada i ha estat necessari reiniciar-lo aquest matí a primera hora a les 8:09h.

Tot i que alguns serveis sí que han estat reestablerts, com ara la navegació pels repositoris mitjançant el Trac, el funcionament del propi repositori via el programari VCS corresponent no funciona correctament, i a hores d'ara no és possible efectuar operacions sobre el mateix.

Estem investigant quina és l'arrel del problema. En pic tinguem novetats al respecte actualitzarem convenientment aquesta entrada. Us demanem disculpes per les molèsties ocasionades.

* Actualització [14:10h]: Ja hem trobat i solucionat el problema. Es tractava d'una inconsistència al filesystem arrel de la màquina, que no havia deixat cap rastre als logs donat que ha forçat a muntar el read-only el sistema de fitxers. Un cop solucionats els errors, el servei ha estat completament reestablert.