Vés al contingut (premeu Retorn)

Sou a: Inici / Nosaltres / Serveis TIC / Blog

Blog

Disco distribuido: S3

Hola a todos,

desde su puesta en producción hemos usado el disco distribuído como sistema de almacenamiento para guardar las imágenes de las máquinas virtuales y el plan es ir incorporando poco a poco servicios hasta sustituir al actual disco centralizado.

Pues bien, desde hoy está disponible el nuevo servicio para guardar objetos (ficheros) usando el interface S3 (Amazon).

Las características principales son:

  • Está pensado para almacenar trazas, resultados, grandes ficheros, etc.
  • El acceso se ha de hacer desde la red interna (o VPN)
  • Es una zona scratch (sin backup)
  • Se pueden utilizar los clientes habituales de S3 (nosotros ofrecemos s3cmd en el cluster)

De momento, lo tenemos en fase beta para que lo probéis. Mientras esté en esta fase no realizaremos aumentos de cuota.

Podéis ver la documentación entera del servicio en: https://www.ac.upc.edu/app/wiki/serveis-tic/Storage/Ceph/S3/Intro

Talls per actualització servidors

Durant els pròxims dies 27, 28 i 29 de juliol es prepararan els servidors pel tall de corrent de la revisió anual de les instal·lacions d'alta tensió al Campus Nord del pròxim dia 2 d'agost. 

Es realitzarà l'actualització i verificació dels reboots de tots els servidors del DAC, pel que pot haver-hi petits talls a qualsevol dels serveis del departament.

Millora de la robustesa de les contrasenyes usades al DAC

Des de la setmana passada hem afegit una sèrie de restriccions a les contrasenyes que els usuaris podeu posar-vos als diferents serveis del Departament. Aquestes restriccions tenen per objectiu millorar-ne la robustesa, de manera que sigui més difícil per un atacant remot poder-les trencar.

Aquestes són algunes de les restriccions:

  • han de tenir un mínim de vuit caràcters (no hi ha màxim, però alguns serveis podrien no acceptar contrasenyes excessivament llargues)
  • no poden contenir el vostre nom d'usuari
  • no poden estar formades únicament per lletres minúscules en la seva totalitat, o majúscules, o dígits

Darrerament hem patit alguns atacs en diferents serveis institucionals, els quals han tingut èxit perquè la contrasenya d'un usuari era excessivament simple. Un cop el sistema ha estat compromés d'aquesta manera, és relativament senzill per l'atacant instal·lar cert tipus de malware que es dediqui a fer publicitat, enviar spam i virus, o inclús a recopilar dades confidencials. Aquests tipus de malware solen ser difícils de detectar, i per tant, poden estar actius força temps, comprometent tots els usuaris de la mateixa xarxa; en definitiva, tots els usuaris del Departament.

És per aquest motiu que cal que tots prenguem consiència de que la robustesa de la nostra contrasenya és fonamental per a la seguretat de les nostres dades. Però no només això: alhora té importants beneficis per la seguretat dels altres companys del Departament. Per això us recomanem també que la canvieu de forma periòdica.

Recordeu que podeu canviar-vos les vostres contrasenyes a través de l'aplicatiu web.

Aturada comunicacions xarxa

Demà dijous 21/07/2016 entre les 7.30 i les 8.30 es tornarà a repetir el manteniment del switch d'entrada al departament que com la darrera vegada provocarà una aturada de totes les comunicacions.

Tots els serveis es veuran afectats, pel que no es podrà accedir al correu, ni al web, ni als discos interns.

Confiem que en aquesta ocasió les indicacions del fabricant permetin realitzar l'actualització.

Aturada comunicacions xarxa

El divendres vinent 15/07/2016 entre les 7.30 i les 8.30 es procedirà a realitzar un manteniment del switch d'entrada al departament que provocarà una aturada de totes les comunicacions.

Tots els serveis es veuran afectats, pel que no es podrà accedir al correu, ni al web, ni als discos interns.

Actualització 8.00: L'upgrade al switch ha donat un error pel què pròximament s'haurà de tornar a realitzar una aturada de manteniment.

Reboot del servidor sites

Demà dimecres 6 de juliol a les 7:30h procedirem a reiniciar el servidor sites per tal de posar en marxa la darrera versió del nucli. Els serveis afectats són:

  • cPanel
  • pàgines personals
  • zones web de docència i recerca

Estimem que el servei estarà aturat aproximadament uns 30 minuts.

 

Instal·lació nou switch per al cluster de disc

El proper dimecres dia 6 de juliol a partir de les 10h i fins a les 14h procedirem a la instal·lació d'un nou switch de comunicacions que formarà part del cluster de disc.

Aquest nou switch proporcionarà redundància i millor connectivitat a tot el cluster de disc.

La instal·lació del switch a l'armari comporta l'aturada i la reubicació de 3 dels nodes del cluster de disc. La desconnexió i reconnexió de cadascun dels nodes la farem individualment. És per aquest motiu que l'actuació s'allargarà segurament durant tot el matí.

En principi, els usuaris no percebreu cap impacte d'aquesta actuació; tots els serveis seguiran funcionant amb total normalitat.

Anirem informant del progrés de l'actuació en aquesta mateixa entrada.

Actualització switch cluster de disc

El pròxim dilluns 27/06/2016 a les 7.30 es procedirà a realitzar l'actualització del switch que serveix xarxa als nodes del clúster de disc.

Aquesta actuació implicarà una aturada de tots els serveis del DAC, inclòs l'accés a la xarxa. La duració de l'actualització serà d'un màxim de 30 minuts.

La nova versió permetrà enllaçar aquest switch amb un altre igual per a oferir alta disponibilitat en les connexions del disc distribuït.

[07:36]: Switch reiniciat (en 3 minuts estava en línia de nou però sense la nova versió)
[07:50]: Hem tornat a reiniciar el switch i aquest cop l'actualització s'ha realitzat amb èxit (ha trigat uns 10 minuts)

Servicio de listas de correo MyList

Hace unos meses UPC puso en marcha el servicio "MyList" que permite a un usuario crear y autogestionar listas de correo. Este servicio mejora sustancialmente el que ofrece actualmente el DAC: además de versiones más actualizadas de todo el software, no hay intervención manual por lo que todas las operaciones son inmediatas.

Es por ello, que a partir de ahora, cuando nos pidáis pida una lista de correo os redirigiremos a este servicio UPC. En un futuro cercano plantearemos la migración de las listas actuales (conservando, al menos temporalmente, la dirección de correo).

Las listas institucionales las seguiremos gestionando desde el Departamento.

Posada en funcionament discos avariats

Demà dimarts 21/6/2016 a les 7.30 s'activaran els 16 discos d'un dels nodes del cluster distribuït que ha tornat d'una reparació.

 

Aquesta operació pot suposar una reducció del temps de resposta dels serveis del departament, durant una mitja hora.

 

Actualització 7.50: L'actuació ha finalitzat sense que s'hagi produït cap incidència.

Nous nodes d'arvei

Ahir dia 1 de juny vam posar en funcionament 5 nous nodes del cluster arvei. Són els que van d'arvei-1601 fins a arvei-1605. El «16» denota que són nodes de l'any 2016 (darrerament estem utilitzant aquesta nomenclatura quan incorporem nous nodes al cluster).

Com és habitual, trobareu la descripció del seu hardware i com s'integren a les diferents cues d'execució a la nostra wiki i també a la web institucional.

Els nous nodes han estat financiats per la línia de recerca ARCO.

Actualització del servidor sites

Demà dijous 19 de maig a les 07:30 procedirem a reiniciar el servidor sites per tal de posar en marxa la darrera versió del nucli. Els serveis afectats són:

  • cPanel
  • pàgines personals
  • zones web de docència i recerca

Estimem que el servei estarà aturat aproximadament uns 30 minuts.

Nueva apliación Usuario Único

Desde hace ya muchos años tanto Administración como los Servicios TIC usamos Usuario Único para gestionar las vinculaciones de los usuarios del DAC.

Esta aplicación, aunque cumplía su cometido tenía varios problemas como, por ejemplo, usar una plataforma tecnológica obsoleta, introducción de muchos datos de forma manual, etc.

Por ello, decidimos refactorizarla completamente estudiando desde cero los requerimientos.

Los principales cambios respecto a la versión anterior son:

  • UI totalmente renovado
  • La mayoría de vinculaciones (PDI, PAS, Estudiantes de Doctorado) y datos se importan de fuentes oficiales de UPC
    • Por lo tanto, para modificar los datos de estas vinculaciones hay que modificar las fuentes!
  • Los nombres de los tipos de vinculaciones son las mismas que usa UPC
  • La figura de "Vinculat" se utiliza para todas las vinculaciones no oficiales (son las únicas que se han de introducir manualmente). La mayoría las inicia un PDI
    • Invitados, Colaboradores, etc.

Problemes amb el switch principal del departament

Avui dia 11/05/2016 a les 18:53 hores el switch principal del departament ha patit un malfuncionament. Estem cercant què ho ha causat.

En tot cas, a les 19:22 hores la connexió a Internet s'ha deixat funcionant correctament, tot i que ha hagut un parell de talls de menor importància entremig.

Dispenseu les molèsties que això us hagi pogut ocasionar.

Aturada programada dels servidors que munten els "homedirs"

El proper divendres dia 22 d'abril a les 7:30h procedirem a aturar els servidors que importen per NFS els volums que contenen els vostres directoris personals (també coneguts com homedirs). El motiu és la migració de totes aquestes dades cap a un altre sistema de disc, ja que l'equip que actualment les allotja deixarà d'estar en manteniment properament.

Creiem que l'actuació durarà aproximadament unes 2 hores.

Aquests són els serveis afectats:

  • nodes d'entrada del cluster arvei: el cluster romandrà inaccessible durant el temps que duri l'actuació, però no afectarà als treballs que estiguin en execució ni tampoc als que hi hagi encuats; en cas de que executeu algun treball de forma interactiva, com sempre us recomanem que useu l'eina screen o byobu des del node final d'execució per a que pugueu recuperar-ne l'estat quan el servei sigui restablert
  • accés remot als directoris personals: inclou l'accés als mateixos i a unitats compartides a través de clients Linux i Windows mitjançant qualsevol protocol: SMB, SSH, etc.
  • servidors Windows: amargos i pujals
  • servei d'impressió
  • recepció de nou correu i enviament de correu: no es perdrà cap correu que us enviïn durant el temps que duri l'actuació, però sí que us serà entregat quan hagi finalitzat. Addicionalment, no podreu enviar correu des dels servidors del departament fins que no hagi finalitzat l'actuació. En canvi, sí que podreu accedir i consultar la vostra bústia de correu durant tot aquest temps, i escriure nous correus i guardar-los com esborranys si ho desitgeu mentre no pugueu enviar-los
  • servidors UNIX específics: bosch, fonoll, mas i pericas, els quals serveixen programari específic com és el cas de FrameMaker

* Actualització 9:43h: Tots els serveis tornen a estar disponibles.

Aturada servidors

Durant aquesta setmana es durà a terme la migració del disc de diversos servidors per a què estiguin allotjats al nou pool de disc.

La llista de servidors i serveis afectats que es migraran és:

  • xarxes-2: Dimecres 13/4 a les 7:30. Es calcula que a les 9:30 tornarà a estar operativa. Els serveis afectats són:
    • DNS
    • DHCP
    • Connectivitat xarxa
  • intranet-1: Dimecres 13/4 a les 15:00. Es calcula en aquest cas que a les 19:00 tornarà a donar servei. Els serveis afectats són:
    • intranet
    • Usuari Únic
    • Reserves
    • BSCW
    • RT
    • wiki
  • recursos-1: Dijous 14/4 a les 7:30. Es calcula en aquest cas que a les 10:00 la migració haurà finalitzat. Els serveis afectats són:
    • Servidor d'impressió (CUPS)
    • Accés a fitxers des de PC/terminal (SAMBA)

Actualització [13/4/2016 7:50]: El servidor xarxes-2 torna a estar operatiu.

Actualització [13/4/2016 16:55]: El servidor intranet-1 torna a estar operatiu.

Aturada programada de minerva-users-1

El proper divendres dia 15 d'abril a partir de les 7:30h aturarem el servidor minerva-users-1. Aquest servidor és el node d'entrada al cluster de recerca minerva.

El motiu de l'aturada és la migració del seu disc cap al nou sistema de disc distribuït. El sistema de disc usat actualment per aquest servidor deixa d'estar en manteniment properament.

Creiem que l'accés al cluster minerva tornarà a estar disponible a les 9:30h. Anirem informant en aquesta mateixa entrada del progrés de l'actuació.

Actualització dels servidors de disc del clúster

Demà dimecres dia 6 d'abril a partir de les 9:30h durem a terme una actualització del firmware dels dos servidors de disc dels clústers.

L'actuació durarà 1 hora aproximadament i es farà de forma transparent: els servidors de disc estan redundats i mentre un s'actualitza, l'altre segueix atenent els diferents serveis. De totes formes, durant el transcurs de l'actuació poden produir-se petits talls de connectivitat en determinats serveis.

  • Actualització [10:40]: Durant la comprovació prèvia a l'actualització s'han produït problemes de connexió entre els dos servidors i hem hagut d'avortar l'actuació. Aquest problema ha afectat principalment a les bústies de correu, al servidor del clúster arvei i al servidor de bases de dades, que han deixat de respondre fins fa poc. Estem investigant la causa dels problemes de connexió.

Aturada programada del servidor aules-1

El proper dimarts dia 5 d'abril a partir de les 12:00h aturarem el servidor aules-1, aprofitant que no hi ha més classes en tot el dia a les aules docents del D6. Aquest servidor és el que proporciona les diferents imatges de sistema i serveis als ordinadors de les aules.

El motiu de l'aturada és la migració del seu disc cap al nou sistema de disc distribuït. El sistema de disc usat actualment per aquest servidor deixa d'estar en manteniment properament.

Creiem que el servidor tornarà a estar disponible a darrera hora de la tarda, donat el gran volum de dades a migrar. Anirem informant en aquesta mateixa entrada del progrés de l'actuació.

 

* Actualització 13:52h: El servidor aules-1 torna a estar disponible.

Aturada programada de boada-server-1

El proper dilluns dia 4 d'abril a partir de les 7:30h aturarem el servidor boada-server-1. Aquest servidor és el node d'entrada al cluster docent boada.

El motiu de l'aturada és la migració del seu disc cap al nou sistema de disc distribuït. El sistema de disc usat actualment per aquest servidor deixa d'estar en manteniment properament.

Creiem que l'accés al cluster boada tornarà a estar disponible a les 9:30h. Anirem informant en aquesta mateixa entrada del progrés de l'actuació.

 

Actualització [4/4/2016 - 8:45]: La migració del servidor ha finalitzat i tots els serveis del mateix tornen a estar operatius.

Aturada programada dels servidors amargos i fabre

Demà dimecres dia 30 de març a partir de les 9:30h aturarem els servidors amargos (Windows Server) i fabre (node d'entrada al cluster arvei).

El motiu de l'aturada és la migració del seu disc cap al nou sistema de disc distribuït. El sistema de disc usat per aquests servidors actualment deixa d'estar en manteniment properament.

Creiem que fabre tornarà a estar disponible a les 11:30h. En canvi, és probable que amargos s'allargui tot el dia, donat el gran volum de dades a moure.

Us recordem que, com alternativa a aquests servidors, podeu usar els següents:

  • pujals: Windows Server
  • arvei: Us redirigirà de forma transparent cap al node d'entrada del cluster amb major disponibilitat; de fet, us aconsellem que sempre useu "arvei" per a entrar al cluster

* Actualització 10:58h: El servidor fabre torna a estar disponible.

* Actualització 18:04h: El servidor amargos torna a estar disponible.

Actualització del servidor sites

Demà dijous 4 de febrer a les 07:30 procedirem a reiniciar el servidor sites per tal de posar en marxa la darrera versió del nucli. Els serveis afectats són:

  • cPanel
  • pàgines personals
  • zones web de docència i recerca

Estimem que el servei estarà aturat aproximadament uns 30 minuts.

Actualitzacions automàtiques als servidors de VMs

A partir del proper dilluns dia 8 de febrer activarem un mecanisme per passar actualitzacions de forma automàtica als servidors de màquines virtuals (servei VMHosting).

Aquestes actualitzacions es faran sempre de dilluns a divendres a partir de les 9:30h. No s'actualitzaran tots els servidors el mateix dia, sinó que es farà de manera gradual. Cada servidor s'actualitzarà com a molt un cop al mes.

Quan un determinat servidor vagi a actualitzar-se, es procedirà de la següent manera:

  • es migren totes les VMs cap a un altre servidor
  • el servidor s'actualitza i es reinicia si és necessari
  • es retornen al servidor les VMs que han estat migrades anteriorment

En teoria, aquest procediment hauria de ser completament transparent a les VMs que estan corrent. Malauradament, hem detectat algunes situacions que poden fer que determinades VMs es pengin. Això és degut a que durant aquestes migracions, el disc de la VM pot tardar més temps de l'habitual en respondre. De vegades, aquesta situació és interpretada per la VM com un error fatal, deixant-la completament inoperativa, i cal reiniciar-la.

Per a evitar que això passi, és important que reviseu les vostres VMs i us assegureu que heu augmentat convenientment els timeouts de tots els discs. En aquest document us expliquem com fer-ho.

IMPORTANT: Canvi de configuració de la VPN

El proper dijous dia 21 de gener a primera hora del matí (abans de les 8:00h) canviarem els certificats del servei de VPN. Els certificats actuals són considerats dèbils i donen problemes amb sistemes moderns, i per tant ens cal substituir-los per uns de més robustos.

Aquest canvi té gran impacte sobre tots aquells que useu la VPN: és necessari que actualitzeu la configuració del vostre client amb els nous certificats. El canvi l'haureu de fer el mateix dia 21. Si el feu abans, no podreu connectar-vos tampoc a la VPN.

Per tant, us recomanem que descarregueu els fitxers de configuració necessaris pel vostre sistema operatiu el més aviat possible, i els instal·leu a partir del dia 21 quan deixeu de tenir connectivitat a la VPN. Si el vostre sistema permet definir diferents perfils de connexió VPN (p.ex: Ubuntu, Windows, MacOS), ja podeu crear un nou perfil amb la nova configuració i usar-lo a partir del dia 21.

Trobareu les instruccions sobre com procedir a la següent pàgina del wiki. Sisplau, seguiu els enllaços corresponents al vostre sistema operatiu.

* Actualització 7:15h: Els nous certificats han estat instal·lats amb èxit. És necessari que actualitzeu la configuració dels vostres clients per a poder accedir al servei.

Nova impressora a la EETAC

Avui s'ha posat en producció la nova impressora eetacb, que és una Kyocera FS-4200DN, de tòner negre. A Windows la podeu afegir com a eetacb, i a Linux la podeu afegir amb les seves tres cues d'impressió: eetacb, eetacb_d i eetacb_dl.

La impressora es troba a la sala C4-016, ja que aquesta nova impressora substitueix a l'antiga pepscc.

Trobareu a la documentació com afegir-la al vostre sistema. Les persones que facin servir com a sistema operatiu el proporcionat per la imatge oficial del LCAC no ha de fer res, atès que el canvi és automàtic.

Per a qualsevol consulta, podeu enviar-nos un correu a suport.tic@ac.upc.edu, trucar-nos al 15953 o passar pel despatx D6-S108.

Migració dades del servidor cPanel

El dimecres vinent 4 de novembre a les 7:30 es procedirà a fer una migració de les dades de cpanel a un nou servidor amb una versió actualitzada del sistema operatiu.

Es calcula que l'operació pot trigar fins a 4 hores i durant aquest temps no estarà accessible l'accés a:

  • cPanel
  • Pàgines personals
  • Zones de recerca/docència
  • Zones web gestionades per usuaris

Actualització 4/11 - 12:45: El procés de transferència de les dades està trigant molt més de l'esperat. Confiem que en una estona finalitzi la migració de les dades.

Actualització 4/11 - 17:15: El nou servidor està operatiu. El procés de migració de les dades ha trigat mot més del que ho havia fet els dies anteriors, quan s'havien migrat les dades per comprovar els temps de la operació.

Reboot servidor d'impressió i samba

Demà dijous dia 8 d'octubre a partir de les 7:30h es farà un reboot del servidor d'impressió i samba (recursos-1) per a fer una ampliació de memòria que millori el funcionament d'alguns processos.

 

L'actuació durarà aproximadament uns 15 minuts, i durant aquest temps els següents serveis no estaran disponibles:

  • Servidor d'impressió (CUPS)
  • Accés a fitxers des de PC/terminal (SAMBA)

Migració de disc del servidor web

Demà dijous dia 8 d'octubre a partir de les 6:30h aturarem el servidor web institucional (www-1) per a moure les seves dades cap a un altre servidor de disc. El motiu és que el servidor de disc que les allotja en aquests moments deixarà d'estar en manteniment aviat.

L'actuació durarà aproximadament uns 30 minuts, i durant aquest temps els següents serveis web no estaran disponibles:

  • web institucional
  • web de serveis TIC
  • aplicació de recollida de recomanacions del programa EMJD-DC
  • aplicació de reports de recerca
  • webmail

Problemes a tota la xarxa del DAC

Ahir a les 22h estava planificada una actualització automàtica d'alguns servidors del departament. L'actuació es va dur a terme tal com estava previst però es va produir un problema amb el que no comptàvem: la nova versió del nucli de linux té un error que provoca desconnexions a les interfícies de xarxa.

Aquest error ha afectat dos servidors que hostatjaven les màquines virtuals amb els serveis següents:

  • sites: pàgines personals, zones web de recerca i docència
  • fabre: node d'accés a arvei
  • capatas-1: Puppet
  • xarxes-2: DNS, DHCP, VMPS
  • boada-server-1: servidor del clúster docent boada

Un cop detectat que l'origen del problema era aquest error del nucli, hem reiniciat els servidors de màquines virtuals amb una versió anterior i poc a poc el servei s'ha estabilitzat. Com a conseqüència de la desconnexió del servei de VMPS, alguns equips de comunicacions també han deixat d'assignar les VLAN corresponents a les rosetes i ha calgut reiniciar-los perquè tornessin a funcionar correctament.

Revisió d'instal·lacions d'alta tensió al Campus Nord

El proper dimarts 4 d'agost es durà a terme la revisió anual de les instal·lacions d'alta tensió al Campus Nord que afecta als edificis C6 i D6 del DAC. Com que el tall de corrent elèctric està programat entre les 07:00 i les 16:00, els serveis TIC del DAC s'aturaran a partir de les 06:00 i es tornaran a posar en marxa a partir de les 16:00.

Recordeu que si necessiteu aturar o encendre manualment algun equip al CPD del D6 ens ho heu de fer saber el més aviat possible al correu de suport.tic.