È importante creare condizioni ottimali per l'accesso e l'analisi dei dati al fine di ottimizzare l'impatto scientifico per la comunità INAF . L'analisi dei dati LOFAR richiede procedure computazionali molto complesse e infrastrutture adatte alle dimensioni dei dataset prodotti dalle singole osservazioni, tipicamente 10-20 TB.
Al momento dell'ingresso in LOFAR, INAF non aveva accesso diretto/riservato a queste infrastrutture.
Per questo motivo abbiamo pianificato un investimento sufficiente a fornire risorse di calcolo di prossimità a circa 20 utenti, distribuiti a livello nazionale italiano, per una agevole analisi dei dati di LOFAR.
Considerando il coinvolgimento dell'Università di Torino, le competenze distribuite in INAF e le risorse già disponibili, LOFAR IT ha una struttura di calcolo organizzata su 2 livelli (Piattaforma 1 e 2):
La Piattaforma 1 è composta da un unico sistema con connessione a 10GB.
Considerata la disponibilità di UniTO a rendere disponibili 3 nodi FAT in OCCAM e 150 TB di storage full speed connessi a 10 GB (pdf), questo sistema è stato considerato adeguato per la Piattaforma 1 (Piattaforma 1-TO ), come già previsto dagli accordi sottoscritti [allegato 4]. Al momento, i nodi FAT che compongono la Piattaforma 1 hanno la seguente configurazione hardware:
- CPU - 4x Processore Intel® Xeon® E7-4830 v3 12 core/2.1Ghz
- RAM - 768GB/1666MHz (48 x 16Gb) DDR4
- DISCO - 1 SSD 800 GB + 1 HDD 2 TB 7200 giri/min
- NET - IB 56 Gb + 2x10 Gb
- 50 TB iniziali, con possibilità di espansione a 150 TB in 18 mesi
La Piattaforma 2 è costituita da una rete di sistemi (calcolo di prossimità) composta da 3 nodi geografici con caratteristiche simili
e che condividono un'infrastruttura comune (es. sistema di autenticazione comune, filesystem eventualmente condiviso, software di sistema comune).
I nodi che ospitano la Piattaforma 2 sono stati individuati in IRA, OA Catania e OA Trieste.
Sulla base dei test effettuati nel corso del 2018 per ogni sito della Piattaforma 2 sono stati previsti 3-5 nodi composti da 2 socket da 40 core (tipo Intel E5 o successivi) con almeno 256 GB di RAM.
Al momento, la Piattaforma 2 è composta da:
Piattaforma 2 IRA:
RAM | CPU | Cores | Clock | Data Net | Work Disk (DAS HD) |
Scrach Disk (DAS SSD) |
512G | Intel Xeon E5-2640 v4 | 2 x 10/20 | 2400/3400 | 1GbE | 28TB | 196GB |
384G | Intel Xeon Gold 6130 | 2 x 16/32 | 2100/3700 | 10GbE | 19TB | 65GB |
384G | Intel Xeon Gold 6130 | 2 x 16/32 | 2100/3700 | 10GbE | 10TB | 65GB |
Al momento usata da (o riservata a) DRANOEL group
RAM | CPU | Cores | Clock | Data Net | Work Disk (DAS HD) |
Scrach Disk (DAS SSD) |
512G | Intel Xeon E5-2640 v4 | 2 x 10/20 | 2400/3400 | 1GbE | 28TB | 196GB |
384G | Intel Xeon Gold 6130 | 2 x 16/32 | 2100/3700 | 10GbE | 19TB | 65GB |
384G | Intel Xeon Gold 6130 | 2 x 16/32 | 2100/3700 | 10GbE | 10TB | 65GB |
384G | Intel Xeon Gold 6130 | 2 x 16/32 | 2100/3700 | 10GbE | 10TB | 65GB |
384G | Intel Xeon Gold 6130 | 2 x 16/32 | 2100/3700 | 10GbE | 10TB | 65GB |
Storage: 240 TB RAID storage server
Piattaforma 2 OA CT :
RAM | CPU | Cores | Clock | Data Net | Work Disk (DAS HD) |
256G | Intel® Xeon® E5-4627 | 4 x 10 | 2600/3600 | 10GbE | 30TB |
256G | Intel® Xeon® E5-4627 | 4 x 10 | 2600/3600 | 10GbE | 30TB |
512G | Intel(R) Xeon(R) Gold 5118 | 4 x 12 | 2300/3600 | 10GbE | 30TB |
Storage: 70 TB storage server
Piattaforma 2 OA TS :
RAM | CPU | Cores | Clock | Data Net | Work Disk (DAS HD) |
Scrach Disk (DAS SSD) |
512G | Intel(R) Xeon(R) Gold 5118 | 4 x 12 | 2300/3600 | Infiniband HDR56 | 80TB | 128GB |
512G | Intel(R) Xeon(R) Gold 5118 | 4 x 12 | 2300/3600 | Infiniband HDR56 | 80TB | 128GB |
512G | Intel(R) Xeon(R) Gold 5118 | 4 x 12 | 2300/3600 | Infiniband HDR56 | 80TB | 128GB |
512G | Intel(R) Xeon(R) Gold 5118 | 4 x 12 | 2300/3600 | Infiniband HDR56 | 80TB | 128GB |
Storage: 500TB beegfs parallel storage
Software per l'analisi dei dati
Il gruppo LOFAR Italiano fornisce versioni containerized della pipeline di LOFAR al fine di garantire:
- la portabilità del software
- la corretta gestione della versione corrente del software
- la riproducibilità dei risultati
Il containerized software con la relativa documentazione è disponibile al seguente indirizzo: https://www.ict.inaf.it/gitlab/lofarit/containers.