A Blue Gene egy masszívan párhuzamos architektúra -projekt, amelyet több szuperszámítógép építésére terveztek, és célja 1 petaflopsot meghaladó adatfeldolgozási sebesség elérése . Jelenleg a közel 20 petaflop sebességet sikerült elsajátítani . Ez az IBM (a Rochester MN és a Thomas Watson Research Center részlege ), a Livermore National Laboratory , az Egyesült Államok Energiaügyi Minisztériuma (amely részben finanszírozza a projektet) és a tudományos körök közös projektje. A projektnek három fázisa van: Blue Gene/L, Blue Gene/P és Blue Gene/Q.
A projektet 2009. szeptember 18-án elnyerték az Egyesült Államok Nemzeti Technológiai és Innovációs Medáljával. Barack Obama elnök 2009. október 7-én adta át a díjat [1] .
1999 decemberében az IBM bejelentett egy öt évre szóló, 100 millió dolláros kutatási kezdeményezést, amelynek célja, hogy nagyszámú párhuzamos számítógépeket építsenek fel olyan biomolekuláris jelenségek tanulmányozására, mint a fehérjehajtogatás. A projektnek két fő célja volt: a fehérjehajtogatás mögött meghúzódó mechanizmusok jobb megértése nagyszabású szimulációk segítségével, valamint új ötletek feltárása a masszívan párhuzamos gépi és szoftverarchitektúrában.
A fő tanulmányi területek a következők:
A Blue Gene kezdeti tervezése a Cyclops64 architektúra Denney Monty által tervezett korai verzióján alapult. A kezdeti kutatási és fejlesztési munkákat az IBM TJ Watson Research Centerben végezték.
Az IBM-nél Alan Gahr elkezdett dolgozni a QCDOC architektúra általánosabb célú szuperszámítógépgé való kiterjesztésén: négy egymáshoz közel elhelyezkedő rendszeren belüli kapcsolt hálózatot felváltottak egy olyan hálózatra, amely támogatta az üzenetek továbbítását bármely csomópontból bármely másikba, valamint párhuzamos bemenetet/kimenetet. Az Energiaügyi Minisztérium elkezdte finanszírozni a rendszer fejlesztését, és Blue Gene/L (L for Light) néven vált ismertté. Az eredeti Blue Gene rendszer fejlesztése Blue Gene/C néven folytatódott (C a Cyclops), majd később Cyclops64-re keresztelték.
A Blue Gene rendszer minden következő generációja saját nevet kapott. Így a szuperszámítógépek második generációját (2007-ben vezették be) Blue Gene/P-nek, a harmadikat (2011-ben vezették be) Blue Gene/Q-nak hívták.
A Blue Gene/L az IBM Blue Gene sorozat első számítógépe, amelyet a Livermore National Laboratory -val együttműködésben fejlesztettek ki . Elméleti csúcsteljesítménye 360 teraflop , míg a Linpack teszttel kapott tényleges teljesítmény körülbelül 280 teraflop. A 2007-es frissítés után a valós teljesítmény 478 teraflopra nőtt, a csúcsteljesítmény pedig 596 teraflop. A Blue Gene/C a Cyclops64 architektúra egy részhalmaza.
2006 novemberében a TOP500-as listáról 27 számítógép rendelkezett Blue Gene/L architektúrával.
A Blue Gene/L szuperszámítógép a következő módokon volt egyedülálló:
A Blue Gene/L architektúra a QCDSP és QCDOC architektúrák evolúciója. Minden Blue Gene/L számítási vagy I/O csomópont egyetlen ASIC (Application Specific Integrated Circuit) egy DRAM memóriachippel integrálva. Az ASIC két beépített 700 MHz-es PowerPC 440 processzorral rendelkezik (mindegyik kétcsatornás, kettős pontosságú matematikai koprocesszorral (FPU), egy alrendszer-gyorsítótárral és egy beágyazott DRAM-vezérlővel, valamint több kommunikációs alrendszert támogató logikával. A kettős FPU mindegyik Blue Gene/L csomópont elméleti csúcsteljesítménye 5,6 Gflop. A processzorokat nem köti össze koherens gyorsítótár.
Két számítási csomópont van elhelyezve egy számítógépes kártyán, 16 számítási kártya és legfeljebb 2 I/O csomópont van egy kártyán. Egy rackben akár 32 tábla is elfér. Az összes szükséges rendszer egyetlen chipre történő integrálásával és alacsony fogyasztású logikai elemek használatával minden számítási vagy I/O csomópont alacsony energiát fogyaszt (körülbelül 17 wattot, beleértve a DRAM költségeket). Ez lehetővé teszi akár 1024 számítási csomópont (plusz további I/O csomópontok) nagyon szorosan becsomagolását egy szabványos 19 hüvelykes rackbe, ésszerű teljesítményt és levegőhűtést biztosítva. A flop per watt, a négyzetméterenkénti flop és az egységköltség szerinti hatékonysági mutatók lehetővé teszik a rendszer nagyon nagy teljesítményre skálázását. A sok csomópontnál elkerülhetetlenek az alkatrészek meghibásodása. Ezért a rendszer számos meghibásodott alkatrészt képes elektromosan leválasztani, hogy továbbra is normálisan működjön.
Minden Blue Gene/L csomópont három párhuzamos kommunikációs hálózathoz csatlakozik:
A Linuxot futtató I/O csomópontok Ethernet hálózaton keresztül biztosítják a kommunikációt a tárolóval és a külső csomópontokkal. Az I/O csomópontok kezelik a számítási csomópontok fájlrendszer-műveleteit. Végül egy különálló és privát Ethernet hálózat hozzáférést biztosít bármely csomóponthoz a konfigurációhoz, letöltéshez és diagnosztikához.
Ahhoz, hogy több program egyidejűleg futhasson, a Blue Gene/L rendszert elektronikusan elkülönített csomópontrészekre kell osztani. A partícióban lévő csomópontok számának 2 hatvány többszörösének kell lennie, legalább 25 = 32 csomópont. A program Blue Gene/L rendszeren való futtatásához először a partíciót le kell foglalni. A program ezután letöltődik, és a partíción belüli összes csomóponton fut, és semmilyen más program nem férhet hozzá a partíción belüli csomópontokhoz, amíg a partíció használatban van. A partíció befejezése után a csomópontok felszabadulnak a következő programok futtatására.
A Blue Gene / L számítási csomópontok a legkönnyebb operációs rendszert használják, amely egy felhasználói programot támogat. A POSIX-rutinoknak csak egy részhalmaza támogatott, és egyszerre csak egy folyamat futhat egy gazdagépen társprocesszor módban, vagy egy folyamat egy processzoron virtuális módban. A programozóknak zöld szálakat kell használniuk a helyi párhuzamosság szimulálásához. Az alkalmazások fejlesztése általában C, C++ vagy Fortran nyelven történik MPI -vel a kommunikációhoz. Néhány szkriptnyelven, például Ruby és Python is lehetséges, mivel ezek integrálva vannak a számítási csomópontok operációs rendszerébe.
Két PowerPC 440 magot tartalmazó Blue Gene/L chip blokkvázlata
Az egyik BlueGene/L rack
A Cyclops64 projekt az Earth Simulator - (a Japan AeroSpace Exploration Agency és a Japan Institute for Nuclear Research által 1997-ben kifejlesztett rendszer a globális felmelegedés hatásának tanulmányozására és geofizikai problémák megoldására) fejlesztésére válaszul indult.
A Cyclops64 az Egyesült Államok Energiaügyi Minisztériumának (amely részben finanszírozza a projektet), az Egyesült Államok Védelmi Minisztériumának, az ipari vállalatoknak (különösen az IBM-nek) és az akadémiáknak közös projektje.
Az építészetet a Seymour Cray-díjas Denney Monti tervezte, aki jelenleg a projektet vezeti.
Minden 64 bites Cyclops64 chip 500 MHz-en fut, és 80 processzort tartalmaz. Minden processzornak két szála és egy matematikai társprocesszora (FPU) van. Mindegyik szál egy rendezett 64 bites RISC mag 32 KB további memóriával, a Power Architecture utasításkészlet 60 utasításból álló részhalmazával. Öt processzor osztozik 32 KB utasítás-gyorsítótáron.
A processzorok a 96-os porton keresztül csatlakoznak[ pontosítás ] mátrixváltóval. Egy globális megosztott memórián keresztül kommunikálnak egymással (memória, amelybe minden szál írható és olvasható) az SRAM-ban.
A Cyclops64 chip elméleti csúcsteljesítménye 80 GFlops.
Egy processzoron két szál (két szál) működik, egy chipen legfeljebb 80 processzor található. 1 chip kerül a táblára, majd legfeljebb 48 tábla kerül a köztes táblára. Egy rack 3 köztes táblára fér. A rendszer legfeljebb 96 (12x8) állványt tartalmazhat.
Vagyis a teljes rendszer 13 824 Cyclops64 chipet tartalmaz, amelyek 1 105 920 processzorból állnak, amelyek 2 211 840 párhuzamos szál futtatására képesek.
A Cyclops64 feltárja hardveres programozási képességeinek nagy részét, lehetővé téve a programozó számára, hogy nagyon nagy teljesítményű és finoman hangolt szoftvereket írjon. A negatív pont a Cyclops64 alatti programozás nehézsége
A kutatás és fejlesztés folyamatban van annak érdekében, hogy a rendszer támogassa a TiNy-Threads-t (a Delaware Egyetemen kifejlesztett szálfűzési könyvtár) és a POSIX Threads-et.
2007. június 26- án az IBM bemutatta a Blue Gene/P-t, a Blue Gene szuperszámítógépek második generációját . 1 petaflops csúcsteljesítményre tervezték . A Blue Gene/P úgy konfigurálható, hogy 3 petaflop feletti csúcsteljesítményt érjen el. Ráadásul hétszer energiahatékonyabb, mint bármely más szuperszámítógép . A Blue Gene/P nagyszámú kis, kis teljesítményű chip felhasználásával készül, amelyek öt dedikált hálózaton keresztül kommunikálnak.
Minden Blue Gene/P chip négy PowerPC 450 processzormagból áll, amelyek órajele 850 MHz. Egy 2 vagy 4 GB-os RAM chip és hálózati interfészek alkotják a szuperszámítógép számítási csomópontját. 32 számítási csomópont egy kártyává (Compute Node kártya) van egyesítve, amelyhez 0-tól 2 I / O csomópontig lehet csatlakozni. A rendszertartó 32 ilyen kártyát tartalmaz.
Az 1 petaflops csúcsteljesítményű Blue Gene/P konfiguráció 72 rendszerállványt képvisel, amelyek 294 912 processzormagot tartalmaznak, és egy nagy sebességű optikai hálózatban egyesülnek. A Blue Gene/P konfiguráció 216 rack-re bővíthető összesen 884 736 processzormaggal, így 3 petaflops csúcsteljesítmény érhető el. A Blue Gene/P rendszer rack szabványos konfigurációja 4096 processzormagot tartalmaz [2] .
Egyetlen állvány
Állványok
Forgácslap
A Blue Gene/Q az architektúra harmadik generációja. A fejlesztők célja az volt, hogy 2011-ben elérjék a 20 petaflop mérföldkövet. A Blue Gene/Q a Blue Gene/L és /P architektúrák evolúciós folytatása, magasabb frekvencián fut, és teljesítmény floponként kevesebb energiát fogyaszt.
A BlueGene/Q egy többmagos, 64 bites rendszer PowerPC technológiára épülő chipen (hogy teljesen konkrét legyen, négyciklusú PowerPC A2 architektúra ). Mindegyik chip 18 magot tartalmaz, amelyek együttesen csaknem másfél milliárd (1,47) tranzisztort tesznek ki. A tényleges számításokhoz 16 mag szolgál, egy az operációs rendszert futtatja, végül az utolsó mag felel a teljes rendszer számításainak megbízhatóságáért. 1,6 GHz-es frekvencián minden chip 204,8 Gflops leadására képes, 55 watt energiát fogyasztva. Természetesen a memória és I/O műveletek vezérlői is a chip részét képezik. A Blue Gene/Q 4 lebegőpontos egységet tartalmaz, ami minden magon 4 műveletet ad egy órajelben.
Az IBM alkalmazottai szerint 18 magra van szükség a megbízhatósághoz. Ha hibát rögzítettek az egyik processzormagon, akkor letiltható és átvihető a „padra”. Valójában a "hibás" mag észlelése és újrakonfigurálása a gyártás vagy a rendszer összeszerelésének bármely szakaszában elvégezhető - nem csak akkor, amikor a chipet már tesztelik, hanem a korai szakaszban is, például a chip telepítésekor. egy számítástechnikai klaszterben. Az IBM Sequoia esetében körülbelül 100 000 zsetont használnak fel az áhított 20 petaflop eléréséhez. A processzorok hatalmas száma nagyon fontossá teszi a magok újratérképezésének feladatát: az IBM számításai szerint egy szuperszámítógép adott (100 000) számú chipjéhez átlagosan 3 hetente 1 processzor hibásodik meg.
Az is ismert, hogy a Blue Gene/Q nem szoftver, hanem hardver szinten támogatja a tranzakciós memóriát [9] .
A Blue Gene/Q költségét (kereskedelmi árakat használva) a The Register körülbelül 150 millió USD-ra becsüli petafloponként [10] .
A 2014. novemberi Top500-as listán szereplő tíz legerősebb szuperszámítógép közül 4 Blue Gene/Q platformra épül.
Sequoia szuperszámítógép a Livermore National Laboratory -ban
Mira szuperszámítógép az Argonne Nemzeti Laboratóriumban
A legfrissebb (2013. novemberi keltezésű) TOP500-as lista szerint a Blue Gene architektúrára épített szuperszámítógépek továbbra sem veszítik el pozícióikat.
Értékelés | Elhelyezkedés | Rendszer | Magok száma | Maximális sebesség (TFLOPS/s) | Csúcs sebesség (TFLOPS/s) | Energiafogyasztás (kW) |
---|---|---|---|---|---|---|
3 | Livermore IC (USA) | Sequoia – BlueGene/Q, Power BQC 16C 1,60 GHz, egyedi IBM | 1572864 | 17173.2 | 20132.7 | 7890 |
5 | Argonne NL (USA) | Mira - BlueGene/Q, Power BQC 16C 1,60 GHz, egyedi IBM | 786432 | 8586.6 | 10066.3 | 3945 |
nyolc | Jülich Kutatóközpont (Németország) | JUQUEEN - BlueGene/Q, Power BQC 16C 1,600 GHz, egyedi összekapcsolás IBM | 458752 | 5008.9 | 5872.0 | 2301 |
9 | Livermore IC (USA) | Vulcan – BlueGene/Q, Power BQC 16C 1,600 GHz, egyedi összekapcsolás IBM | 393216 | 4293,3 | 5033.2 | 1972 |
tizenöt | SCC Siena, Bologna (Olaszország) | Fermi - BlueGene/Q, Power BQC 16C 1,60 GHz, egyedi IBM | 163840 | 1788.9 | 2097.2 | 822 |
23 | Daresbury Laboratory, Warrington (Egyesült Királyság) | Blue Joule – BlueGene/Q, Power BQC 16C 1,60 GHz, egyedi IBM | 114688 | 1252.2 | 1468,0 | 575 |
27 | Edinburghi Egyetem (Egyesült Királyság) | DiRAC - BlueGene/Q, Power BQC 16C 1,60 GHz, egyedi IBM | 98304 | 1073,3 | 1258,3 | 493 |
38 | Rensselaer Polytechnic Institute (USA) | BlueGene/Q, Power BQC 16C 1,60 GHz, egyedi IBM | 81920 | 894.4 | 1048,6 | 411 |
45 | Tudományos Akadémia (Franciaország) | BlueGene/Q, Power BQC 16C 1,60 GHz, egyedi IBM | 65536 | 715.6 | 838,9 | 329 |
46 | EDF K+F vállalat, Párizs (Franciaország) | Zumbrota – BlueGene/Q, Power BQC 16C 1,60 GHz, egyedi IBM | 65536 | 715.6 | 838,9 | 329 |
47 | Svájci Nemzeti SKZ (Svájc) | EPFL Blue Brain IV – BlueGene/Q, Power BQC 16C 1,600 GHz, egyedi összekapcsolás IBM | 65536 | 715.6 | 838,9 | 329 |
48 | Victorian Life Sciences Computation Initiative (Ausztrália) | Avoca – BlueGene/Q, Power BQC 16C 1,60 GHz, egyedi IBM | 65536 | 715.6 | 838,9 | 329 |
57 | A nagyenergiájú gyorsítókat tanulmányozó szervezet (Japán) | SAKURA – BlueGene/Q, Power BQC 16C 1,60 GHz, egyedi IBM | 49152 | 536.7 | 629.1 | 247 |
58 | A nagyenergiájú gyorsítókat tanulmányozó szervezet (Japán) | HIMAWARI - BlueGene/Q, Power BQC 16C 1,600 GHz, egyedi összekapcsolás IBM | 49152 | 536.7 | 629.1 | 247 |
67 | Argonne NL (USA | Intrepid – Blue Gene/P Solution IBM | 163840 | 458.6 | 557.1 | 1260 |
77 | Livermore IC (USA) | Dawn – Blue Gene/P Solution IBM | 147456 | 415.7 | 501.4 | 1134 |
87 | Rochester IBM (USA) | BlueGene/Q, Power BQC 16C 1,60 GHz, egyedi IBM | 32768 | 357,8 | 419.4 | 164 |
88 | Rochester IBM (USA) | BlueGene/Q, Power BQC 16C 1,60 GHz, egyedi IBM | 32768 | 357,8 | 419.4 | 164 |
89 | Torontói Egyetem (Kanada) | BGQ - BlueGene/Q, Power BQC 16C 1,600 GHz, egyedi összekapcsolás IBM | 32768 | 357,8 | 419.4 | 164 |
216 | Argonne NL (USA) | Vesta - BlueGene/Q, Power BQC 16C 1,60 GHz, egyedi IBM | 16384 | 189,0 | 209.7 | 82 |
217 | Argonne NL (USA) | Cetus - BlueGene/Q, Power BQC 16C 1,600 GHz, egyedi összekapcsolás IBM | 16384 | 189,0 | 209.7 | 82 |
218 | Lausanne-i Szövetségi Műszaki Iskola (Svájc) | CADMOS BG/Q - BlueGene/Q, Power BQC 16C 1,600 GHz, egyedi IBM interconnect | 16384 | 189,0 | 209.7 | 82 |
219 | Rochester IBM (USA) | BlueGene/Q, Power BQC 16C 1,600 GHz, egyedi IBM interconnect | 16384 | 189,0 | 209.7 | 82 |
220 | IBM ITs im. Thomas Watson (USA) | BlueGene/Q, Power BQC 16C 1,60 GHz, egyedi IBM | 16384 | 189,0 | 209.7 | 82 |
221 | Interdiszciplináris Matematikai és Számítógépes Modellezési Központ, Varsói Egyetem (Lengyelország) | BlueGene/Q, Power BQC 16C 1,600 GHz, egyedi IBM interconnect | 16384 | 189,0 | 209.7 | 82 |
222 | Rochester IBM (USA) | BlueGene/Q, Power BQC 16C 1,60 GHz, egyedi IBM | 16384 | 189,0 | 209.7 | 82 |
A Blue Gene architektúrára épített leggyorsabb számítógép a Sequoia. Most a harmadik helyen áll, de 2012 júniusában a TOP500-as értékelés első sorát foglalta el. Energiahatékonyságban továbbra is megkerüli a vezető (17808 kW) és az ezüstérmes (8209) versenyzőt.