FLOPS

Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2021. december 30-án felülvizsgált verziótól ; az ellenőrzések 18 szerkesztést igényelnek .
Szuperszámítógép teljesítménye
Név év bukott
bukott 1941 10 0
kiloflop 1949 10 3
megaflops 1964 10 6
gigaflops 1987 10 9
teraflops 1997 10 12
petaflops 2008 10 15
exaflops 2022 10 18
zettaflops legkorábban 2030 [1] [2] 10 21
yottaflops n/a 10 24
xeraflops n/a 10 27

A FLOPS (más néven flops , flop / s , flops vagy flop / s ; az angol FL oating-point OP erations per S mozaikszó rövidítése , ejtése: flops ) egy nem rendszerszintű egység a számítógép teljesítményének mérésére , amely megmutatja, hány lebegőpontos másodpercenkénti műveletet hajt végre ez a számítógépes rendszer. Mivel a modern számítógépek teljesítménye magas, a flopokból származtatott mennyiségek, amelyeket SI előtagok felhasználásával képeznek, gyakoribbak .  

FLOP vagy FLOPS

Nincs egyetértés abban, hogy megengedett-e az angol FLOP szó használata .  FL oating point OP eration egyes számban (és olyan változatokban, mint a flop vagy flop ). Vannak, akik úgy gondolják, hogy a FLOP (flop) és a FLOPS (flop vagy flop / s) szinonimák, mások úgy vélik, hogy a FLOP csak a lebegőpontos műveletek száma (például egy adott program végrehajtásához szükséges), a FLOPS pedig a teljesítmény, másodpercenként bizonyos számú lebegőpontos művelet végrehajtásának képessége.

Flopok a teljesítmény mértékeként

A legtöbb egyéb teljesítménymutatóhoz hasonlóan ezt az értéket úgy határozzák meg, hogy a tesztszámítógépen egy tesztprogramot futtatnak, amely ismert számú művelettel megold egy problémát, és kiszámítja a megoldás idejét. Manapság a legnépszerűbb benchmark a LINPACK benchmark , különösen a szuperszámítógépek TOP500 -as rangsorában használt HPL .

A flopban történő teljesítménymérés egyik legfontosabb előnye, hogy ez a mértékegység bizonyos határokig abszolút értékként értelmezhető és elméletileg kiszámítható, míg a legtöbb népszerű mérték relatív, és csak összehasonlításban teszi lehetővé a tesztelt rendszer értékelését. számos másikkal. Ez a funkció lehetővé teszi különböző algoritmusok használatát a munka eredményeinek értékelésére , valamint a még nem létező vagy fejlesztés alatt álló számítási rendszerek teljesítményének értékelésére.

Alkalmazási határok

A látszólagos egyértelműség ellenére a valóságban a flopok meglehetősen gyenge teljesítménymérők, mivel már a definíciója is kétértelmű. A "lebegőpontos művelet" alatt nagyon sokféle fogalom rejtőzhet el, arról nem is beszélve, hogy ezekben a számításokban az operandusok szóhossza játszik jelentős szerepet , ami szintén nincs sehol megadva. Ezenkívül a flopokat számos olyan tényező befolyásolja, amelyek nem kapcsolódnak közvetlenül a számítási modul teljesítményéhez, mint például a kommunikációs csatornák sávszélessége a processzorkörnyezethez , a fő memória teljesítménye és a különböző memóriaegységek gyorsítótárának szinkronizálása. szinteket.

Mindez végső soron oda vezet, hogy az ugyanazon a számítógépen, különböző programokkal kapott eredmények jelentősen eltérhetnek; sőt minden újabb kísérletnél ugyanazt az algoritmust használva más-más eredmény érhető el. Részben ezt a problémát megoldja az egységes tesztprogramok (ugyanaz a LINPACK) használatáról szóló megállapodás az eredmények átlagolásával, de idővel a számítógépek képességei "kinövik" az elfogadott teszt kereteit, és elkezdenek mesterségesen adni. alacsony eredményeket ad, mivel nem használja a számítástechnikai eszközök legújabb képességeit. Egyes rendszerek esetében pedig az általánosan elfogadott tesztek egyáltalán nem alkalmazhatók, aminek következtében a teljesítményük kérdése nyitva marad.

Így 2006. június 24- én bemutatták a nagyközönségnek az MDGrape-3 szuperszámítógépet , amelyet a RIKEN ( Yokohama ) japán kutatóintézetben fejlesztettek ki , 1 petaflops elméleti rekordteljesítményével . Ez a számítógép azonban nem egy általános célú számítógép, és speciális feladatok egy szűk körének megoldására alkalmas, míg a szabványos LINPACK teszt az architektúra sajátosságai miatt nem végezhető el rajta.

Ezenkívül a modern videokártyák és játékkonzolok grafikus processzorai bizonyos feladatokon nagy teljesítményt mutatnak . Például a PlayStation 3 játékkonzol videoprocesszorának deklarált teljesítménye 192 gigaflop [3] , az Xbox 360 videógyorsítója pedig 240 gigaflop [3] , ami a húszéves szuperszámítógépekhez hasonlítható. Az ilyen magas értékeket az magyarázza, hogy a teljesítményt 32 bites számok jelzik [4] [5] , míg a szuperszámítógépeknél általában a 64 bites adatokon [6] [7] . Ezenkívül ezeket a set-top boxokat és videoprocesszorokat háromdimenziós grafikával végzett műveletekre tervezték, amelyek jól illeszkednek a párhuzamosításhoz, azonban ezek a processzorok nem képesek sok általános célú feladat elvégzésére, teljesítményük pedig nehezen értékelhető. a klasszikus LINPACK teszt [8] és nehezen összehasonlítható más rendszerekkel.

Csúcsteljesítmény

A processzor maximális flopszámának kiszámításához figyelembe kell venni, hogy a modern processzorok minden magjában több, párhuzamosan működő végrehajtó egységet tartalmaznak (beleértve a lebegőpontos műveletekhez használtakat is), és egynél több utasítást is képesek végrehajtani. óránként. Ezt az építészeti jellemzőt szuperskalárnak hívják, és először a CDC 6600 számítógépben jelent meg 1964-ben. A szuperskalár architektúrájú számítógépek tömeggyártása a Pentium processzor 1993-as kiadásával kezdődött. A 2000-es évek végén készült Intel Core 2 processzor szintén szuperskaláris, és 2 db 64 bites lebegőpontos egységet tartalmaz, amelyek 2 kapcsolódó műveletet (szorzást és azt követő összeadást, MAC ) képesek végrehajtani minden ciklusban, ami elméletileg lehetővé teszi a maximális teljesítmény elérését 4 művelet 1 ciklusonként minden magban [9] [10] [11] . Így egy 4 magos (Core 2 Quad) és 3,5 GHz-es frekvencián működő processzornál az elméleti teljesítményhatár 4x4x3,5 = 56 gigaflops, egy 2 magos (Core 2 Duo) processzornál pedig 3 GHz-es frekvencia - 2x4x3 = 24 gigaflops, ami jó összhangban van a LINPACK teszt gyakorlati eredményeivel.

AMD Phenom 9500 sAM2+ 2,2 GHz: 2200 MHz × 4 mag × 4⋅10 -3 = 35,2 GFlops
Core 2 Quad Q6600 esetén: 2400 MHz × 4 mag × 4⋅10 -3 = 38, 4 gaflop s.

Az újabb processzorok akár 8 (pl. Sandy and Ivy Bridge , 2011-2012, AVX) vagy akár 16 ( Haswell és Broadwell, 2013-2014, AVX2 és FMA3) 64 bites lebegőpontos műveletet hajthatnak végre órajelenként (minden magon) [11] . A jövőbeli processzorok várhatóan 32 műveletet fognak végrehajtani órajelenként (Intel Xeon Skylake, Xeon *v5, 2015, AVX512) [12]

Sandy and Ivy Bridge AVX-szel: 8 flop/órajel dupla pontosság [13] , 16 flop/óra szimpla pontosság
Intel Core i7 2700: / Intel Core i7 3770: 8*4*3900 MHz = 124,8 Gflops csúcs dupla pontosság, 16 *4 *3900 = 249,6 Gflops egyetlen precíziós csúcs.

Intel Haswell / Broadwell AVX2-vel és FMA3-mal: 16 flop/órajel kétszeres pontosság [13] ; 32 szimpla precíziós flop/óra
Intel Core i7 4770: 16*4*3900 MHz = 249,6 Gflops csúcs dupla pontosság, 32*4*3900 = 499,2 Gflops csúcs egyszeres pontosság.

A széles körű használat okai

A nagyszámú jelentős hiányosság ellenére a flopokat továbbra is sikeresen használják a teljesítmény értékelésére a LINPACK teszt eredményei alapján. Az ilyen népszerűség oka elsősorban az, hogy a flop, mint fentebb említettük, abszolút érték. Másodszor, a mérnöki és tudományos gyakorlat számos feladata végső soron lineáris algebrai egyenletrendszerek megoldásán múlik, és a LINPACK teszt az ilyen rendszerek megoldási sebességének mérésén alapul. Emellett a számítógépek túlnyomó többsége (beleértve a szuperszámítógépeket is) a klasszikus architektúra szerint, szabványos processzorokkal készül, ami nagy megbízhatósággal teszi lehetővé az általánosan elfogadott tesztek alkalmazását.

A különféle algoritmusokban amellett, hogy a processzormagban nagyszámú matematikai műveletet lehet végrehajtani, szükség lehet nagy mennyiségű adat átvitelére a memória alrendszeren keresztül, és teljesítményük emiatt erősen korlátozott lesz, pl. , mint a BLAS-könyvtárak 1. és 2. szintjén [11] . Azonban az olyan tesztekben használt algoritmusok, mint a LINPACK (BLAS 3. szint), magas adat-újrafelhasználási arányt mutatnak, a processzor és a memória közötti adatátviteli időnek kevesebb, mint 1/10-ét veszik igénybe, és általában 80-ig jellemző teljesítményt érnek el. -95%-a elméleti maximumnak.

Valódi rendszerek teljesítményének áttekintése

A LINPACK teszteredmények nagy szórása miatt a hozzávetőleges értékeket a különböző forrásokból származó információkon alapuló mutatók átlagolásával adjuk meg. A játékkonzolok és elosztott rendszerek (szűk specializációjú, és nem támogatják a LINPACK tesztet) teljesítményét referenciaként adjuk meg a fejlesztők által megadott számok szerint. Konkrét rendszerparaméterekkel pontosabb eredmények érhetők el, például a The Performance Database Server oldalon .

Szuperszámítógépek

Uno Kilo Mega Giga Tera Peta Exa

Személyi számítógép processzorok

Dupla pontosságú csúcsteljesítmény [27]

  • Zilog Z80 + AMD Am9512 matematikai társprocesszor , 3 MHz (1977-1980) ~ 1-2 kflop [28]
  • Intel 80486DX/DX2 (1990-1992) – akár 30-50 Mflop/s [29]
  • Intel Pentium 75–200 MHz (1996) – akár 75–200 Mflop/s [29] [30]
  • Intel Pentium III 450–1133 MHz (1999–2000) – akár 450–1113 Mflop/s [29] [30]
  • Intel Pentium III-S (2001) 1–1,4 GHz – akár 1–1,4 Gflop/s [30]
  • MCST Elbrus 2000 300 MHz (2008) – 2,4 Gflop/s
  • Intel Atom N270, D150 1,6 GHz (2008-2009) – akár 3,2 Gflop/s [29]
  • Intel Pentium 4 2,5–2,8 GHz (2004) – akár 5–5,6 Gflop/s [29]
  • MCST Elbrus-2C+ 500 MHz, 2 mag (2011) - 8 Gflop/s
  • AMD Athlon 64 X2 4200+ 2,2 GHz, 2 mag ( 2006 ) - 8,8 Gflops/s
  • Intel Core 2 Duo E6600 2,4 GHz 2 magos (2006) - 19,2 Gflop/s
  • MCST Elbrus-4S (1891VM8Ya, Elbrus v.3) 800 MHz, 4 mag (2014) – 25 Gflop/s [31]
  • Intel Core i3 -2350M 2,3 GHz 2 magos (2011) - 36,8 Gflop/s
  • Intel Core 2 Quad Q8300 2,5 GHz 4 magos (2008) - 40 Gflop/s
  • AMD Athlon II X4 640 3,0 GHz 4 magos ( 2010 ) - 48 Gflop/s
  • Intel Core i7-975 XE ( Nehalem ) 3,33 GHz 4 magos (2009) - 53,3 Gflop/s
  • AMD Phenom II X4 965 BE 3,4 GHz 4 magos ( 2009 ) - 54,4 Gflop/s
  • AMD Phenom II X6 1100T 3,3 GHz 6 magos (2010) – 79,2 Gflop/s
  • Intel Core i5 -2500K ( Sandy Bridge ), 3,3 GHz, 4 mag (2011) - 105,6 Gflop/s
  • MCST Elbrus-8S (Elbrus v.4) 1,3 GHz, 8 mag (2016) – 125 Gflop/s [32] [33]
  • AMD FX-8350 4 GHz-es 8 magos (2012) – 128 Gflop/s [34]
  • Intel Core i7 -4930K ( Ivy Bridge ) 3,4 GHz 6 magos (2013) - 163 GFlops/s
  • Loongson-3B1500 (MIPS64 ) , 1,5 GHz, 8 mag (2016) - akár 192 GFlop/s [35]
  • AMD Ryzen 7 1700X ( Zen ) 3,4 GHz-es 8 magos (2017) [36]  - 217 GFlop [37]
  • MCST Elbrus-8SV (Elbrus v.5) 1,5 GHz, 8 mag (2020 - terv) [38]  - 288 Gflop/s [39] [40]
  • IBM Power8 4,4 GHz, 12 mag (2013), 290 Gflop/s
  • Intel Core i7-5960X (Extreme Edition Haswell -E), 3,0 GHz, 8 mag (2014) - 384 Gflop/s (a gyakorlatban akár 350 Gflop/s is elérhető [41] )
  • Intel Core i9-9900k ( Coffee Lake ), 3,6 GHz, 8 mag (2018) [42]  – 460 Gflop [43]
  • AMD Ryzen 7 3700X ( Zen 2 ), 3,6 GHz, 8 mag (2019) [44]  - 460 GFlop [43]
  • MCST Elbrus-12S 2 GHz, 12 mag (2020 - terv) - 576 Gflop / s
  • MCST Elbrus-16S 2 GHz, 16 mag (2021 - terv) - 768 Gflop / s [45] .
  • AMD Ryzen 9 3950X ( Zen 2 ) 3,5 GHz 16 magos (2019) [46]  - 896 GFlops/s [47]
  • AMD EPYC 7H12 ( Zen 2 ), 3,3 GHz, 64 mag (2019) [48]  - 4,2 teraflop [49]

FLOP-ok száma óránként különböző architektúrákhoz

Számos processzor mikroarchitektúra esetén ismert az egy magon órajelenként végrehajtott lebegő műveletek maximális száma. Az alábbi lista a mikroarchitektúrák neveit tartalmazza, nem a processzorcsaládokat.

(single) - egyszeri pontosság; (dupla) – dupla pontosság [50]

  • Intel P5 és P6 (nincs ISE) + Pentium Pro és Pentium II = 1 (egy); 1 (dupla)
  • P6 (csak Pentium III) = 4 (egyetlen); 1 (dupla)
  • Bonnell ( Atom ) = 4 ( Single ); 1 ( dupla )
  • NetBurst = 4 (egyetlen); 2 (dupla)
  • Pentium M & Enhanced Pentium M = 4 (egyetlen); 2 (dupla)
  • Core, Penryn, Nehalem és Westmere = 8 (egyetlen); 4 (dupla)
  • Sandy Bridge & Ivy Bridge = 16 (egyes); 8 (dupla)
  • Haswell, Broadwell, Skylake, Kaby Lake és Coffee Lake = 32 (egyes); 16 (dupla)
  • Skylake-X, Skylake-SP, Cascade Lake-X (Xeon Gold & Platinum) = 64 (egyes); 32 (kettős) [51] [52]
  • Bonnell, Saltwell, Silvermont és Airmont = 6 (egyetlen); 1,5 (dupla)
  • MIC ("Knights Corner" Xeon Phi) = 32 (egyetlen); 16 (dupla)
  • MIC ("Knights Landing" Xeon Phi) = 64 (egyetlen); 32 (dupla) [51]
  • AMD K5 és K6 = 0,5 (egyetlen); 0,5 (dupla)
  • K6-2 & K6-III = 4 (egyes); 0,5 (dupla)
  • K7 = 4 (egyetlen); ? (kettős)
  • K8 = 4 (egyetlen); 2 (dupla)
  • K10/Csillag = 8 (egyetlen); 4 (dupla)
  • Husky = 8 (egyetlen); 4 (dupla)
  • Bulldózer, Piledriver, gőzhenger és kotró (magpáronként összesen – [53] modul ) = 16 (egyetlen); 8 (dupla)
  • Bobcat = 4 (egyetlen); 1,5 (dupla)
  • Jaguar, Puma és Puma+ = 8 (egyetlen); 3 (dupla)
  • Zen, Zen+ = 16 (egyetlen); 8 (dupla)
  • Zen 2 = 32 (egyetlen); 16 (dupla)
  • MCST Elbrus 2000 (E2K) = 16 (egyetlen); 8 (dupla) [54] [55]
  • Elbrus 3. verzió = 16 (egyetlen); 8 (dupla)
  • Elbrus 4-es verzió = 24 (egyetlen); 12 (dupla) [56] [57]
  • Elbrus 5-ös verzió = 48 (egyetlen); 24 (kettős) [58] [59]

Zsebszámítógép-processzorok

  • Samsung S3C2440 400 MHz-es processzoron alapuló PDA ( ARM9 architektúra ) - 1,3 megaflops
  • Intel XScale PXA270 520 MHz - 1,6 megaflops
  • Intel XScale PXA270 624 MHz - 2 megaflops
  • Samsung Exynos 4210 2x1600 MHz - 84 megaflops
  • Apple A6  – 645 megaflop (LINPACK becslés)
  • Apple A7  – 833 megaflop (LINPACK becslés) [60]
  • Apple A8  – 1,4 gigaflop [61]
  • Apple A10  – 365 gigaflop (fp32), 91 gigaflop (fp64) [62]
  • Apple A14  – 824 gigaflop (fp32), 206 gigaflop (fp64) [62]

Elosztott rendszerek

Játékkonzolok

Lebegőpontos műveletek 32 bites adatokon

GPU-k

Elméleti teljesítmény (FMA; gigaflops):

GPU Kibocsátási év Folyamat technológia Gigaflops, 32 bites számítástechnikához Gigaflops, 64 bites számítástechnikához Forrás
Geforce RTX 2080 Ti (TU102) 2018 12 nm 13450 420.2 [83]
GeForce GTX 1080 (GP104) 2016 16 nm 8873 (Boost) 277 (Boost)
GeForce GTX 780 Ti (GK110-425-B1) 2013 28 nm 5046 210
GeForce GTX 680 (GK104) 2012 28 nm 3090.4 128.8
Radeon HD 7970 (Tahiti) 2012 28 nm 3789 947-1024 [84]
Radeon HD 6990 (2xCayman) 2011 40 nm 2x2550 = 5100 2x637 = 1274 [84]
Radeon HD 5970 (2xRV870) 2009 40 nm 2x2320 = 4640 2x464 = 928 [84]
Radeon R9 Fury X (Fuji) 2015 28 nm 8602 538 [84]

Ember és számológép

A számológép nem véletlenül esik egy kategóriába az emberrel, mert bár processzort, memóriát, beviteli-kimeneti eszközöket tartalmazó elektronikus eszközről van szó, működési módja alapvetően eltér a számítógépétől. A számológép egyik műveletet a másik után olyan sebességgel hajtja végre, ahogyan azt az emberi kezelő kéri. A műveletek között eltelt időt az emberi képességek határozzák meg, és jelentősen meghaladja a közvetlenül a számításokra fordított időt. Azt mondhatjuk, hogy a legegyszerűbb hagyományos zsebszámológépek átlagos teljesítménye körülbelül 10 flop vagy több.

Ha nem veszünk kivételes eseteket (lásd fenomenális számláló ), akkor egy hétköznapi ember csak tollat ​​és papírt használva nagyon lassan és gyakran nagy hibával hajtja végre a lebegőpontos műveleteket , így az ember, mint számítástechnikai eszköz teljesítményéről beszél. , olyan mértékegységeket kell használni, mint a milliflop, sőt a mikroflop.

Lásd még

Jegyzetek

  1. Új csavar archiválva : 2013. szeptember 11., a Wayback Machine Byrd Kiwi , PC World, 2012. 07. szám: "Ha a szuperszámítógépek jelenlegi fejlődési üteme folytatódik, akkor a következő mérföldkő a teljesítményben 1 exaflop vagy egy kvintilló (10) lesz ^18) művelet/másodperc, várhatóan 2019-re érik el ... úgy gondolják, hogy egy zettaflops (10^21, vagyis sextillió művelet) teljesítményű számítógépet 2030 körül meg lehet építeni. a következő számítási határhoz - yottaflops (10^ 24) és xeraflops (10^27)."
  2. Peta, exa, zetta, yotta... Archivált : 2013. december 3., a Wayback Machine Byrd Kiwi , Computerra, Dátum: 2008. július 16.: "Ezt a határvonalat a zettaflops (10^21), a yottaflops (10^) követi 24 ) és xeraflops (10^27).
  3. 1 2 3 PLAYSTATION 3のグラフィックスエンジン RSX . Hozzáférés dátuma: 2016. december 30. Az eredetiből archiválva : 2016. szeptember 17.
  4. http://ixbtlabs.com/articles3/video/rv670-part1-page1.html Archiválva : 2010. január 13. a Wayback Machine lebegőpontos ALU-kban .. támogatja az FP32 pontosságát
  5. Archivált másolat (a hivatkozás nem elérhető) . Letöltve: 2009. augusztus 17. Az eredetiből archiválva : 2009. július 5..   ezek egyetlen precíziós GPU csúcsszámok
  6. Archivált másolat (a hivatkozás nem elérhető) . Letöltve: 2009. augusztus 17. Az eredetiből archiválva : 2009. október 15.   A HPL egy olyan szoftvercsomag, amely egy sűrű lineáris rendszert dupla pontossággal (64 bit) old meg.
  7. [1] Archivált : 2009. szeptember 1. a Wayback Machine -nél [2] Archivált : 2009. szeptember 1., a Wayback Machine HPL Gyakorisági bejegyzései a pontosság kedvéért
  8. A 32 bites FP aritmetika teljesítményének kihasználása a 64 bites pontosság elérésében (Iteratív finomítás újralátogatása lineáris rendszerek esetén) Archiválva : 2008. december 4. a Wayback Machine -nél
  9. SSE, SSE2 és SSE3 maximális áteresztőképesség: 4 Flop / ciklus . Letöltve: 2017. szeptember 28. Az eredetiből archiválva : 2012. március 16..
  10. A nettó eredmény az, hogy mostantól 2 DP összeadást és 2 DP szorzást dolgozhat fel órajelenként, vagy 4 FLOPS-ot ciklusonként. (DP) . Hozzáférés dátuma: 2010. július 20. Az eredetiből archiválva : 2010. május 24.
  11. 1 2 3 Jack Dongarra. Adaptive Linear Solvers and Eigensolvers  (angol)  (nem elérhető link) . Argonne képzési program az extrém méretű számítástechnikáról . Argonne National Laboratory (2014. augusztus 13.). Letöltve: 2015. április 13. Az eredetiből archiválva : 2016. április 24..
  12. Jack Dongarra, Peak Performance - Per Core Archiválva : 2015. december 22., a Wayback Machine / A Look at High Performance Computing,  2015-10-15
  13. 1 2 http://sites.utexas.edu/jdm4372/2016/11/22/sc16-invited-talk-memory-bandwidth-and-system-balance-in-hpc-systems/ Archiválva : 2017. február 2. a Waybacken Gép http://sites.utexas.edu/jdm4372/files/2016/11/Slide20.png Archiválva 2017. február 2-án a Wayback Machine -nél
  14. Számítási teljesítmény: az első PC-től a modern szuperszámítógépig . Letöltve: 2020. március 19. Az eredetiből archiválva : 2020. március 19.
  15. A numerikus időjárás-előrejelzés megjelenése: Richardsontól az ENIAC -ig Archiválva : 2013. december 2. a Wayback Machine -nél , 2011
  16. Az IBM megalkotta a világ legerősebb szuperszámítógépét _ _ _ _ 
  17. T-PLATFORM A-CLUSTER, XEON E5-2697V3 14C 2,6 GHZ, INFINIBAND FDR, NVIDIA K40M Archiválva : 2014. november 29. a Wayback Machine -nél // Top 500, 2014. november
  18. A TOP500 szuperszámítógépek új értékelése A Wayback Machine 2014. november 21-i archív példánya // Computerra, 2014. november 18.: "... egy A-osztályú klaszter, amelyet a T-Platforms hozott létre a Moszkvai Állami Egyetem Kutatási Számítástechnikai Központja számára. "
  19. Az MSU új szuperszámítógépe bekerült a 2016. november 17-i Top500 archív példányba a Wayback Machine -nél // Data Center World, Open Systems, 2014.11.19.: „Az új MSU szuperszámítógépnek csak öt számítási rackje van 1280 csomóponttal 14 magos Intel Xeon E5 processzorok -2697 v3 és NVIDIA Tesla K40 gyorsítók több mint 80 TB teljes RAM kapacitással. … Egy szuperszámítógép minden rackje körülbelül 130 kW-ot fogyaszt.”
  20. Christofari – NVIDIA DGX-2, Xeon Platinum 8168 24C 2,7 GHz, Mellanox InfiniBand EDR, NVIDIA Tesla V100 Archivált 2020. január 3-án a Wayback Machine -nél  – top500, 2019-11
  21. Videóbemutató a Christofari szuperszámítógépről . Sbercloud. Letöltve: 2019. december 27. Az eredetiből archiválva : 2019. december 17.
  22. A Sberbank megalkotta Oroszország legerősebb szuperszámítógépét . RIA Novosti (20191108T1123+0300Z). Hozzáférés dátuma: 2019. november 8. Az eredetiből archiválva : 2019. november 8.
  23. ↑ A japán szuperszámítógép jobban teljesít , mint a 2011. november 5-én kelt kínai archív példány a Wayback Machine -nél  (orosz)
  24. Lawrence Livermore Sequoia szuperszámítógép-tornyai felülmúlják a többieket a legutóbbi TOP500-as listán , archiválva : 2017. szeptember 11., a Wayback Machine , TOP500 hírcsapat | 2012.  július 16
  25. Agam Shah (IDG News), a Titan szuperszámítógép 20 petaflop feldolgozási teljesítményt ért el. Archiválva : 2017. július 3. a Wayback Machine -nél // PCWorld, Computers,  2012. október 29.
  26. A Tianhe-2 ígéretes szolgáltatásai archiválva 2014. november 28-án a Wayback Machine -nél // Open Systems, 2013. 08. szám
  27. A legtöbb processzor egyszeri precíziós teljesítménye pontosan kétszerese a feltüntetett értékeknek.
  28. 1200-tól 4900 processzorciklusig 1 dupla pontosságú utasítás végrehajtásához típusuktól függően az egyszeri precíziós műveletek körülbelül 10-szer gyorsabban hajtottak végre: https://datasheetspdf.com/pdf/1344616/AMD/Am9512/1 Archivált másolat december 26-tól , 2019 a Wayback Machine -nél (4. oldal)
  29. 1 2 3 4 5 Ryan Crierie. http://www.alternatewars.com/BBOW/Computing/Computing_Power.htm  (angol) . Alternate Wars (2014. március 13.). Hozzáférés időpontja: 2015. január 23. Az eredetiből archiválva : 2015. január 23.
  30. 1 2 3 Jack J. Dongarra. Különféle számítógépek teljesítménye szabványos lineáris egyenletek szoftverrel  ( 2014. június 15.). Letöltve: 2015. január 23. Az eredetiből archiválva : 2015. április 17..
  31. Elbrus-4C mikroprocesszor (elérhetetlen link) . MCST. Letöltve: 2015. június 28. Az eredetiből archiválva : 2014. június 4.. 
  32. "Elbrus-8S" központi processzor (TVGI.431281.016) . JSC "MCST" . Letöltve: 2017. december 16. Az eredetiből archiválva : 2018. március 30.
  33. Hat 64 bites FMAC blokk magonként: 8 x 1,3 x 6 x 2 = 124,8 GFlops/s dupla pontosságú csúcsteljesítmény
  34. Két 128 bites FMAC blokk minden modulban, amelyek egy pár magot egyesítenek, amelyek 4 GHz-es frekvencián működnek: 4x4x2x2x128/64 = 128 GFlops / s csúcsteljesítmény dupla pontosságú számításokban
  35. Alex Voica. Az új MIPS64-alapú Loongson processzorok áttörik a teljesítménykorlátot  (angol)  (lefelé irányuló kapcsolat) (2015. szeptember 3.). Letöltve: 2017. február 4. Az eredetiből archiválva : 2017. február 5..
  36. Archivált másolat . Letöltve: 2019. december 26. Az eredetiből archiválva : 2019. június 27.
  37. Magonként két 128 bites FMAC blokk: 8 x 3,4 x 2 x 2 x 128/64 = 217,6 Gflops/s dupla pontosságú csúcsteljesítmény
  38. "Elbrus-8SV" mikroprocesszor (TVGI.431281.023) . JSC "MCST" . Hozzáférés dátuma: 2017. december 16. Az eredetiből archiválva : 2019. december 27.
  39. Első Elbrus-8SV . Letöltve: 2017. szeptember 23. Az eredetiből archiválva : 2017. szeptember 23.
  40. Hat 128 bites FMAC blokk magonként: 8 x 1,5 x 6 x 2 x 128/64 = 288 Gflop dupla pontosságú csúcsteljesítmény
  41. Linpack teljesítmény Haswell E (Core i7 5960X és 5930K) – Puget Custom Computers . Hozzáférés dátuma: 2015. január 15. Az eredetiből archiválva : 2015. március 27.
  42. Intel® Core™ i9-9900K processzor (16 MB gyorsítótár, akár 5,00 GHz) Termékspecifikációk . Letöltve: 2019. december 26. Az eredetiből archiválva : 2021. március 5..
  43. 1 2 Két 256 bites FMAC blokk magonként: 8 x 3,6 x 2 x 2 x 256/64 = 460 GFlop/s
  44. Archivált másolat . Letöltve: 2019. december 26. Az eredetiből archiválva : 2019. június 27.
  45. Elbrus 16C mikroprocesszor (megérkezett az első műszaki minták) . Letöltve: 2020. január 30. Az eredetiből archiválva : 2020. január 4..
  46. Archivált másolat . Letöltve: 2019. december 26. Az eredetiből archiválva : 2019. július 24.
  47. Magonként két 256 bites FMAC blokk: 16 x 3,5 x 2 x 2 x 256/64 = 896 GFlop/s
  48. ↑ AMD EPYC 7H12 specifikációi  . techpowerup . Hozzáférés időpontja: 2021. október 10.
  49. Az AMD bemutatja legerősebb, 64 magos processzorát . iXBT.com . Letöltve: 2021. október 10. Az eredetiből archiválva : 2021. október 10.
  50. architektúra – Az egyszeres pontosságú adatok és a duplapontosságú adatcsúcsteljesítmény kiszámítása Intel(R) Core™ i7-3770 CPU esetén – Stack Overflow . Letöltve: 2017. október 15. Az eredetiből archiválva : 2015. október 22..
  51. 1 2 Az Intel® Advanced Vector Extensions 512 (Intel® AVX-512) áttekintése . Letöltve: 2019. december 24. Az eredetiből archiválva : 2019. december 24.
  52. A ciklusonként megadott számú utasítást csak ezen architektúrák régebbi képviselői tudják végrehajtani, a 6xxx sorozattól kezdve Xeon Platinum és Xeon Gold marketing néven árusítva, amelyek magjában két 512 bites FMAC blokk található az AVX végrehajtásához. -512 utasításokat. Minden junior modellnél: Xeon Bronze, Xeon Silver és Xeon Gold 5ххх, az egyik FMAC blokk le van tiltva, ezért a lebegőpontos utasítások maximális végrehajtási sebessége 2-szeresére csökken.
  53. A lebegőpontos feldolgozóegység (FPU) modulonként meg van osztva – egy processzormag pár. Ha a lebegő műveleteket egyidejűleg hajtják végre mindkét magon, akkor ez meg van osztva közöttük.
  54. Elbrus / Elbrus építészetének rövid leírása . Letöltve: 2019. december 26. Az eredetiből archiválva : 2017. június 11.
  55. Ez a mikroarchitektúra a VLIW osztályba tartozik, és 6 párhuzamos csatornával rendelkezik az utasítások végrehajtására, amelyek közül 4 64 bites FMAC típusú lebegőpontos egységekkel van felszerelve .
  56. Elbrus-8S (TVGI.431281.016) / Elbrus-8S1 (TVGI.431281.025) - központi processzor 1891VM10Ya / 1891VM028 / MCST . Letöltve: 2017. december 16. Az eredetiből archiválva : 2018. március 30.
  57. Az architektúra 4. generációjában már mind a 6 utasítás-végrehajtási csatornán elérhetőek a 64 bites FMAC blokkok.
  58. Elbrus-8SV (TVGI.431281.023) - központi processzor 1891VM12YA / MCST . Hozzáférés dátuma: 2017. december 16. Az eredetiből archiválva : 2019. december 27.
  59. Az architektúra 5. generációjában az összes FMAC blokk bitmélységét 64-ről 128-ra növelték.
  60. Szergej Uvarov. Az Apple iPhone 5s részletes áttekintése és tesztelése . IXBT.com (2013. szeptember 23.). Archiválva az eredetiből 2013. október 2-án.
  61. Apple A8 SoC - NotebookCheck.net Tech . Letöltve: 2015. január 15. Az eredetiből archiválva : 2014. december 20.
  62. 1 2 Apple A10 – Összehasonlító specifikációk és CPU-benchmarkok . Letöltve: 2022. január 22. Az eredetiből archiválva : 2022. január 22.
  63. [3] Archivált : 2017. augusztus 30., a Wayback Machine // Gizmodo, 5/13/13: "Mivel a Bitcoin-bányászok valójában egyszerűbb matematikai műveleteket végeznek (egész műveletek), egy kis (rendetlen) konverziót kell végrehajtania, hogy megkapja hogy FLOPS. .. az új ASIC bányászok – a gépek .. nem csinálnak mást, csak bitcoinokat bányásznak – még más jellegű műveleteket sem tudnak végrehajtani, teljesen kimaradnak a teljességből.
  64. [4] Archivált : 2013. december 3. a Wayback Machine -nél // SlashGear, 2013. május 13.: "A bitcoin bányászat technikailag nem FLOPS-szal működik, hanem egész számokkal történik, így a számokat FLOPS-ra konvertálják a legtöbb esetben az emberek többet tudnak érteni. Mivel az átalakítási folyamat kissé furcsa, egyes szakértők hibásnak minősítették a bányászati ​​​​adatokat."
  65. [5] Archivált 2013. november 27-én a Wayback Machine -nél // ExtremeTech: "Mivel a Bitcoin bányászata nem támaszkodik lebegőpontos műveletekre, ezek a becslések alternatív költségeken alapulnak. Most, hogy már az alapoktól kezdve olyan alkalmazás-specifikus integrált áramkörökkel (ASIC-kkel) rendelkező hardverünk van, amelyek a Bitcoinok bányászatán kívül mást nem csinálnak, ezek a becslések még homályosabbá válnak.”
  66. [6] Archivált 2013. december 3. a Wayback Machine -nél // CoinDesk : "Kettő, a hash-ek flopokká konvertálására használt becslések (ami hashenként körülbelül 12 700 flopot eredményez) 2011-re vonatkoznak, mielőtt az ASIC-eszközök a bitcoinbányászat normájává váltak. Az ASIC-k egyáltalán nem kezelik a flopokat, ezért a jelenlegi összehasonlítás nagyon durva."
  67. [7] Archivált : 2013. december 3. a Wayback Machine // VR-Zone-ban: "1 hash = 12,7K FLOPS konverziós arányt használnak a hálózati hozzájárulás általános sebességének meghatározásához. A becslés 2011-ben készült, a kizárólag bitcoinbányászathoz tervezett ASIC hardver létrehozása előtt. Az ASIC egyáltalán nem használ lebegőpontos műveleteket, így a becslésnek nincs valós jelentése az ilyen hardvereknél.”
  68. Bitcoin Watch , archiválva 2011-04-08: "Network Hashrate TFLOP/s 8007"
  69. BOINC Archiválva : 2010. szeptember 19.
  70. BOINCstats:SETI@home Archiválva az eredetiből 2012. május 3-án.
  71. BOINCstats:Einstein@Home . Letöltve: 2012. április 16. Az eredetiből archiválva : 2012. február 21..
  72. 12 Konzolspecifikáció . _ Letöltve: 2017. december 7. Az eredetiből archiválva : 2021. április 10.
  73. PSP specifikációk Revealed Feldolgozási sebesség, sokszög sebesség és még sok más. Archivált : 2009. július 28., a Wayback Machine // IGN Entertainment, 2003. "PSP CPU CORE...FPU, VFPU (Vector Unit) @ 2.6GFlops"
  74. Frissítés: Hány FLOPS van a játékkonzolokon? Archivált : 2010. november 9. a Wayback Machine -nél // TG Daily, 2008. május 26.
  75. Cell Broadband Engine Architecture és első megvalósítása . IBM developerWorks (2005. november 29.). Letöltve: 2006. április 6. Az eredetiből archiválva : 2009. január 24..
  76. A 32 bites lebegőpontos aritmetika teljesítményének kihasználása a 64 bites pontosság eléréséhez . Tennessee Egyetem (2005. július 31.). Letöltve: 2011. február 11. Az eredetiből archiválva : 2011. március 18..
  77. Philip Wong . Xbox One vs. PS4 vs. Wii U [frissítés ]  (angol) , CNET Asia, Games & Gear (2013. május 22.). Az eredetiből archiválva: 2013. december 3. Letöltve: 2013. november 29.
  78. Anand Lal Shimpi. Az Xbox One: Hardverelemzés és összehasonlítás a PlayStation 4-hez  (angol) . Anandtech (2013. május 22.). Archiválva az eredetiből 2013. október 2-án.
  79. PS4 specifikáció (a hivatkozás nem elérhető) . Letöltve: 2013. június 22. Az eredetiből archiválva : 2013. június 20. 
  80. Műszaki adatok . Play Station. Letöltve: 2018. december 14. Az eredetiből archiválva : 2019. május 4..
  81. ↑ A Sony bemutatta az új PlayStation specifikációkat . RIA Novosti (20200318T2333+0300). Letöltve: 2020. március 20. Az eredetiből archiválva : 2020. március 20.
  82. Mit várhat a  játék következő generációjától . Xbox Wire (2020. február 24.). Letöltve: 2020. február 24. Az eredetiből archiválva : 2020. február 24.
  83. NVIDIA GeForce RTX 2080 Ti Műszaki adatok | TechPowerUp GPU-adatbázis
  84. 1 2 3 4 Összehasonlító táblázatok AMD (ATI) Radeon grafikus kártyákhoz . Letöltve: 2012. február 24. Az eredetiből archiválva : 2012. február 28..

Linkek