FLOPS
Az oldal jelenlegi verzióját még nem ellenőrizték tapasztalt közreműködők, és jelentősen eltérhet a 2021. december 30-án felülvizsgált
verziótól ; az ellenőrzések 18 szerkesztést igényelnek .
A FLOPS (más néven flops , flop / s , flops vagy flop / s ; az angol FL oating-point OP erations per S mozaikszó rövidítése , ejtése: flops ) egy nem rendszerszintű egység a számítógép teljesítményének mérésére , amely megmutatja, hány lebegőpontos másodpercenkénti műveletet hajt végre ez a számítógépes rendszer. Mivel a modern számítógépek teljesítménye magas, a flopokból származtatott mennyiségek, amelyeket SI előtagok felhasználásával képeznek, gyakoribbak .
FLOP vagy FLOPS
Nincs egyetértés abban, hogy megengedett-e az angol FLOP szó használata . FL oating point OP eration egyes számban (és olyan változatokban, mint a flop vagy flop ). Vannak, akik úgy gondolják, hogy a FLOP (flop) és a FLOPS (flop vagy flop / s) szinonimák, mások úgy vélik, hogy a FLOP csak a lebegőpontos műveletek száma (például egy adott program végrehajtásához szükséges), a FLOPS pedig a teljesítmény, másodpercenként bizonyos számú lebegőpontos művelet végrehajtásának képessége.
Flopok a teljesítmény mértékeként
A legtöbb egyéb teljesítménymutatóhoz hasonlóan ezt az értéket úgy határozzák meg, hogy a tesztszámítógépen egy tesztprogramot futtatnak, amely ismert számú művelettel megold egy problémát, és kiszámítja a megoldás idejét. Manapság a legnépszerűbb benchmark a LINPACK benchmark , különösen a szuperszámítógépek TOP500 -as rangsorában használt HPL .
A flopban történő teljesítménymérés egyik legfontosabb előnye, hogy ez a mértékegység bizonyos határokig abszolút értékként értelmezhető és elméletileg kiszámítható, míg a legtöbb népszerű mérték relatív, és csak összehasonlításban teszi lehetővé a tesztelt rendszer értékelését. számos másikkal. Ez a funkció lehetővé teszi különböző algoritmusok használatát a munka eredményeinek értékelésére , valamint a még nem létező vagy fejlesztés alatt álló számítási rendszerek teljesítményének értékelésére.
Alkalmazási határok
A látszólagos egyértelműség ellenére a valóságban a flopok meglehetősen gyenge teljesítménymérők, mivel már a definíciója is kétértelmű. A "lebegőpontos művelet" alatt nagyon sokféle fogalom rejtőzhet el, arról nem is beszélve, hogy ezekben a számításokban az operandusok szóhossza játszik jelentős szerepet , ami szintén nincs sehol megadva. Ezenkívül a flopokat számos olyan tényező befolyásolja, amelyek nem kapcsolódnak közvetlenül a számítási modul teljesítményéhez, mint például a kommunikációs csatornák sávszélessége a processzorkörnyezethez , a fő memória teljesítménye és a különböző memóriaegységek gyorsítótárának szinkronizálása. szinteket.
Mindez végső soron oda vezet, hogy az ugyanazon a számítógépen, különböző programokkal kapott eredmények jelentősen eltérhetnek; sőt minden újabb kísérletnél ugyanazt az algoritmust használva más-más eredmény érhető el. Részben ezt a problémát megoldja az egységes tesztprogramok (ugyanaz a LINPACK) használatáról szóló megállapodás az eredmények átlagolásával, de idővel a számítógépek képességei "kinövik" az elfogadott teszt kereteit, és elkezdenek mesterségesen adni. alacsony eredményeket ad, mivel nem használja a számítástechnikai eszközök legújabb képességeit. Egyes rendszerek esetében pedig az általánosan elfogadott tesztek egyáltalán nem alkalmazhatók, aminek következtében a teljesítményük kérdése nyitva marad.
Így 2006. június 24- én bemutatták a nagyközönségnek az MDGrape-3 szuperszámítógépet , amelyet a RIKEN ( Yokohama ) japán kutatóintézetben fejlesztettek ki , 1 petaflops elméleti rekordteljesítményével . Ez a számítógép azonban nem egy általános célú számítógép, és speciális feladatok egy szűk körének megoldására alkalmas, míg a szabványos LINPACK teszt az architektúra sajátosságai miatt nem végezhető el rajta.
Ezenkívül a modern videokártyák és játékkonzolok grafikus processzorai bizonyos feladatokon nagy teljesítményt mutatnak . Például a PlayStation 3 játékkonzol videoprocesszorának deklarált teljesítménye 192 gigaflop [3] , az Xbox 360 videógyorsítója pedig 240 gigaflop [3] , ami a húszéves szuperszámítógépekhez hasonlítható. Az ilyen magas értékeket az magyarázza, hogy a teljesítményt 32 bites számok jelzik [4] [5] , míg a szuperszámítógépeknél általában a 64 bites adatokon [6] [7] . Ezenkívül ezeket a set-top boxokat és videoprocesszorokat háromdimenziós grafikával végzett műveletekre tervezték, amelyek jól illeszkednek a párhuzamosításhoz, azonban ezek a processzorok nem képesek sok általános célú feladat elvégzésére, teljesítményük pedig nehezen értékelhető. a klasszikus LINPACK teszt [8] és nehezen összehasonlítható más rendszerekkel.
Csúcsteljesítmény
A processzor maximális flopszámának kiszámításához figyelembe kell venni, hogy a modern processzorok minden magjában több, párhuzamosan működő végrehajtó egységet tartalmaznak (beleértve a lebegőpontos műveletekhez használtakat is), és egynél több utasítást is képesek végrehajtani. óránként. Ezt az építészeti jellemzőt szuperskalárnak hívják, és először a CDC 6600 számítógépben jelent meg 1964-ben. A szuperskalár architektúrájú számítógépek tömeggyártása a Pentium processzor 1993-as kiadásával kezdődött. A 2000-es évek végén készült Intel Core 2 processzor szintén szuperskaláris, és 2 db 64 bites lebegőpontos egységet tartalmaz, amelyek 2 kapcsolódó műveletet (szorzást és azt követő összeadást, MAC ) képesek végrehajtani minden ciklusban, ami elméletileg lehetővé teszi a maximális teljesítmény elérését 4 művelet 1 ciklusonként minden magban [9] [10] [11] . Így egy 4 magos (Core 2 Quad) és 3,5 GHz-es frekvencián működő processzornál az elméleti teljesítményhatár 4x4x3,5 = 56 gigaflops, egy 2 magos (Core 2 Duo) processzornál pedig 3 GHz-es frekvencia - 2x4x3 = 24 gigaflops, ami jó összhangban van a LINPACK teszt gyakorlati eredményeivel.
AMD Phenom 9500 sAM2+ 2,2 GHz: 2200 MHz × 4 mag × 4⋅10 -3 = 35,2 GFlops
Core 2 Quad Q6600 esetén: 2400 MHz × 4 mag × 4⋅10 -3 = 38, 4 gaflop s.
Az újabb processzorok akár 8 (pl. Sandy and Ivy Bridge , 2011-2012, AVX) vagy akár 16 ( Haswell és Broadwell, 2013-2014, AVX2 és FMA3) 64 bites lebegőpontos műveletet hajthatnak végre órajelenként (minden magon) [11] . A jövőbeli processzorok várhatóan 32 műveletet fognak végrehajtani órajelenként (Intel Xeon Skylake, Xeon *v5, 2015, AVX512) [12]
Sandy and Ivy Bridge AVX-szel: 8 flop/órajel dupla pontosság [13] , 16 flop/óra szimpla pontosság
Intel Core i7 2700: / Intel Core i7 3770: 8*4*3900 MHz = 124,8 Gflops csúcs dupla pontosság, 16 *4 *3900 = 249,6 Gflops egyetlen precíziós csúcs.
Intel Haswell / Broadwell AVX2-vel és FMA3-mal: 16 flop/órajel kétszeres pontosság [13] ; 32 szimpla precíziós flop/óra
Intel Core i7 4770: 16*4*3900 MHz = 249,6 Gflops csúcs dupla pontosság, 32*4*3900 = 499,2 Gflops csúcs egyszeres pontosság.
A széles körű használat okai
A nagyszámú jelentős hiányosság ellenére a flopokat továbbra is sikeresen használják a teljesítmény értékelésére a LINPACK teszt eredményei alapján. Az ilyen népszerűség oka elsősorban az, hogy a flop, mint fentebb említettük, abszolút érték. Másodszor, a mérnöki és tudományos gyakorlat számos feladata végső soron lineáris algebrai egyenletrendszerek megoldásán múlik, és a LINPACK teszt az ilyen rendszerek megoldási sebességének mérésén alapul. Emellett a számítógépek túlnyomó többsége (beleértve a szuperszámítógépeket is) a klasszikus architektúra szerint, szabványos processzorokkal készül, ami nagy megbízhatósággal teszi lehetővé az általánosan elfogadott tesztek alkalmazását.
A különféle algoritmusokban amellett, hogy a processzormagban nagyszámú matematikai műveletet lehet végrehajtani, szükség lehet nagy mennyiségű adat átvitelére a memória alrendszeren keresztül, és teljesítményük emiatt erősen korlátozott lesz, pl. , mint a BLAS-könyvtárak 1. és 2. szintjén [11] . Azonban az olyan tesztekben használt algoritmusok, mint a LINPACK (BLAS 3. szint), magas adat-újrafelhasználási arányt mutatnak, a processzor és a memória közötti adatátviteli időnek kevesebb, mint 1/10-ét veszik igénybe, és általában 80-ig jellemző teljesítményt érnek el. -95%-a elméleti maximumnak.
Valódi rendszerek teljesítményének áttekintése
A LINPACK teszteredmények nagy szórása miatt a hozzávetőleges értékeket a különböző forrásokból származó információkon alapuló mutatók átlagolásával adjuk meg. A játékkonzolok és elosztott rendszerek (szűk specializációjú, és nem támogatják a LINPACK tesztet) teljesítményét referenciaként adjuk meg a fejlesztők által megadott számok szerint. Konkrét rendszerparaméterekkel pontosabb eredmények érhetők el, például a The Performance Database Server oldalon .
Szuperszámítógépek
Uno
Kilo
Mega
Giga
Tera
Peta
- Cray Jaguar ( 2008 ) – 1059 petaflop
- IBM Roadrunner ( 2008 ) – 1,042 petaflops [16]
- Lomonoszov ( 2011 , NIVC MSU) - 1,3 petaflop
- Jaguar Cray XT5-HE ( 2009 ) - 1759 petaflop
- T-Platform A-osztályú klaszter (Lomonoszov-2, 2014. november, Moszkvai Állami Egyetem Kutatási és Fejlesztési Központja) - 1,85 petaflop (5 állványban) [17] [18] [19] .
- Tianhe-1A ( 2010 ) - 2,57 petaflops
- Christofari (2019) – 6,7 petaflops ( 75 csomópontos NVIDIA DGX-2 fürt ) [20] [21] [22]
- Fujitsu K számítógép ( 2011 ) - 8,16-10,51 petaflops [23]
- IBM Sequoia ( 2012 ) – 16,32 petaflop [24]
- Cray Titan (pl. Cray Jaguar ; 2012 ) – >17,59 petaflop [25]
- Chervonenkis (2021) - 21 530 petaflop
- Tianhe-2 ( 2013 ) – 33,86 petaflop [26]
- Sunway TaihuLight (2016) - 93 petaflops
- Csúcstalálkozó (2018) - 122,3 petaflop
- Fugaku (2020) – 442,01 petaflop
Exa
Személyi számítógép processzorok
Dupla pontosságú csúcsteljesítmény [27]
- Zilog Z80 + AMD Am9512 matematikai társprocesszor , 3 MHz (1977-1980) ~ 1-2 kflop [28]
- Intel 80486DX/DX2 (1990-1992) – akár 30-50 Mflop/s [29]
- Intel Pentium 75–200 MHz (1996) – akár 75–200 Mflop/s [29] [30]
- Intel Pentium III 450–1133 MHz (1999–2000) – akár 450–1113 Mflop/s [29] [30]
- Intel Pentium III-S (2001) 1–1,4 GHz – akár 1–1,4 Gflop/s [30]
- MCST Elbrus 2000 300 MHz (2008) – 2,4 Gflop/s
- Intel Atom N270, D150 1,6 GHz (2008-2009) – akár 3,2 Gflop/s [29]
- Intel Pentium 4 2,5–2,8 GHz (2004) – akár 5–5,6 Gflop/s [29]
- MCST Elbrus-2C+ 500 MHz, 2 mag (2011) - 8 Gflop/s
- AMD Athlon 64 X2 4200+ 2,2 GHz, 2 mag ( 2006 ) - 8,8 Gflops/s
- Intel Core 2 Duo E6600 2,4 GHz 2 magos (2006) - 19,2 Gflop/s
- MCST Elbrus-4S (1891VM8Ya, Elbrus v.3) 800 MHz, 4 mag (2014) – 25 Gflop/s [31]
- Intel Core i3 -2350M 2,3 GHz 2 magos (2011) - 36,8 Gflop/s
- Intel Core 2 Quad Q8300 2,5 GHz 4 magos (2008) - 40 Gflop/s
- AMD Athlon II X4 640 3,0 GHz 4 magos ( 2010 ) - 48 Gflop/s
- Intel Core i7-975 XE ( Nehalem ) 3,33 GHz 4 magos (2009) - 53,3 Gflop/s
- AMD Phenom II X4 965 BE 3,4 GHz 4 magos ( 2009 ) - 54,4 Gflop/s
- AMD Phenom II X6 1100T 3,3 GHz 6 magos (2010) – 79,2 Gflop/s
- Intel Core i5 -2500K ( Sandy Bridge ), 3,3 GHz, 4 mag (2011) - 105,6 Gflop/s
- MCST Elbrus-8S (Elbrus v.4) 1,3 GHz, 8 mag (2016) – 125 Gflop/s [32] [33]
- AMD FX-8350 4 GHz-es 8 magos (2012) – 128 Gflop/s [34]
- Intel Core i7 -4930K ( Ivy Bridge ) 3,4 GHz 6 magos (2013) - 163 GFlops/s
- Loongson-3B1500 (MIPS64 ) , 1,5 GHz, 8 mag (2016) - akár 192 GFlop/s [35]
- AMD Ryzen 7 1700X ( Zen ) 3,4 GHz-es 8 magos (2017) [36] - 217 GFlop [37]
- MCST Elbrus-8SV (Elbrus v.5) 1,5 GHz, 8 mag (2020 - terv) [38] - 288 Gflop/s [39] [40]
- IBM Power8 4,4 GHz, 12 mag (2013), 290 Gflop/s
- Intel Core i7-5960X (Extreme Edition Haswell -E), 3,0 GHz, 8 mag (2014) - 384 Gflop/s (a gyakorlatban akár 350 Gflop/s is elérhető [41] )
- Intel Core i9-9900k ( Coffee Lake ), 3,6 GHz, 8 mag (2018) [42] – 460 Gflop [43]
- AMD Ryzen 7 3700X ( Zen 2 ), 3,6 GHz, 8 mag (2019) [44] - 460 GFlop [43]
- MCST Elbrus-12S 2 GHz, 12 mag (2020 - terv) - 576 Gflop / s
- MCST Elbrus-16S 2 GHz, 16 mag (2021 - terv) - 768 Gflop / s [45] .
- AMD Ryzen 9 3950X ( Zen 2 ) 3,5 GHz 16 magos (2019) [46] - 896 GFlops/s [47]
- AMD EPYC 7H12 ( Zen 2 ), 3,3 GHz, 64 mag (2019) [48] - 4,2 teraflop [49]
FLOP-ok száma óránként különböző architektúrákhoz
Számos processzor mikroarchitektúra esetén ismert az egy magon órajelenként végrehajtott lebegő műveletek maximális száma. Az alábbi lista a mikroarchitektúrák neveit tartalmazza, nem a processzorcsaládokat.
(single) - egyszeri pontosság; (dupla) – dupla pontosság [50]
- Intel P5 és P6 (nincs ISE) + Pentium Pro és Pentium II = 1 (egy); 1 (dupla)
- P6 (csak Pentium III) = 4 (egyetlen); 1 (dupla)
- Bonnell ( Atom ) = 4 ( Single ); 1 ( dupla )
- NetBurst = 4 (egyetlen); 2 (dupla)
- Pentium M & Enhanced Pentium M = 4 (egyetlen); 2 (dupla)
- Core, Penryn, Nehalem és Westmere = 8 (egyetlen); 4 (dupla)
- Sandy Bridge & Ivy Bridge = 16 (egyes); 8 (dupla)
- Haswell, Broadwell, Skylake, Kaby Lake és Coffee Lake = 32 (egyes); 16 (dupla)
- Skylake-X, Skylake-SP, Cascade Lake-X (Xeon Gold & Platinum) = 64 (egyes); 32 (kettős) [51] [52]
- Bonnell, Saltwell, Silvermont és Airmont = 6 (egyetlen); 1,5 (dupla)
- MIC ("Knights Corner" Xeon Phi) = 32 (egyetlen); 16 (dupla)
- MIC ("Knights Landing" Xeon Phi) = 64 (egyetlen); 32 (dupla) [51]
- AMD K5 és K6 = 0,5 (egyetlen); 0,5 (dupla)
- K6-2 & K6-III = 4 (egyes); 0,5 (dupla)
- K7 = 4 (egyetlen); ? (kettős)
- K8 = 4 (egyetlen); 2 (dupla)
- K10/Csillag = 8 (egyetlen); 4 (dupla)
- Husky = 8 (egyetlen); 4 (dupla)
- Bulldózer, Piledriver, gőzhenger és kotró (magpáronként összesen – [53] modul ) = 16 (egyetlen); 8 (dupla)
- Bobcat = 4 (egyetlen); 1,5 (dupla)
- Jaguar, Puma és Puma+ = 8 (egyetlen); 3 (dupla)
- Zen, Zen+ = 16 (egyetlen); 8 (dupla)
- Zen 2 = 32 (egyetlen); 16 (dupla)
- MCST Elbrus 2000 (E2K) = 16 (egyetlen); 8 (dupla) [54] [55]
- Elbrus 3. verzió = 16 (egyetlen); 8 (dupla)
- Elbrus 4-es verzió = 24 (egyetlen); 12 (dupla) [56] [57]
- Elbrus 5-ös verzió = 48 (egyetlen); 24 (kettős) [58] [59]
Zsebszámítógép-processzorok
- Samsung S3C2440 400 MHz-es processzoron alapuló PDA ( ARM9 architektúra ) - 1,3 megaflops
- Intel XScale PXA270 520 MHz - 1,6 megaflops
- Intel XScale PXA270 624 MHz - 2 megaflops
- Samsung Exynos 4210 2x1600 MHz - 84 megaflops
- Apple A6 – 645 megaflop (LINPACK becslés)
- Apple A7 – 833 megaflop (LINPACK becslés) [60]
- Apple A8 – 1,4 gigaflop [61]
- Apple A10 – 365 gigaflop (fp32), 91 gigaflop (fp64) [62]
- Apple A14 – 824 gigaflop (fp32), 206 gigaflop (fp64) [62]
Elosztott rendszerek
- Bitcoin - jelentős mennyiségű speciális számítási erőforrással rendelkezik, de csak egész számokkal kapcsolatos problémákat old meg (az SHA256 hash összegének kiszámítása ). Szinte minden számológépet speciális egyedi mikroáramkörök (ASIC) formájában valósítanak meg, amelyek műszakilag nem alkalmasak lebegőpontos számok számításainak elvégzésére. Ezért jelenleg helytelen a bitcoin hálózatot flopokkal értékelni. [63] [64] [65] Korábban, 2011-ig csak olyan CPU -kat és GPU -kat használtak a hálózatban , amelyek képesek egész és lebegő adatokat is kezelni, a flopbecslést pedig a hash/s metrikából kaptuk egy empirikus tényező segítségével. 12,7 ezer. [66] [67] Például 2011 áprilisában a hálózat teljesítményét ezzel a módszerrel körülbelül 8 petaflopra becsülték. [68]
- A Folding@home 2020. április 23-án több mint 2,6 exaflops, így a világ legerősebb és legnagyobb elosztott számítástechnikai projektje.
- BOINC – több mint 41,5 petaflop 2020 márciusában [69]
- SETI@home – 0,66 petaflop (2013-ra) [70]
- Einstein@Home – több mint 5,2 petaflop 2020 márciusában [71]
- Rosetta@home – több mint 1,4 petaflop 2020 márciusában.
Játékkonzolok
Lebegőpontos műveletek 32 bites adatokon
- Sega Dreamcast – 1,4 gigaflop
- Nintendo GameCube – 1,9 gigaflops ( CPU ), 8,6 gigaflops ( ATI-AMD "Flipper" GPU ) [72]
- Sony PlayStation Portable – 2,6 gigaflop [73]
- Nintendo Wii – 2,9 gigaflops (CPU) [74]
- Microsoft Xbox – 2,9 gigaflops (Intel Pentium III 733 Mhz CPU), 80,0 gigaflops (Nvidia XGPU 233 MHz GPU) [72]
- Sony PlayStation 2 - 6,2 gigaflop
- Microsoft Xbox 360 – 115,2 gigaflop (IBM Xenon CPU ), 240 gigaflop (ATI-AMD Xenos GPU )
- Sony PlayStation 3 – 230,4 gigaflop egyszeres és akár +15 gigaflop dupla pontosság (CPU Cell BE ) [75] [76]
- Nintendo Wii U – 352 gigaflops (GPU, feltehetően) [77]
- Sony PlayStation 3 – 400,4 gigaflops (GFlops) RSX Nvidia G70 550 MHz [3]
- Microsoft Xbox One – 1,23 teraflops (GPU) [78]
- Sony PlayStation 4 (AMD Radeon GPU) – 1,84 teraflop [79]
- Sony PlayStation® 4 Pro – 4.20 TFLOPS (AMD Radeon GPU) [80]
- Microsoft Xbox One X – 6 teraflop (GPU)
- Sony PlayStation 5 ( Radeon Navi GPU , RDNA2 architektúrával) - 10,3 teraflop [81]
- Microsoft Xbox Series X – 12 teraflops (GPU) [82]
GPU-k
Elméleti teljesítmény (FMA; gigaflops):
Ember és számológép
A számológép nem véletlenül esik egy kategóriába az emberrel, mert bár processzort, memóriát, beviteli-kimeneti eszközöket tartalmazó elektronikus eszközről van szó, működési módja alapvetően eltér a számítógépétől. A számológép egyik műveletet a másik után olyan sebességgel hajtja végre, ahogyan azt az emberi kezelő kéri. A műveletek között eltelt időt az emberi képességek határozzák meg, és jelentősen meghaladja a közvetlenül a számításokra fordított időt. Azt mondhatjuk, hogy a legegyszerűbb hagyományos zsebszámológépek átlagos teljesítménye körülbelül 10 flop vagy több.
Ha nem veszünk kivételes eseteket (lásd fenomenális számláló ), akkor egy hétköznapi ember csak tollat és papírt használva nagyon lassan és gyakran nagy hibával hajtja végre a lebegőpontos műveleteket , így az ember, mint számítástechnikai eszköz teljesítményéről beszél. , olyan mértékegységeket kell használni, mint a milliflop, sőt a mikroflop.
Lásd még
Jegyzetek
- ↑ Új csavar archiválva : 2013. szeptember 11., a Wayback Machine Byrd Kiwi , PC World, 2012. 07. szám: "Ha a szuperszámítógépek jelenlegi fejlődési üteme folytatódik, akkor a következő mérföldkő a teljesítményben 1 exaflop vagy egy kvintilló (10) lesz ^18) művelet/másodperc, várhatóan 2019-re érik el ... úgy gondolják, hogy egy zettaflops (10^21, vagyis sextillió művelet) teljesítményű számítógépet 2030 körül meg lehet építeni. a következő számítási határhoz - yottaflops (10^ 24) és xeraflops (10^27)."
- ↑ Peta, exa, zetta, yotta... Archivált : 2013. december 3., a Wayback Machine Byrd Kiwi , Computerra, Dátum: 2008. július 16.: "Ezt a határvonalat a zettaflops (10^21), a yottaflops (10^) követi 24 ) és xeraflops (10^27).
- ↑ 1 2 3 PLAYSTATION 3のグラフィックスエンジン RSX . Hozzáférés dátuma: 2016. december 30. Az eredetiből archiválva : 2016. szeptember 17. (határozatlan)
- ↑ http://ixbtlabs.com/articles3/video/rv670-part1-page1.html Archiválva : 2010. január 13. a Wayback Machine lebegőpontos ALU-kban .. támogatja az FP32 pontosságát
- ↑ Archivált másolat (a hivatkozás nem elérhető) . Letöltve: 2009. augusztus 17. Az eredetiből archiválva : 2009. július 5.. (határozatlan) ezek egyetlen precíziós GPU csúcsszámok
- ↑ Archivált másolat (a hivatkozás nem elérhető) . Letöltve: 2009. augusztus 17. Az eredetiből archiválva : 2009. október 15. (határozatlan) A HPL egy olyan szoftvercsomag, amely egy sűrű lineáris rendszert dupla pontossággal (64 bit) old meg.
- ↑ [1] Archivált : 2009. szeptember 1. a Wayback Machine -nél [2] Archivált : 2009. szeptember 1., a Wayback Machine HPL Gyakorisági bejegyzései a pontosság kedvéért
- ↑ A 32 bites FP aritmetika teljesítményének kihasználása a 64 bites pontosság elérésében (Iteratív finomítás újralátogatása lineáris rendszerek esetén) Archiválva : 2008. december 4. a Wayback Machine -nél
- ↑ SSE, SSE2 és SSE3 maximális áteresztőképesség: 4 Flop / ciklus . Letöltve: 2017. szeptember 28. Az eredetiből archiválva : 2012. március 16.. (határozatlan)
- ↑ A nettó eredmény az, hogy mostantól 2 DP összeadást és 2 DP szorzást dolgozhat fel órajelenként, vagy 4 FLOPS-ot ciklusonként. (DP) . Hozzáférés dátuma: 2010. július 20. Az eredetiből archiválva : 2010. május 24. (határozatlan)
- ↑ 1 2 3 Jack Dongarra. Adaptive Linear Solvers and Eigensolvers (angol) (nem elérhető link) . Argonne képzési program az extrém méretű számítástechnikáról . Argonne National Laboratory (2014. augusztus 13.). Letöltve: 2015. április 13. Az eredetiből archiválva : 2016. április 24..
- ↑ Jack Dongarra, Peak Performance - Per Core Archiválva : 2015. december 22., a Wayback Machine / A Look at High Performance Computing, 2015-10-15
- ↑ 1 2 http://sites.utexas.edu/jdm4372/2016/11/22/sc16-invited-talk-memory-bandwidth-and-system-balance-in-hpc-systems/ Archiválva : 2017. február 2. a Waybacken Gép http://sites.utexas.edu/jdm4372/files/2016/11/Slide20.png Archiválva 2017. február 2-án a Wayback Machine -nél
- ↑ Számítási teljesítmény: az első PC-től a modern szuperszámítógépig . Letöltve: 2020. március 19. Az eredetiből archiválva : 2020. március 19. (határozatlan)
- ↑ A numerikus időjárás-előrejelzés megjelenése: Richardsontól az ENIAC -ig Archiválva : 2013. december 2. a Wayback Machine -nél , 2011
- ↑ Az IBM megalkotta a világ legerősebb szuperszámítógépét _ _ _ _
- ↑ T-PLATFORM A-CLUSTER, XEON E5-2697V3 14C 2,6 GHZ, INFINIBAND FDR, NVIDIA K40M Archiválva : 2014. november 29. a Wayback Machine -nél // Top 500, 2014. november
- ↑ A TOP500 szuperszámítógépek új értékelése A Wayback Machine 2014. november 21-i archív példánya // Computerra, 2014. november 18.: "... egy A-osztályú klaszter, amelyet a T-Platforms hozott létre a Moszkvai Állami Egyetem Kutatási Számítástechnikai Központja számára. "
- ↑ Az MSU új szuperszámítógépe bekerült a 2016. november 17-i Top500 archív példányba a Wayback Machine -nél // Data Center World, Open Systems, 2014.11.19.: „Az új MSU szuperszámítógépnek csak öt számítási rackje van 1280 csomóponttal 14 magos Intel Xeon E5 processzorok -2697 v3 és NVIDIA Tesla K40 gyorsítók több mint 80 TB teljes RAM kapacitással. … Egy szuperszámítógép minden rackje körülbelül 130 kW-ot fogyaszt.”
- ↑ Christofari – NVIDIA DGX-2, Xeon Platinum 8168 24C 2,7 GHz, Mellanox InfiniBand EDR, NVIDIA Tesla V100 Archivált 2020. január 3-án a Wayback Machine -nél – top500, 2019-11
- ↑ Videóbemutató a Christofari szuperszámítógépről . Sbercloud. Letöltve: 2019. december 27. Az eredetiből archiválva : 2019. december 17. (Orosz)
- ↑ A Sberbank megalkotta Oroszország legerősebb szuperszámítógépét . RIA Novosti (20191108T1123+0300Z). Hozzáférés dátuma: 2019. november 8. Az eredetiből archiválva : 2019. november 8. (Orosz)
- ↑ A japán szuperszámítógép jobban teljesít , mint a 2011. november 5-én kelt kínai archív példány a Wayback Machine -nél (orosz)
- ↑ Lawrence Livermore Sequoia szuperszámítógép-tornyai felülmúlják a többieket a legutóbbi TOP500-as listán , archiválva : 2017. szeptember 11., a Wayback Machine , TOP500 hírcsapat | 2012. július 16
- ↑ Agam Shah (IDG News), a Titan szuperszámítógép 20 petaflop feldolgozási teljesítményt ért el. Archiválva : 2017. július 3. a Wayback Machine -nél // PCWorld, Computers, 2012. október 29.
- ↑ A Tianhe-2 ígéretes szolgáltatásai archiválva 2014. november 28-án a Wayback Machine -nél // Open Systems, 2013. 08. szám
- ↑ A legtöbb processzor egyszeri precíziós teljesítménye pontosan kétszerese a feltüntetett értékeknek.
- ↑ 1200-tól 4900 processzorciklusig 1 dupla pontosságú utasítás végrehajtásához típusuktól függően az egyszeri precíziós műveletek körülbelül 10-szer gyorsabban hajtottak végre: https://datasheetspdf.com/pdf/1344616/AMD/Am9512/1 Archivált másolat december 26-tól , 2019 a Wayback Machine -nél (4. oldal)
- ↑ 1 2 3 4 5 Ryan Crierie. http://www.alternatewars.com/BBOW/Computing/Computing_Power.htm (angol) . Alternate Wars (2014. március 13.). Hozzáférés időpontja: 2015. január 23. Az eredetiből archiválva : 2015. január 23.
- ↑ 1 2 3 Jack J. Dongarra. Különféle számítógépek teljesítménye szabványos lineáris egyenletek szoftverrel ( 2014. június 15.). Letöltve: 2015. január 23. Az eredetiből archiválva : 2015. április 17..
- ↑ Elbrus-4C mikroprocesszor (elérhetetlen link) . MCST. Letöltve: 2015. június 28. Az eredetiből archiválva : 2014. június 4.. (határozatlan)
- ↑ "Elbrus-8S" központi processzor (TVGI.431281.016) . JSC "MCST" . Letöltve: 2017. december 16. Az eredetiből archiválva : 2018. március 30. (határozatlan)
- ↑ Hat 64 bites FMAC blokk magonként: 8 x 1,3 x 6 x 2 = 124,8 GFlops/s dupla pontosságú csúcsteljesítmény
- ↑ Két 128 bites FMAC blokk minden modulban, amelyek egy pár magot egyesítenek, amelyek 4 GHz-es frekvencián működnek: 4x4x2x2x128/64 = 128 GFlops / s csúcsteljesítmény dupla pontosságú számításokban
- ↑ Alex Voica. Az új MIPS64-alapú Loongson processzorok áttörik a teljesítménykorlátot (angol) (lefelé irányuló kapcsolat) (2015. szeptember 3.). Letöltve: 2017. február 4. Az eredetiből archiválva : 2017. február 5..
- ↑ Archivált másolat . Letöltve: 2019. december 26. Az eredetiből archiválva : 2019. június 27. (határozatlan)
- ↑ Magonként két 128 bites FMAC blokk: 8 x 3,4 x 2 x 2 x 128/64 = 217,6 Gflops/s dupla pontosságú csúcsteljesítmény
- ↑ "Elbrus-8SV" mikroprocesszor (TVGI.431281.023) . JSC "MCST" . Hozzáférés dátuma: 2017. december 16. Az eredetiből archiválva : 2019. december 27. (határozatlan)
- ↑ Első Elbrus-8SV . Letöltve: 2017. szeptember 23. Az eredetiből archiválva : 2017. szeptember 23. (határozatlan)
- ↑ Hat 128 bites FMAC blokk magonként: 8 x 1,5 x 6 x 2 x 128/64 = 288 Gflop dupla pontosságú csúcsteljesítmény
- ↑ Linpack teljesítmény Haswell E (Core i7 5960X és 5930K) – Puget Custom Computers . Hozzáférés dátuma: 2015. január 15. Az eredetiből archiválva : 2015. március 27. (határozatlan)
- ↑ Intel® Core™ i9-9900K processzor (16 MB gyorsítótár, akár 5,00 GHz) Termékspecifikációk . Letöltve: 2019. december 26. Az eredetiből archiválva : 2021. március 5.. (határozatlan)
- ↑ 1 2 Két 256 bites FMAC blokk magonként: 8 x 3,6 x 2 x 2 x 256/64 = 460 GFlop/s
- ↑ Archivált másolat . Letöltve: 2019. december 26. Az eredetiből archiválva : 2019. június 27. (határozatlan)
- ↑ Elbrus 16C mikroprocesszor (megérkezett az első műszaki minták) . Letöltve: 2020. január 30. Az eredetiből archiválva : 2020. január 4.. (határozatlan)
- ↑ Archivált másolat . Letöltve: 2019. december 26. Az eredetiből archiválva : 2019. július 24. (határozatlan)
- ↑ Magonként két 256 bites FMAC blokk: 16 x 3,5 x 2 x 2 x 256/64 = 896 GFlop/s
- ↑ AMD EPYC 7H12 specifikációi . techpowerup . Hozzáférés időpontja: 2021. október 10.
- ↑ Az AMD bemutatja legerősebb, 64 magos processzorát . iXBT.com . Letöltve: 2021. október 10. Az eredetiből archiválva : 2021. október 10. (Orosz)
- ↑ architektúra – Az egyszeres pontosságú adatok és a duplapontosságú adatcsúcsteljesítmény kiszámítása Intel(R) Core™ i7-3770 CPU esetén – Stack Overflow . Letöltve: 2017. október 15. Az eredetiből archiválva : 2015. október 22.. (határozatlan)
- ↑ 1 2 Az Intel® Advanced Vector Extensions 512 (Intel® AVX-512) áttekintése . Letöltve: 2019. december 24. Az eredetiből archiválva : 2019. december 24. (határozatlan)
- ↑ A ciklusonként megadott számú utasítást csak ezen architektúrák régebbi képviselői tudják végrehajtani, a 6xxx sorozattól kezdve Xeon Platinum és Xeon Gold marketing néven árusítva, amelyek magjában két 512 bites FMAC blokk található az AVX végrehajtásához. -512 utasításokat. Minden junior modellnél: Xeon Bronze, Xeon Silver és Xeon Gold 5ххх, az egyik FMAC blokk le van tiltva, ezért a lebegőpontos utasítások maximális végrehajtási sebessége 2-szeresére csökken.
- ↑ A lebegőpontos feldolgozóegység (FPU) modulonként meg van osztva – egy processzormag pár. Ha a lebegő műveleteket egyidejűleg hajtják végre mindkét magon, akkor ez meg van osztva közöttük.
- ↑ Elbrus / Elbrus építészetének rövid leírása . Letöltve: 2019. december 26. Az eredetiből archiválva : 2017. június 11. (határozatlan)
- ↑ Ez a mikroarchitektúra a VLIW osztályba tartozik, és 6 párhuzamos csatornával rendelkezik az utasítások végrehajtására, amelyek közül 4 64 bites FMAC típusú lebegőpontos egységekkel van felszerelve .
- ↑ Elbrus-8S (TVGI.431281.016) / Elbrus-8S1 (TVGI.431281.025) - központi processzor 1891VM10Ya / 1891VM028 / MCST . Letöltve: 2017. december 16. Az eredetiből archiválva : 2018. március 30. (határozatlan)
- ↑ Az architektúra 4. generációjában már mind a 6 utasítás-végrehajtási csatornán elérhetőek a 64 bites FMAC blokkok.
- ↑ Elbrus-8SV (TVGI.431281.023) - központi processzor 1891VM12YA / MCST . Hozzáférés dátuma: 2017. december 16. Az eredetiből archiválva : 2019. december 27. (határozatlan)
- ↑ Az architektúra 5. generációjában az összes FMAC blokk bitmélységét 64-ről 128-ra növelték.
- ↑ Szergej Uvarov. Az Apple iPhone 5s részletes áttekintése és tesztelése . IXBT.com (2013. szeptember 23.). Archiválva az eredetiből 2013. október 2-án. (határozatlan)
- ↑ Apple A8 SoC - NotebookCheck.net Tech . Letöltve: 2015. január 15. Az eredetiből archiválva : 2014. december 20. (határozatlan)
- ↑ 1 2 Apple A10 – Összehasonlító specifikációk és CPU-benchmarkok . Letöltve: 2022. január 22. Az eredetiből archiválva : 2022. január 22. (határozatlan)
- ↑ [3] Archivált : 2017. augusztus 30., a Wayback Machine // Gizmodo, 5/13/13: "Mivel a Bitcoin-bányászok valójában egyszerűbb matematikai műveleteket végeznek (egész műveletek), egy kis (rendetlen) konverziót kell végrehajtania, hogy megkapja hogy FLOPS. .. az új ASIC bányászok – a gépek .. nem csinálnak mást, csak bitcoinokat bányásznak – még más jellegű műveleteket sem tudnak végrehajtani, teljesen kimaradnak a teljességből.
- ↑ [4] Archivált : 2013. december 3. a Wayback Machine -nél // SlashGear, 2013. május 13.: "A bitcoin bányászat technikailag nem FLOPS-szal működik, hanem egész számokkal történik, így a számokat FLOPS-ra konvertálják a legtöbb esetben az emberek többet tudnak érteni. Mivel az átalakítási folyamat kissé furcsa, egyes szakértők hibásnak minősítették a bányászati adatokat."
- ↑ [5] Archivált 2013. november 27-én a Wayback Machine -nél // ExtremeTech: "Mivel a Bitcoin bányászata nem támaszkodik lebegőpontos műveletekre, ezek a becslések alternatív költségeken alapulnak. Most, hogy már az alapoktól kezdve olyan alkalmazás-specifikus integrált áramkörökkel (ASIC-kkel) rendelkező hardverünk van, amelyek a Bitcoinok bányászatán kívül mást nem csinálnak, ezek a becslések még homályosabbá válnak.”
- ↑ [6] Archivált 2013. december 3. a Wayback Machine -nél // CoinDesk : "Kettő, a hash-ek flopokká konvertálására használt becslések (ami hashenként körülbelül 12 700 flopot eredményez) 2011-re vonatkoznak, mielőtt az ASIC-eszközök a bitcoinbányászat normájává váltak. Az ASIC-k egyáltalán nem kezelik a flopokat, ezért a jelenlegi összehasonlítás nagyon durva."
- ↑ [7] Archivált : 2013. december 3. a Wayback Machine // VR-Zone-ban: "1 hash = 12,7K FLOPS konverziós arányt használnak a hálózati hozzájárulás általános sebességének meghatározásához. A becslés 2011-ben készült, a kizárólag bitcoinbányászathoz tervezett ASIC hardver létrehozása előtt. Az ASIC egyáltalán nem használ lebegőpontos műveleteket, így a becslésnek nincs valós jelentése az ilyen hardvereknél.”
- ↑ Bitcoin Watch , archiválva 2011-04-08: "Network Hashrate TFLOP/s 8007"
- ↑ BOINC Archiválva : 2010. szeptember 19.
- ↑ BOINCstats:SETI@home Archiválva az eredetiből 2012. május 3-án.
- ↑ BOINCstats:Einstein@Home . Letöltve: 2012. április 16. Az eredetiből archiválva : 2012. február 21.. (határozatlan)
- ↑ 12 Konzolspecifikáció . _ Letöltve: 2017. december 7. Az eredetiből archiválva : 2021. április 10. (határozatlan)
- ↑ PSP specifikációk Revealed Feldolgozási sebesség, sokszög sebesség és még sok más. Archivált : 2009. július 28., a Wayback Machine // IGN Entertainment, 2003. "PSP CPU CORE...FPU, VFPU (Vector Unit) @ 2.6GFlops"
- ↑ Frissítés: Hány FLOPS van a játékkonzolokon? Archivált : 2010. november 9. a Wayback Machine -nél // TG Daily, 2008. május 26.
- ↑ Cell Broadband Engine Architecture és első megvalósítása . IBM developerWorks (2005. november 29.). Letöltve: 2006. április 6. Az eredetiből archiválva : 2009. január 24.. (határozatlan)
- ↑ A 32 bites lebegőpontos aritmetika teljesítményének kihasználása a 64 bites pontosság eléréséhez . Tennessee Egyetem (2005. július 31.). Letöltve: 2011. február 11. Az eredetiből archiválva : 2011. március 18.. (határozatlan)
- ↑ Philip Wong . Xbox One vs. PS4 vs. Wii U [frissítés ] (angol) , CNET Asia, Games & Gear (2013. május 22.). Az eredetiből archiválva: 2013. december 3. Letöltve: 2013. november 29.
- ↑ Anand Lal Shimpi. Az Xbox One: Hardverelemzés és összehasonlítás a PlayStation 4-hez (angol) . Anandtech (2013. május 22.). Archiválva az eredetiből 2013. október 2-án.
- ↑ PS4 specifikáció (a hivatkozás nem elérhető) . Letöltve: 2013. június 22. Az eredetiből archiválva : 2013. június 20. (határozatlan)
- ↑ Műszaki adatok . Play Station. Letöltve: 2018. december 14. Az eredetiből archiválva : 2019. május 4.. (Orosz)
- ↑ A Sony bemutatta az új PlayStation specifikációkat . RIA Novosti (20200318T2333+0300). Letöltve: 2020. március 20. Az eredetiből archiválva : 2020. március 20. (Orosz)
- ↑ Mit várhat a játék következő generációjától . Xbox Wire (2020. február 24.). Letöltve: 2020. február 24. Az eredetiből archiválva : 2020. február 24.
- ↑ NVIDIA GeForce RTX 2080 Ti Műszaki adatok | TechPowerUp GPU-adatbázis
- ↑ 1 2 3 4 Összehasonlító táblázatok AMD (ATI) Radeon grafikus kártyákhoz . Letöltve: 2012. február 24. Az eredetiből archiválva : 2012. február 28.. (határozatlan)
Linkek