Echelon on koodinimi vuoden 2010 nVidia - tutkimusprojektille , jossa suunnitellaan uusi mikroprosessori super- ja graafiseen laskentaan .
Defence Advanced Research Projects Agency (DARPA) on ilmoittanut sponsoroivansa Ubiquitous High Performance Computing ( UHPC ) [ 1] [2] -ohjelmaa, jonka tavoitteena on luoda prototyyppipalvelinjärjestelmä - telineet, joiden suorituskyky on 1 petaflops ja energiankulutus . 57 kW. Kilpailuun osallistuivat Intel , MIT , Sandia National Labs ja nVidia . Tämän ohjelman on määrä valmistua vuonna 2018.
18. marraskuuta 2010 Supercomputing 2010 -konferenssissa New Orleansissa , Louisianassa , nVidia Chief Technology Officer Bill Dally ilmoitti Echelon - projektista yrityksen DARPA-aloitteen parissa tekemän työn tuloksena. Echelon-projekti julkistettiin mikroprosessoriksi, joka on rakenteeltaan samanlainen kuin uusimmat nVidia GPU:t . Huolimatta siitä, että ilmoitushetkellä siru oli olemassa vain paperilla ja suunnittelua testattiin useissa simulaatioissa, joitain teknisiä ominaisuuksia ja kehitys- ja julkaisusuunnitelmia paljastettiin. Esitettiin kaavioita, kaavioita ja kaavioita, jotka osoittavat prosessorin sisäisen rakenteen ja ominaisuudet.
Vuonna 2011 siru arvioitiin tuotantoon 10 nm:n prosessiteknologialla sirupinta-alalla 290 mm2 [3] .
Echelon-mikroprosessori koostuu 128 kierrelohkosta, joista jokainen sisältää kahdeksan ydintä. Jokainen ydin voi itsenäisesti suorittaa liukulukuoperaatioita, ja pääominaisuus on, että yhdessä syklissä yksi ydin voi suorittaa neljä kaksoistarkkuutta liukulukuoperaatiota. Samaan aikaan uusimmat nVidia-ammattimaiset grafiikkaprosessorit julkaisuhetkellä - Fermi - pystyvät suorittamaan vain yhden toiminnon kelloa kohden. Siten 1024 "Echelon"-ydintä antavat teoreettisen kokonaissuorituskyvyn 10 TFLOPS:ia.
Echelon-mikroprosessori pystyy suorittamaan yhden liukulukuoperaation käyttämällä vain 10 picojoulea energiaa. Vertailun vuoksi, Fermi käyttää 200 picojoulea vastaavaan toimintaan.
Toinen sirun ominaisuus on sen välimuisti, jossa on kuusi tasoa ja 256 MB. Suurin tuettu ulkoinen näytönohjain on 256 Gt.
On todettu, ettätuleva versio CUDA käytetään " Echelon " siru ohjelmointityökaluna , vaikka tukea tuleville versioille OpenCL , OpenMP ja Microsoft DirectCompute ei ole poissuljettu .