SSE

Kokeneet kirjoittajat eivät ole vielä tarkistaneet sivun nykyistä versiota, ja se voi poiketa merkittävästi 19. helmikuuta 2021 tarkistetusta versiosta . tarkastukset vaativat 5 muokkausta .

SSE ( Streaming SIMD Extensions , streaming SIMD Extensions of the processor) on SIMD - ( eng . Single Instruction , Multiple Data , One Instruction - A lot of data ) Intelin kehittämä ohjesarja, joka esiteltiin ensimmäisen kerran Pentium III -sarjan prosessoreissa vastaus samanlaiseen käskysarjaan 3DNow! AMD : ltä , joka esiteltiin vuotta aiemmin. Näiden ohjeiden alkuperäinen nimi oli KNI - Katmai New Instructions (Katmai on Pentium III -prosessoriytimen ensimmäisen version nimi ).

SSE - teknologia mahdollisti kaksi MMX:n pääongelmaa: MMX :ää käytettäessä rinnakkaisprosessoriohjeita ei voitu käyttää samanaikaisesti , koska sen rekisterit jaettiin MMX-rekisterien kanssa, ja MMX:n kyky toimia vain kokonaislukujen kanssa.

SSE sisältää kahdeksan 128-bittistä rekisteriä ja joukon ohjeita, jotka toimivat skalaari- ja pakattujen tietotyyppien kanssa prosessoriarkkitehtuurissa .

Suorituskykyetu saavutetaan, kun on tarpeen suorittaa sama toimintosarja eri datalle. Tässä tapauksessa SSE-lohko rinnastaa laskentaprosessin tietojen välillä.

Ominaisuudet

8 ( x86-64 - 16) 128-bittiset XMM-rekisterit.
32-bittinen (x86-64 - 64) lippurekisteri (MXCSR).
128-bittinen pakattu yhden tarkkuuden liukulukutietotyyppi .
Ohjeita yhden tarkkuuden reaalilukuihin.
Ohjeet eksplisiittiseen tietojen esihakuun, tietojen välimuistin hallintaan ja tallennustoimintojen järjestyksen hallintaan.

Rekisterit

SSE:hen on lisätty kahdeksan (x64:lle kuusitoista) 128-bittistä rekisteriä, nimeltään xmm0 - xmm7 (-xmm15).

Kukin rekisteri voi sisältää neljä 32-bittistä yhden tarkkuuden liukulukuarvoa.

SSE-komennot

Liukulukujen komennot

Eteenpäin komennot
- Skalaarityypit - MOVSS
- Pakatut tyypit - MOVAPS, MOVUPS, MOVLPS, MOVHPS, MOVLHPS, MOVHLPS
Aritmeettiset komennot
- Skalaarityypit - ADDSS, SUBSS, MULSS, DIVSS, RCPSS, SQRTSS, MAXSS, MINSS, RSQRTSS
- Pakatut tyypit - ADDPS, SUBPS, MULPS, DIVPS, RCPPS, SQRTPS, MAXPS, MINPS, RSQRTPS
Vertailukomennot
- Skalaarityypit - CMPSS, COMISS, UCOMISS
- Pakatut tyypit - CMPPS
Sekoitus ja purkaminen
- Pakatut tyypit - SHUFPS, UNPCKHPS, UNPCKLPS
Kirjoita muunnoskomennot
- Skalaarityypit - CVTSI2SS, CVTSS2SI, CVTTSS2SI
- Pakatut tyypit - CVTPI2PS, CVTPS2PI, CVTTPS2PI
Bittikohtaiset Boolen toiminnot
- Pakatut tyypit - ANDPS, ORPS, XORPS, ANDNPS

Komennot kokonaisluvuille

Aritmeettiset komennot
- PMULHUW, PSADBW, PAVGB, PAVGW, PMAXUB, PMINUB, PMAXSW, PMINSW
Eteenpäin komennot
- PEXTRW, PINSRW
muu
- PMOVMSKB, PSHUFW

Muut komennot

Työskentely MXCSR-rekisterin kanssa
- LDMXCSR, STMXCSR
Välimuistin ja muistin hallinta
- MOVNTQ, MOVNTPS, MASKMOVQ, PREFETCH0, PREFETCH1, PREFETCH2, PREFETCHNTA, AFENCE

Esimerkki

Seuraava esimerkki näyttää neljän liukulukuparin kertomisen yhdellä mulps- käskyllä :

__declspec ( align ( 16 )) float a [ 4 ] = { 300.0 , 4.0 , 4.0 , 12.0 }; __declspec ( align ( 16 )) float b [ 4 ] = { 1,5 , 2,5 , 3,5 , 4,5 }; __asm- { movups xmm0 , a ; // laita 4 liukulukumuuttujaa a:sta rekisteriin xmm0 movups xmm1 , b ; // laita 4 liukulukumuuttujaa b:stä rekisteriin xmm1 mulps xmm0 , xmm1 ; // kerrotaan liukulukupaketit: xmm0 = xmm0 * xmm1 ; // xmm00 = xmm10 * xmm00 ; // xmm01 = xmm11 * xmm01 ; // xmm02 = xmm12 * xmm02 ; // xmm03 = xmm13 * xmm03 movups a , xmm0 ; // purka tulokset xmm0-rekisteristä osoitteissa a };

Sama esimerkki, mutta assembler insert asm on tehty AT&T-standardissa (GNU Assembler)

float a [ 4 ] = { 300,0 , 4,0 , 4,0 , 12,0 }; float b [ 4 ] = { 1,5 , 2,5 , 3,5 , 4,5 }; __asm__ epävakaa ( "movups %[a], %%xmm0 \n\t " // laittaa 4 liukulukumuuttujaa a:sta rekisteriin xmm0 "movups %[b], %%xmm1 \n\t " // laittaa 4 liukulukumuuttujaa piste b:stä rekisteriin xmm1 "mulps %%xmm1, %%xmm0 \n\t " // kerro liukulukupaketit: xmm0 = xmm0 * xmm1 // xmm00 = xmm00 * xmm10 // xmm01 = xmm01 * xmm11 // xmm02 = xmm02 * xmm12 // xmm03 = xmm03 * xmm13 "movups %%xmm0, %[a] \n\t " // vedä tulokset xmm0-rekisteristä osoitteisiin a : : [ a ] "m" ( * a ), [ b ] "m" ( * b ) : "%xmm0" , "%xmm1" );

Katso myös

Flynnin taksonomia
- SIMD
- SISD
- MIMD
- MISD

Linkit

Virallinen Intel-suorittimien käsikirja, osa 2a Luettelo ohjeista, mukaan lukien SSE (AM latinalaisina aakkosilla), on kohdassa 3.2.
Virallinen Intel-suorittimien käsikirja, osa 2b Luettelo ohjeista, mukaan lukien SSE, (NZ latinalaisina aakkosilla) on osiossa 4.2.

x86-prosessorin käskysarjat
Intel	MMX SSE SSE2 SSE3 SSSE3 SSE4 ( SSE4.1 SSE4.2 ATA ) AES AVX FMA Intel MPX
AMD	3DNow! SSE4a SSE5 AVX FMA AES xop
Cyrix	MMXEXT