Recenzie procesoare Haswell. Arhitecturile de procesoare Intel din toate timpurile

Recenzie procesoare Haswell. Arhitecturile de procesoare Intel din toate timpurile

Introducere Se întâmplă că în fiecare an Intel actualizează microarhitectura procesoarelor sale destinate utilizării în computerele personale utilizate în mod obișnuit. Acest program a devenit atât de familiar încât este considerat de la sine înțeles. Sandy Bridge a fost lansat la începutul anului 2011, Ivу Bridge a apărut în aprilie 2012, iar cele actuale sunt pe în acest moment Haswell au fost prezentate pe 4 iunie anul trecut. Având în vedere programul actual, piața se așteaptă deja la procesoare de nouă generație – Broadwell. Cu toate acestea, lucrurile nu au mers prea bine pentru ei. Introducerea noii tehnologii de proces de 14 nm, pe care Intel trebuie să o folosească pentru a produce Broadwell, a întâmpinat dificultăți de producție. Prin urmare, planul inițial, care prevedea o nouă generație de design de procesor să apară la jumătatea acestui an, a trebuit să fie revizuit. Conform datelor actuale disponibile, anunțul opțiunilor Broadwell mobile eficiente din punct de vedere energetic va avea loc în ajunul Anului Nou, iar procesoarele bazate pe acest design pentru desktopuri de masă și calculatoare mobile va deveni disponibil abia anul viitor.

În această situație, Intel a decis să înveselească cumva așteptarea lungă neplanificată pentru produse noi și a venit cu o promoție cu numele de cod Haswell Refresh. Esența sa constă în faptul că, în loc să lanseze noi procesoare Broadwell, compania oferă modele îmbunătățite ale celor vechi, a căror performanță este îmbunătățită nu de o nouă microarhitectură, ci de frecvențe de ceas crescute. Anunțul oficial al procesoarelor incluse în setul Haswell Refresh a fost programat pentru 11 mai și a avut deja loc. 42 de articole noi au apărut în lista de prețuri Intel, dintre care 24 sunt destinate sistemelor desktop de diferite clase. În această recenzie, ne vom familiariza cu acele Haswell-uri actualizate care sunt destinate desktop-urilor obișnuite și aparțin familiilor Core i7, Core i5 și Core i3.

Aflați mai multe despre Haswell Refresh pentru desktop

Deci, când vorbim despre Haswell Refresh, Intel înseamnă de fapt pur și simplu creșterea frecvențelor procesoarelor sale LGA 1150 din familia Haswell. Nu este nimic neobișnuit în lansarea unor astfel de produse actualizate - compania a crescut treptat frecvențele procesoarelor sale între anunțurile de noi microarhitecturi înainte, dar înainte de asta, astfel de evenimente au fost împrăștiate și nu li s-a acordat atât de multă atenție. O caracteristică distinctivă a Haswell Refresh este că creșterea frecvenței nu are loc în modelele individuale, ci în întreaga linie, de jos în sus.

Mai mult, atât de multă atenție este acordată Haswell Refresh nu din cauza noutății sau a creșterii vizibile a performanței. Tot hype-ul este artificial, este generat special de Intel însăși, încercând să creeze impresia de inovație continuă chiar și în ciuda amânării anunțului Broadwell la o dată ulterioară. Cu alte cuvinte, lansarea Haswell Refresh este o actualizare cu totul obișnuită, iar noile procesoare diferă de vechile procesoare Haswell, care sunt pe piață de aproape un an, doar cu o frecvență care a crescut cu ridicoli de 100 MHz. Adică vorbim de o ușoară creștere a productivității, în valoare de aproximativ 2-3 la sută, și nu mai mult.

Din fericire, clienții nu trebuie să plătească nimic pentru acest mic spor de performanță. Noile procesoare Haswell Refresh au ocupat vechile poziții din lista de prețuri, înlocuind-o pe Haswell față de anul trecut. Dacă vorbim în mod special despre oferte pentru computere desktop, înlocuirea care are loc este următoarea:

Trebuie subliniat că creșterea frecvenței de ceas are loc în cadrul pachetelor termice instalate anterior: 84 W pentru Core i7 și Core i5 și 54 W pentru Core i3. Cu toate acestea, Haswell Refresh se bazează pe exact aceleași cristale semiconductoare care au fost folosite anterior. Îmbunătățirea potențialului de frecvență este asigurată exclusiv de îmbunătățirea procesului tehnologic de 22 nm al Intel, în timp ce revizuirea de bază a noilor produse nu se modifică și păstrează numărul C0. Aceasta înseamnă că nu trebuie așteptate îmbunătățiri fundamentale ale caracteristicilor termice și electrice, precum și ale altor nuanțe ale funcționării noilor procesoare.



Haswell Refresh procesoare desktop


Procesoarele Haswell Refresh arată exact la fel ca predecesorii lor în exterior.



În stânga este Haswell obișnuit, în dreapta este Haswell Refresh


Singura modificare interesantă și fundamental importantă legată de lansarea Haswell Refresh va afecta procesoarele overclocker din seria K, informatii complete care nu sunt încă cunoscute din cauza faptului că vor fi prezentate puțin mai târziu, probabil pe 2 iunie. Deocamdată, Intel va continua să ofere modele mai vechi Core i7-4770K și Core i5-4670K pentru overclockeri, dar procesoarele care le vor înlocui merită o poveste separată.

Faptul este că în soiurile Haswell Refresh cu multiplicatori gratuiti, care au propriul nume de cod colectiv Devil’s Canyon, vom vedea nu numai frecvențe evaluate crescute. Intel va face aceste procesoare mai atractive pentru overclocking, pentru care intenționează să facă modificări majore la ambalajul lor. Materialul termoconductor situat între cipul procesorului și capacul distribuitorului de căldură va fi înlocuit cu unul mai eficient, iar capacul în sine va fi realizat dintr-un aliaj diferit cu o conductivitate termică mai bună. Potrivit datelor preliminare, familia Devil’s Canyon va consta din două procesoare LGA 1150 deblocate: Core i7-4790K și Core i5-4690K. Mai mult, vor primi un pachet termic mai mare decât Haswell Refresh convențional și frecvențe de ceas semnificativ crescute chiar și în modul nominal.

Din păcate, acesta este tot ceea ce se știe despre Devil’s Canyon deocamdată, dar atunci când mostre ale acestor procesoare apar în laboratorul nostru, cu siguranță vom împărtăși informații complete despre ele în recenziile noastre. Astăzi vom vorbi doar despre desktop-ul obișnuit Haswell Refresh cu un nivel standard de disipare a căldurii, care poate fi deja cumpărat în magazine.

Până acum există un singur produs nou în seria Core i7:


Core i7-4790 mărește frecvența de ceas a liniei mai vechi de procesoare pentru platforma LGA 1150 cu 100 MHz, depășind astfel atât overclocker-ul Core i7-4770K, cât și Core i7-4771 obișnuit. În caz contrar, acesta este un Core i7 tipic al generației Haswell: are patru nuclee, acceptă Hyper-Threading și are o cache L3 spațioasă de 8 MB. Nucleul grafic, ca și predecesorii săi, aparține clasei GT2, adică are 20 de actuatoare. Trebuie remarcat faptul că, datorită tehnologiei Turbo Boost 2.0, frecvența de operare tipică pentru Core i7-4790 este de 3,8 GHz.



Core i7-4790


O gamă completă de tehnologii de securitate, inclusiv vPro, TXT și VT-d, sunt, de asemenea, pe deplin acceptate de acest procesor. Cu alte cuvinte, Core i7-4790 este noua navă amiral pentru platforma LGA 1150, dar fără suport pentru overclocking.

Seria Core i5 are trei procesoare Haswell Refresh noi:



Frecvențele acestor procesoare au crescut și ele cu doar 100 MHz față de predecesorii lor. Dar acest lucru s-a dovedit a fi suficient pentru ca vechiul Core i5-4690 să devină mai rapid decât Core i5-4670K și să preia conducerea în această linie. Procesoarele rămase au fost plasate organic în sloturi de frecvență libere anterior. Celelalte caracteristici ale acestora nu s-au schimbat. Hyper-Threading nu este acceptat în seria Core i5, cache-ul L3 este redus la 6 MB, nucleul grafic utilizat este GT2.



Core i5-4690



Core i5-4590



Core i5-4460


Mai tânăr Procesor de bază I5-4460 ocupă un loc special în serie: dezactivează tehnologiile de securitate vPro și TXT și nu acceptă instrucțiuni pentru lucrul cu memoria tranzacțională. Tehnologia Turbo Boost 2.0 face ca frecvența de operare tipică pentru Core i5-4690 – 3,7 GHz, pentru Core i5-4590 – 3,5 GHz și pentru Core i5-4460 – 3,2 GHz.

Seria Core i3 cu lansarea Haswell Refresh a crescut cu încă trei modificări:



Și aici a existat o creștere cu 100 MHz a frecvențelor de ceas, păstrând toate celelalte caracteristici. Procesoarele Core i3, spre deosebire de modelele mai vechi, sunt dual-core, dar acceptă tehnologia virtuală multi-threading Hyper-Threading. Din acest motiv, au o disipare a căldurii calculată mai mică la 54, mai degrabă decât la 84 W. Trebuie menționat că la momentul anunțului Haswell Refresh nu existau sloturi de frecvență libere în linia Core i3, așa că s-a dovedit că modelul Core i3-4350 coincidea complet ca caracteristici cu Core i3-4340. Singura diferență între noua modificare este prețul mai mic.



Core i3-4360



Core i3-4350



Core i3-4150


Procesoarele Core i3-4360 și Core i3-4350 au un cache L3 de 4 MB, în timp ce Core i3-4150 are un cache redus la 3 MB. Nucleul grafic este, de asemenea, mai rău la modelul mai tânăr. Deși toate Core i3-urile sunt echipate oficial cu grafică GT2, Core i3-4150 a redus numărul de unități de execuție GPU de la 20 la 16.

Orice procesor LGA 1150 Haswell Refresh nu impun nicio condiție suplimentară plăcilor de bază. În ciuda faptului că apariția lor este, de asemenea, programată pentru a actualiza platforma cu transferul la noile seturi logice din seria a noua (Z97 și H97), toate procesoarele noi funcționează fără probleme în vechile plăci de bază LGA 1150 cu chipset-uri din seria a opta. Pentru ca plăcile lansate anul trecut să fie recunoscute corect, este necesară doar o actualizare a BIOS-ului.

În ceea ce privește capabilitățile de overclocking, Haswell Refresh, lansat până în prezent, nu are deloc niciuna dintre ele. Creșterea frecvențelor peste valoarea nominală prin schimbarea multiplicatorului este imposibilă, în timp ce overclockarea pe magistrală este extrem de limitată. De fapt, limita până la care un ceas de bază poate fi overclockat este în jur de 105-110 MHz. Adică, achiziționarea Haswell Refresh cu scopul de a le opera în moduri anormale nu are sens. Cu toate acestea, procesoarele fără overclocking pentru platforma LGA 1150 permit încă overclockarea memoriei la nivelul DDR3-2400.

Cum am testat

Am comparat noile procesoare aparținând setului Haswell Refresh cu predecesorii lor, Haswell obișnuiți, care sunt disponibile la vânzare de aproape un an. Ca rezultat, lista componentelor hardware implicate în testare este următoarea:

Procesoare:

Intel Core i7-4790 (Haswell, 4 nuclee + HT, 3,6-4,0 GHz, 4x256 KB L2, 8 MB L3);
Intel Core i7-4770K (Haswell, 4 nuclee + HT, 3,5-3,9 GHz, 4x256 KB L2, 8 MB L3);
Intel Core i5-4690 (Haswell, 4 nuclee, 3,5-3,9 GHz, 4x256 KB L2, 6 MB L3);
Intel Core i5-4670K (Haswell, 4 nuclee, 3,4-3,8 GHz, 4x256 KB L2, 6 MB L3);
Intel Core i5-4590 (Haswell, 4 nuclee, 3,3-3,7 GHz, 4x256 KB L2, 6 MB L3);
Intel Core i5-4570 (Haswell, 4 nuclee, 3,2-3,6 GHz, 4x256 KB L2, 6 MB L3);
Intel Core i5-4460 (Haswell, 4 nuclee, 3,2-3,4 GHz, 4x256 KB L2, 6 MB L3);
Intel Core i5-4440 (Haswell, 4 nuclee, 3,1-3,3 GHz, 4x256 KB L2, 6 MB L3);
Intel Core i3-4360 (Haswell, 2 nuclee + HT, 3,7 GHz, 2x256 KB L2, 4 MB L3);
Intel Core i3-4350 (Haswell, 2 nuclee + HT, 3,6 GHz, 2x256 KB L2, 4 MB L3);
Intel Core i3-4340 (Haswell, 2 nuclee + HT, 3,6 GHz, 2x256 KB L2, 4 MB L3);
Intel Core i3-4150 (Haswell, 2 nuclee + HT, 3,5 GHz, 2x256 KB L2, 3 MB L3);
Intel Core i3-4130 (Haswell, 2 nuclee + HT, 3,4 GHz, 2x256 KB L2, 3 MB L3).

Cooler CPU: Noctua NH-U14S.
Placa de baza: Gigabyte Z87X-UD3H (LGA1150, Intel Z87 Express).
Memorie: 2x8 GB DDR3-2133 SDRAM, 9-11-11-31 (G.Skill F3-2133C9D-16GTX).
Placa video: NVIDIA GeForce GTX 780 Ti (3GB/384-bit GDDR5, 876-928/7000 MHz).
Subsistem disc: Intel SSD 520 240 GB (SSDSC2CW240A3K5).
Alimentare: Corsair AX760i (80 Plus Platinum, 760 W).

Testarea a fost efectuată în sistem de operare Microsoft Windows 8 Enterprise x64 utilizând următorul set de drivere:

Driver pentru chipset Intel 10.0.13;
Driver Intel Management Engine 10.0.0.1204;
Tehnologia Intel Rapid Storage 13.0.3.1001;
Driver NVIDIA GeForce 335.23.

Performanţă

Performanța generală

Pentru a evalua performanța procesorului în sarcini obișnuite, folosim în mod tradițional pachetul de testare Bapco SYSmark, care simulează munca utilizatorului în programe și aplicații de birou moderne comune pentru crearea și procesarea. continut digital. Ideea testului este foarte simplă: produce o singură măsurătoare care caracterizează viteza medie ponderată a computerului în timpul utilizării de zi cu zi. Recent, acest benchmark a fost actualizat din nou, iar acum folosim cel mai mult ultima versiune– SYSmark 2014.



Rezultatele prezentate în diagramă sunt destul de așteptate. Avand in vedere ca procesoarele Haswell Refresh nu au imbunatatiri sau optimizari la nivel de microarhitectura, totul este decis de viteza de ceas. Și, întrucât la noile procesoare a crescut cu doar 100 MHz, diferența dintre indicatorii de performanță ai vechilor Haswell și ai reprezentanților multor Haswell Refresh care le înlocuiesc este în medie de 2,5 la sută. Mai precis: Core i7-4790 depășește Core i7-4771 (alias Core i7-4770K) cu 1,8%; Core i5-4690 bate Core i5-4670 cu 2,3 ​​la sută; Core i5-4590 bate Core i5-4570 cu 2,3%, Core i5-4460 bate Core i5-4440 cu 2,7%, Core i3-4360 bate Core i3-4340 cu 3,1%, iar Core i3- 4150 depășește Core i3-4130 cu 2,3 ​​la sută.

O înțelegere mai profundă a rezultatelor SYSmark 2014 poate fi oferită prin familiarizarea cu estimările de performanță obținute în diferite scenarii de utilizare a sistemului. Scenariul Office Productivity simulează un tipic munca de birou: pregătirea textelor, prelucrarea foilor de calcul, lucrul cu prin emailși vizitarea site-urilor de internet. Scriptul folosește următorul set de aplicații: Adobe Acrobat XI Pro, Google Chrome 32, Microsoft Excel 2013, Microsoft OneNote 2013, Microsoft Outlook 2013, Microsoft PowerPoint 2013, Microsoft Word 2013, WinZip Pro 17.5 Pro.



Scenariul Media Creation simulează crearea unei reclame folosind pre-filmat imagini digitaleși video. În acest scop, sunt utilizate pachetele populare Adobe Photoshop CS6 Extended, Adobe Premiere Pro CS6 și Trimble SketchUp Pro 2013.



Scenariul Date/Analiza financiară este dedicat analizei statistice și prognozării investițiilor bazate pe un anumit model financiar. Scenariul folosește cantități mari de date numerice și două aplicații: Microsoft Excel 2013 și WinZip Pro 17.5 Pro.




Performanța jocurilor

După cum știți, performanța platformelor echipate cu procesoare de înaltă performanță în marea majoritate a jocurilor moderne este determinată de puterea subsistemului grafic. De aceea, atunci când testăm procesoare, selectăm cele mai multe jocuri dependente de procesor și măsurăm de două ori numărul de cadre. Testele de primă trecere sunt efectuate fără a activa anti-aliasing și cu setări care sunt departe de cele mai multe rezoluții înalte. Astfel de setări vă permit să evaluați cât de bine performează procesoarele cu o sarcină de joc în principiu și, prin urmare, vă permit să speculați despre modul în care platformele de calcul testate se vor comporta în viitor, când vor apărea pe piață opțiuni mai rapide pentru acceleratoarele grafice. A doua trecere este efectuată cu setări realiste - atunci când selectați rezoluția FullHD și nivelul maxim de anti-aliasing pe tot ecranul. În opinia noastră, astfel de rezultate nu sunt mai puțin interesante, deoarece răspund la întrebarea frecventă despre ce nivel performanță de joc procesoarele pot oferi chiar acum – în condiții moderne.





















Nu am încărcat recenzia un număr mare teste de gaming, deoarece creșterea performanței oferită de familia de procesoare Haswell Refresh nu este foarte vizibilă. Cu toate acestea, în graficele de mai sus se pot observa mai multe diferite opțiuni diferite cum se ridică performanța în jocuri.

Astfel, Batman: Arkham Origin este un joc în care performanța oricărui procesor Intel este suficientă pentru a încărca complet grafica emblematică. card NVIDIA GeForce GTX 780 Ti. Ca urmare, vedem un impact extrem de nesemnificativ al alegerii procesorului asupra rezultatului, iar noul Haswell Refresh nu iese deloc în evidență față de predecesorii săi.

Civilization V: Brave New World este un joc de strategie în care calculele active sunt efectuate pe CPU, dar și aici este și el procesoare puternice se dovedesc a nu fi de folos. Începând de la Core i5-4570 și mai sus, creșterea performanței este aproape imperceptibilă. Cu toate acestea, chiar și sub această limită particulară, avantajul Haswell Refresh față de predecesorii echivalenti este de aproximativ 3%.

Metro: Last Light este un shooter foarte dependent de procesor, dar la setări de calitate maximă (în primul rând datorită teselării), rata de cadre este încă limitată de puterea plăcii video. Dar când rezoluția este redusă, puteți vedea un mic efect de la creșterea frecvenței în nou-anunțul Haswell Refresh. Scara sa este standard - aproximativ 2 procente.

În Thief, totul pare și mai interesant. Acesta este unul dintre puținele jocuri care au o atitudine negativă față de tehnologia Hyper-Threading în procesoarele quad-core. Este optimizat pentru patru fire, iar nucleele virtuale suplimentare din Core i7 reduc doar performanța. Dacă vorbim despre efectul pe care îl dă înlocuirea lui Haswell cu Haswell Refresh, acesta este din nou nesemnificativ: nu mai mult de 3 la sută la o rezoluție mai mică și nu mai mult de 1 la sută la setările grafice maxime.

Teste în aplicații

În Autodesk 3ds max 2014 măsuram viteza de randare în raza mentală o scenă complexă special pregătită.



Performanța noului Adobe Premiere Pro CC este testată prin măsurarea timpului de redare a unui proiect Blu-Ray H.264 care conține videoclip HDV 1080p25 cu diferite efecte aplicate.



Măsurăm performanța în noul Adobe Photoshop CC folosind propriul nostru test, o reluare creativă a testului de viteză Photoshop Retouch Artists, care implică procesarea tipică a patru imagini de 24 de megapixeli realizate cu o cameră digitală.



Pentru a măsura viteza procesoarelor la comprimarea informațiilor, folosim arhivatorul WinRAR 5.0, cu ajutorul căruia arhivăm un folder cu diverse fișiere cu un volum total de 1,7 GB cu raportul de compresie maxim.



Pentru a evalua viteza de transcodare video în format H.264, a fost folosit testul x264 FHD Benchmark 1.0.1 (64 de biți), bazat pe măsurarea timpului în care codificatorul x264 codifică sursa video în format MPEG-4/AVC cu un rezoluție de 1920x1080@50fps și setări implicite. Trebuie remarcat faptul că rezultatele acestui benchmark sunt de mare importanță practică, deoarece codificatorul x264 stă la baza numeroaselor utilitare de transcodare populare, de exemplu, HandBrake, MeGUI, VirtualDub etc. Actualizăm periodic codificatorul utilizat pentru măsurarea performanței, iar această testare a implicat versiunea r2431, care acceptă toate seturile de instrucțiuni moderne, inclusiv AVX2.



Nicio aplicație nu dezvăluie avantaje notabile ale procesoarelor Haswell Rafresh față de predecesorii lor. Acest lucru este destul de natural. Singura schimbare în noile procesoare este o frecvență crescută. Deci pur și simplu nu există unde să obțineți o creștere vizibilă a performanței. Rezultatele noilor Core i7-4790, Core i5-4690, Core i5-4590, Core i5-4460, Core i3-4360, Core i3-4350 și Core i3-4150 sunt mai bune decât cele de aceeași clasă și tip care au fost pe piață de mult timp același cost cu maxim 3 la sută.

Consumul de energie

Schimbările de performanță prezentate de Haswell Refresh sunt complet neimpresionante. Nu ar trebui să existe alte îmbunătățiri în noile modificări ale procesoarelor, bazate pe faptul că acestea se bazează pe un cristal semiconductor din vechea revizuire. Cu toate acestea, există puține speranțe pentru unele îmbunătățiri ale performanței termice și energetice, care ar putea apărea din cauza îmbunătățirilor în procesul de producție. Să verificăm.

Următoarele grafice, dacă nu se menționează altfel, arată consumul total de energie al sistemelor (fără monitor), măsurat la priza la care este conectată sursa de alimentare a sistemului de testare și reprezentând suma consumului de energie al tuturor componentelor implicate în sistem. Indicatorul total include automat eficiența sursei de alimentare în sine, însă, având în vedere că modelul de alimentare pe care îl folosim, Corsair AX760i, are certificat 80 Plus Platinum, influența acestuia ar trebui să fie minimă. Pentru a evalua corect consumul de energie, am activat modul turbo și toate tehnologiile disponibile de economisire a energiei: C1E, C6 și Enhanced Intel SpeedStep.

În primul rând, s-a măsurat consumul la ralanti.



Aici toate procesoarele au dat dovadă de unanimitate rară. Acest lucru este de înțeles: atunci când este inactiv, Haswell trece la stări de economisire a energiei și își reduce consumul de energie la valori aproape zero. Prin urmare, numerele prezentate în diagramă sunt mai reprezentative pentru consumul restului platformei de testare.

Am măsurat apoi consumul maxim sub sarcină creat de versiunea pe 64 de biți a utilitarului LinX 0.6.5 cu suport pentru setul de instrucțiuni AVX2, bazat pe pachetul Linpack.



Diagrama de mai sus demonstrează foarte clar lipsa oricăror îmbunătățiri în consumul de energie pentru procesoarele Haswell Refresh. Modelele mai noi și mai rapide necesită mai multă energie electrică decât predecesorii lor. În același timp, overclockarea de 100 MHz efectuată în noile modificări ale procesorului are ca rezultat o creștere cu aproximativ 5% a consumului de energie. Rețineți că, în ciuda acestui fapt, Intel nu a considerat necesară creșterea anvelopei termice pentru Haswell. Cu alte cuvinte, disiparea căldurii oricărui Core i7 și Core i5 ar trebui să se potrivească în cadrul de 84 de wați, iar Core i3 ar trebui să se potrivească în cadrul de 54 de wați.

Având în vedere că consumul de energie inițiat de utilitarul LinX, bazat pe pachetul Linpack, depășește cu mult nivelul mediu realist, am măsurat consumul sub o încărcare mai „mondană” - transcodare video folosind versiunea pe 64 de biți a versiunii de codec x264 r2431 .



În general, imaginea de aici este exact aceeași cu încărcarea creată de LinX. Doar valorile absolute ale consumului de energie sunt mai mici. Cu toate acestea, procesoarele Haswell Refresh consumă mai mult decât predecesorii lor din aceeași clasă cu aceeași 5 procente. Toate acestea înseamnă un singur lucru: nu s-au făcut îmbunătățiri în consumul noilor modele Haswell.

Nu există modificări evidente în regimul de temperatură al noilor produse. Evident, în Haswell Refresh obișnuit, materialul termoconductor de sub capac rămâne la fel de nereușit ca înainte. Când are loc o încărcare, temperatura de bază a noilor procesoare crește aproape instantaneu și rămâne la un nivel ridicat chiar dacă în sistem este instalat un răcitor eficient. De exemplu, în cazul nostru, când folosiți coolerul Noctua NH-U14S, mai vechiul Haswell Refresh Core i7-4790 s-a încălzit foarte repede până la 84 de grade când rulează utilitarul LinX. Și asta fără nici un overclocking, în modul nominal!



Să vă reamintim că temperatura maximă la care procesoarele din familia Haswell permit accelerarea este de 100 de grade.

Concluzii

Pentru a rezuma, suntem nevoiți să afirmăm că numele tare Haswell Refresh a fost dat procesoarelor complet obișnuite, care nu aduc practic nimic nou odată cu lansarea lor. Intel nu a făcut nicio lucrare de inginerie pentru a le produce. Prin urmare, calitățile de consum ale procesoarelor noi pentru platforma LGA 1150 nu sunt practic diferite de ceea ce era oferit înainte. Numărul de nuclee, cantitatea de memorie cache, tipul de nucleu grafic încorporat, setul de tehnologii acceptate - totul rămâne neschimbat. Nici la nivelul matriței nu s-au făcut optimizări, astfel încât disiparea căldurii și consumul de energie al Haswell Refresh au rămas la nivelurile tipice Haswell.

Singurul loc unde puteți vedea măcar o mișcare înainte este viteza ceasului. Cu toate acestea, având în vedere că creșterea frecvențelor nu este susținută de nicio îmbunătățire tehnologică sau de inginerie, ci este doar o simplă overclockare a modelelor mai vechi, creșterea acestora s-a dovedit a fi extrem de slabă. De fapt, ca parte a Haswell Refresh, Intel a crescut viteza procesoarelor sale cu cel mai mic delta posibil - 100 MHz. În consecință, am văzut exact aceeași, minimă, creștere a performanței în timpul testării. Noile procesoare Haswell Refresh s-au dovedit a fi mai rapide decât vechiul Haswell cu 2-3 la sută și nimic mai mult.

Toate acestea înseamnă că lansarea lui Haswell Refresh poate fi de interes doar dacă nu ați migrat încă pe platforma LGA 1150 Având în vedere că costul modelelor noi nu este mai mare decât al celor vechi, atunci când cumpărați un computer nou, acesta este acum destul de firesc să ceri în magazine exact modificări noi ale procesoarelor. Și dacă furnizorul dvs. preferat nu are încă Haswell Refresh în lista de prețuri, este mai bine să așteptați puțin cu achiziția, dar mai târziu obțineți performanțe puțin mai mari pentru aceiași bani.

Și, în plus, nu uitați că în aproximativ trei săptămâni vom vedea lansarea unui alt cuplu de procesoare, clasificate oficial ca actualizate Haswell, Core i7-4790K și Core i5-4690K. Aceste procesoare, care au propriul nume de cod Devil’s Canyon, spre deosebire de modelele revizuite astăzi, promit să devină un cadou grozav pentru entuziaști. Acestea vor prezenta frecvențe de ceas semnificativ îmbunătățite, temperaturi de funcționare mai scăzute și cel mai bun overclocking. Dar să nu trecem înaintea noastră: revizuire completă Puteți citi despre Core i7-4790K și Core i5-4690K pe site-ul nostru puțin mai târziu.

Nu ar trebui să vă așteptați la o creștere specială a performanței de la procesoarele Haswell quad-core (cu excepția cazului în care, desigur, software-ul este adaptat la noile seturi de instrucțiuni ale procesorului), punctul lor forte este consumul redus de energie și raportul preț-performanță. Cu toate acestea, când vine vorba de hardware de top, abordarea „câștig cu orice preț” este încă relevantă.

Procesoarele Intel mainstream au devenit dual-core în 2006, odată cu apariția Core 2 Quad. Quad-core-urile „au devenit mainstream” în 2008, odată cu tranziția la Nehalem și LGA1156, iar numărul de nuclee nu se va schimba în viitorul apropiat - cel puțin până în 2014, când este planificată lansarea cipurilor Broadwell, care vor fi produse folosind o tehnologie de proces de 14 nm. Această decizie este destul de justificată, având în vedere că beneficiile oferite de nucleele suplimentare nu sunt încă revendicate de majoritatea programelor - efectul unui procesor grafic mai puternic sau al memoriei cache suplimentare va fi mai semnificativ. Cu toate acestea, cu procesoare de ultimă generație interval de preț totul nu a fost atât de simplu, pentru că... Software-ul pentru stații de lucru și servere este perfect optimizat pentru procesoarele multi-core și atât creșterea numărului de nuclee, cât și creșterea producției fiecărui nucleu pot aduce rezultate.

Acum, datorită surselor noastre IDF, putem clarifica puțin lucrurile. După cum deja știu cititorii noștri, până la jumătatea anului viitor, procesorul de top pentru sistemele server, Xeon E7 4800 cu 10 nuclee de 2,4 GHz din familia „Westmere EX” va fi înlocuit cu un reprezentant al arhitecturii „Ivy Bridge EX” Xeon. E7 4800 v2, care are 15 nuclee și funcționează la frecvențe de la 2,2 GHz, care va fi instalat în soclul LGA2011, dar cu un pinout diferit. La mijlocul anului 2014, acesta poate fi înlocuit cu un Xeon E7 4800 / 8800 v3 cu 16-20 de nuclee (arhitectură Haswell EX), iar soclul va rămâne același. Acesta va fi urmat de Xeon E7 4800/8800 v4 (arhitectura Broadwell EX), care va fi lansat în 2015. Ultimele trei modele au o caracteristică comună

Sub forma unui autobuz QPI cu trei benzi - Westmere are patru - care va afecta negativ capacitatea de a interacționa cu coprocesoarele Xeon Phi sau capacitatea de a oferi acces la viteza maximă la memoria sistemului, ceea ce poate fi util la conectarea unui FPGA.

Cel mai interesant caz este configurația cu dual-procesor, pentru că are multe în comun (cel puțin socket-ul și chipset-ul) cu hardware-ul poziționat ca hardware home high-end. În prezent situația arată astfel:

Actualul Xeon E5 2600 / 4600 cu 8 nuclee (Sandy Bridge EP) va fi înlocuit la jumătatea anului viitor cu Xeon E5 2600 / 4600 v2 cu 10 nuclee (Ivy Bridge EP), care va folosi același soclu. Următorul upgrade este planificat pentru 2014 - Xeon E5 2600 / 4600 v3 (Haswell EP) va avea până la 14 nuclee și un controler DDR4-2133 cu 14 canale, înlocuind DDR3 utilizat în sistemele Ivy Bridge EP și canale QPI duale cu lățime de bandă de aproximativ 9,6 GT/s, puțin mai mult decât

Acum, care va fi instalat într-o priză similară cu cea din 2011 ca dimensiune, dar cu un pinout diferit. Dar de ce să crești și mai mult numărul de nuclee dacă componentele din seria EX sunt deja reperul pentru performanță?


Îmi vin în minte două motive principale. În primul rând, creșterea performanței specifice per nucleu pe care Haswell o oferă nu este atât de mare - aproximativ 10% în comparație cu Ivy Bridge, cu excepția cazului în care software-ul este adaptat pentru a utiliza instrucțiuni noi de procesor, care este posibil să nu fie utilizate în toți algoritmii. Ceea ce nu este surprinzător, deoarece Haswell s-a concentrat asupra designului pe reducerea consumului de energie (ultrabook-uri!). Deci, de unde obțineți câștigurile de productivitate care ar crește vânzările?

Pe de altă parte, consumul mai mic de energie vă permite să plasați mai multe nuclee pe un singur cip cu același TDP. Astfel, procesorul cu 14 nuclee se încadrează în limita de 145 W (pentru servere) și 160 (pentru stații de lucru), în timp ce cantitatea de cache L3 per nucleu rămâne aceeași - 2,5 MB. Dacă o strategie de creștere atât de extinsă este justificată este o problemă controversată. În același TDP, aș prefera să văd un procesor cu mai puține nuclee, dar mai mult cache per nucleu și mai multe

Viteze mari de ceas și un număr semnificativ de proprietari de mașini high-end

Ați fi de acord cu mine, deoarece capacitatea software-ului de a utiliza un număr mai mare de fire de execuție a crescut ușor peste cele 5 generații de procesoare Intel. Într-un fel sau altul, chiar și cu 14 nuclee, noile modele ar trebui să aibă cel puțin aceleași viteze de ceas ca și predecesorii lor Ivy Bridge în același TDP, ceea ce înseamnă cel puțin 3,2 GHz pentru modelele de stații de lucru de top.

La aceste frecvențe, performanța maximă teoretică pe soclu ar fi de 3/4 teraflopi cu precizie dublă, deci un procesor dublu statie de lucru Modelul de la jumătatea anului 2014 va produce 1,5 teraflopi la viteza maximă. Adăugați la asta un controler de memorie DDR4 cu 8 canale și veți înțelege că Nvidia Maxwell are un concurent serios. La urma urmei, dacă procesorul are suficient

Deoarece este puternic și nu trebuie să rescrieți software-ul aproape de la zero, de ce să nu îl folosiți? În orice caz, optimizarea aplicațiilor pentru GPGPU cu numărul lor imens de fire de execuție va duce, de asemenea, la faptul că nici un singur nucleu din procesoare multi-core nu va fi inactiv. De asemenea, nu uitați că Intel nu este singura companie de pe piață, iar concurentul său are experiență în dezvoltarea de unități de calcul combinate, care, în lumina convergenței CPU-urilor și GPU-urilor, ar putea fi șansa AMD de a ajunge din urmă. Așteptați cu nerăbdare APU Opteron?

Dacă pe partea procesorului, AMD a fost de mult angajat într-o luptă de gherilă, atunci în ceea ce privește piața adaptoarelor video, până acum a trebuit să lupte doar cu „prietenul său jurat” Nvidia. Dar situația se poate schimba în curând.

Următoarea generație de arhitectură Intel, cu numele de cod Haswell, nu este doar o altă „bifă” în ciclul măsurat de îmbunătățire a tehnologiei de Intel, aceasta este o nouă etapă în activitățile sale. Etapa în care devine o amenințare serioasă atât pentru AMD, cât și pentru Nvidia. Pentru prima dată, Intel este gata să-i provoace pe amândoi pe piața mainstream de grafică, subminând în același timp poziția Nvidia în afacerea GPGPU. În același timp, soluțiile cu consum redus și eficiență energetică (versiunile ULV ale procesoarelor au un TDP de 10 W) vor deveni concurenți serioși pentru SoC-urile bazate pe platforma Brazos de a doua generație de la AMD (denumit de cod Kabini), precum și orice laptopuri. bazat pe procesoare ARM bazate pe Bazat pe Windows 8 pe care companii precum Qualcomm le pot aduce pe piață.

Să aruncăm o privire mai atentă asupra acestei arhitecturi, începând cu procesorul.


Mai lat, mai mare, mai rapid.

Haswell este o continuare logică a îmbunătățirilor microarhitecturale introduse de Intel pentru prima dată în Sandy Bridge. Noul cip a primit suport pentru a doua generație a setului de instrucțiuni pentru procesor Advanced Vector Extensions (AVX2), care dublează vârful debitului Miezuri FPU. Lățimea de bandă cache L1 și L2 a fost dublată pentru a menține ocupate unitățile de execuție, iar fișierele de registru întreg și FPU au fost mărite. Performanța de predicție a ramurilor a fost, de asemenea, îmbunătățită. Performanța lui Haswell per fir în sarcinile din lumea reală pe cod neoptimizat este de așteptat să se îmbunătățească cu 10-15%. Dacă există optimizare pentru AVX2, decalajul va fi mult mai mare - algoritmii AVX2 includ suport pentru vectorizarea valorilor întregi, care nu este în prima versiune.

Creșterea puterii FPU și a funcționalității suplimentare AVX2 vor face o diferență uriașă în creșterea performanței în virgulă mobilă. Procesorul este capabil să efectueze până la 32 de operații în virgulă mobilă cu precizie standard pe un singur nucleu și 16 operațiuni cu virgulă mobilă cu precizie dublă. Este de două ori mai mult decât Sandy Bridge; teoretic, un procesor Haswell cu opt nuclee cu o frecvență de ceas de 3,8 GHz va produce 972,8 gigaflopi la nivelul standard de precizie și 486,4 gigaflopi la dublu. Și deși GPU-urile din actuala generație arată chiar cele mai bune rezultate, Intel are un as în mânecă - compatibilitatea x86. Intel a trimis furnizorii de supercomputere RISC la coșul de gunoi al istoriei în anii 1990 și începutul anilor 2000 pur și simplu pentru că procesoarele lor erau „destul de bune”, iar acum același lucru amenință Nvidia și conceptul său GPGPU. Lățimea de bandă a memoriei cache L1/L2 a crescut dramatic, iar lățimea de bandă a magistralei L1 a fost, de asemenea, dublată. Toată lățimea de bandă suplimentară este concepută pentru a împiedica unitățile AVX2 să stea inactiv; Este de așteptat ca Haswell să arate o corespondență destul de strânsă a valorilor performanței teoretice cu viteza sarcinilor din lumea reală.

Și în timp ce echipa green-flag va menține probabil un avantaj în performanța pură, procesorul Haswell quad-core, care ajunge la 4 GHz în modul turbo, va produce 256 gigaflopi pentru operațiuni cu precizie dublă (512 gigaflopi la precizie standard). Acest nivel de performanță de precizie standard este foarte apropiat de GT 640 de la Nvidia. Și, deoarece performanța de dublă precizie a fost întotdeauna slabă pe plăcile de consum ale Nvidia, procesoarele quad-core de la Haswell ar putea să depășească cu ușurință GTX 680 de la Nvidia și, eventual, să se potrivească cu GTX 580 în operațiuni cu dublă precizie.

Nvidia poate câștiga bătălia pentru utilizatorii high-end, dar cu prețul pierderii în alte domenii - dacă Intel decide să concureze serios cu ea. Și mai rău, nu uitați de faptul că fiecare PC echipat cu o placă grafică Nvidia vine cu un accelerator Intel implicit. Fără îndoială, Intel va juca pe potențiala conexiune cu Xeon Phi, având în vedere că trei dintre atelierele IDF ale companiei au abordat problema vectorizării și au acoperit atât Haswell, cât și Xeon Phi.


Haswell GPU crește presiunea asupra Nvidia, AMD.

GPU-ul Haswell este în esență o versiune modificată a nucleelor ​​utilizate în prezent în Ivy Bridge. Principalele modificări se observă în shader array - Intel va oferi Haswell în versiuni cu un bloc care include 10, 20 sau 40 de shadere (GT1, GT2, GT3, respectiv). Cipul va fi oferit și în variante care includ până la 128 MB de memorie integrată - această opțiune oferă fiecărui GPU o cantitate mică de memorie dedicată. Intel nu a fost foarte receptiv cu privire la modificările aduse GPU-ului, dar compania a spus că câștigurile de performanță au demonstrat noua configuratie GT3 în comparație cu performanța nucleului grafic HD 4000 încorporat în Ivy Bridge este de până la 200%.

Chiar dacă luăm aceste informații cu o doză sănătoasă de scepticism, tot nu este de bun augur pentru AMD și Nvidia. Potrivit Anandtech, Trinity GPU este în medie cu 18% mai rapid decât Liano în jocuri. În comparație cu Sandy Bridge, Trinity este cu aproape 80% mai rapidă. Dacă îl comparăm cu Ivy Bridge, avantajul scade la 20%. Având în vedere ceea ce se știe deja despre GPU-ul Haswell și performanța sa proiectată, Intel nu va fi prea dificil să ofere câștiguri de performanță de 30-50% în jocurile din lumea reală. Dacă se întâmplă acest lucru, Trinity își va pierde statutul de cel mai rapid GPU integrat de pe piață, trecând în categoria de rang mediu, iar AMD își va pierde atuul pe piața plăcilor grafice, pe care o joacă de la lansarea AMD. Chipset 780G acum patru ani.


Acest lucru lasă Sunnyvale cu puțin spațiu de manevră. APU-ul Kaveri de 28 nm, echipat cu un nucleu grafic de generație următoare bazat pe Radeon HD 7000, și noile procesoare bazate pe arhitectura Steamroller nu au primit încă o dată de anunț. Asta înseamnă că s-ar putea să nu le vedem până la sfârșitul anului 2013 și asta dacă producția merge fără probleme. Cel mai probabil, AMD va oferi o actualizare - ceva de genul Trinity 2.0 - pentru a reduce atacul de la Haswell, dar este puțin probabil ca frecvențele puțin mai mari să salveze situația pentru AMD.

Ultimele bastioane ale AMD rămân piețe pe care Intel este în general neinteresant. Aceasta este o poziție precară pentru orice companie care visează să provoace liderul de piață; AMD pur și simplu nu își poate permite să cheltuiască suficient pentru cercetare și dezvoltare pentru a ajunge din urmă rivalului său de multă vreme. Și Nvidia cu greu se poate odihni pe lauri. Planurile Intel arată clar că compania se angajează absolut să minimizeze valoarea individuală GPU-uri prin utilizarea soluțiilor integrate acolo unde este posibil și sprijinirea tranziției către factori de formă din ce în ce mai mici acolo unde acest lucru nu este (încă) posibil.

Astfel, cu excepția cazului în care Haswell este un eșec complet, acesta, și nu Kaveri, va deveni noul punct de referință pentru entuziaști. Acest cip de 10 W nu va putea concura direct cu potențialii concurenți ai tabletei Tegra 4 - aceasta este treaba SoC-ului de 22 nm bazat pe Atom de la Bay Trail.

Nu, Haswell nu va falimenta AMD și nici nu va speria Nvidia să renunțe la Tesla, dar dacă planul Intel nu este un eșec total, ambele companii vor fi strecurate pe piețe de nișă. AMD ia la inimă această mișcare - este introdusă pe piețele pentru produse low-end care nu au nicio valoare pentru Intel. Nvidia va trebui acum să încerce din greu să convingă OEM-urile să găsească un loc pentru un GPU separat în computerele lor, deși politicile de marketing ale Intel și preferințele clienților trag în cealaltă direcție. Preferințe entuziaști, suport istoric slab Drivere Intel, iar puterea mărcii Nvidia va ajuta, dar coșul de gunoi din istoria industriei IT este plin de companii care credeau că marca lor va păstra utilizatorii chiar dacă specificatii tehnice produsele lor sunt mai proaste decât cele ale concurenților lor. Pasionații sunt interesați doar de performanță, nu de compania care se află în spatele acesteia.

Cu toate acestea, până acum am vorbit doar despre soluții pentru entuziaști și desktop, ceea ce este puțin contra-intuitiv, având în vedere cota de piață în creștere a laptopurilor și ultrabook-urilor. Multe îmbunătățiri aduse arhitecturii Haswell au vizat în mod special optimizarea acestora. Care anume? Să ne dăm seama.

Integrare


Haswell pentru ultrabook-uri va avea un TDP de 15W, la fel ca Sandy Bridge pe care se bazează ultrabook-urile astăzi. Vestea cea mare este că Intel va muta PCH (platform controller hub) pe același substrat ca și procesorul, permițând versiunii Ultrabook a lui Haswell să conțină toate componentele platformei pe un singur cip. Sandy Bridge a fost format din două componente furnizate de Intel - procesorul și PCH, în timp ce Haswell va fi un singur MCP (pachet multicip). Aceasta înseamnă că două cristale de calcul vor fi plasate pe un substrat, ceea ce este adesea o condiție prealabilă pentru combinarea cristalelor în sine (poate după trecerea la o tehnologie de proces de 14 nm?). Un singur MCP va ocupa o suprafață mai mică decât combinația CPU + PCH care este utilizată în prezent, ceea ce va face aspectul plăcilor de bază mai puțin densă (sau va face plăcile în sine mai mici) și, eventual, va pune baterii și mai mari în ultrabook-uri. Acesta este un pas semnificativ și demonstrează că linia dintre hardware-ul tabletă și ultrabook începe să se estompeze.

Este de remarcat faptul că Haswell pentru ultrabook-uri poate avea maximum două nuclee, deși versiunile pentru laptopuri și sisteme desktop pot avea mai multe.

Memorie eficientă din punct de vedere energetic și soclu nou

Lista de memorie acceptată a fost, de asemenea, ajustată pentru a optimiza consumul de energie. Toate cele trei versiuni de Haswell vor suporta DDR3L, deși versiunea desktop poate folosi opțional DDR3 obișnuit, iar versiunea ultrabook poate folosi LPDDR3. Toate cele trei opțiuni sunt echipate cu două canale de memorie.

Este important de reținut că, în ciuda concentrării lui Haswell pe eficiența energetică, arhitectura se scalează la fel de bine ca și Sandy Bridge (componentele de desktop cu un TDP de 95 W vor fi disponibile, deși compararea directă a pachetelor termice poate să nu fie în întregime corectă). Ceea ce are sens, deoarece o singură arhitectură eficientă poate acoperi de obicei o gamă largă de TDP-uri fără a sacrifica eficiența.

Alte caracteristici Haswell includ regulatoare de tensiune încorporate (care ar trebui să simplifice aspectul plăcii de bază), suport pentru setul de instrucțiuni AVX 2.0 și, desigur, AES-NI și Hyper-Threading. Lansarea lui Haswell va presupune, de asemenea, o schimbare a soclului: LGA-1150 va fi folosit pe computerele desktop.


Concluzie

În realitate, nu există nicio surpriză aici. Toată lumea știa că nucleele grafice integrate vor deveni mai rapide, deși încă nu era clar cât de puternică va fi varianta GT3. Adevăratul test al capabilităților sale va fi decizia producătorilor dacă să continue să instaleze adaptoare video discrete în produsele lor (exemplul Apple ar fi foarte instructiv în ceea ce privește, de exemplu, Macbook Pro). Din câte știm, planurile Intel de a-și consolida poziția pe segmentul de grafică integrată au fost întâmpinate cu deplină aprobare la Cupertino.

Continuarea integrării de noi funcții într-un singur cip - un pas semnificativ în domeniul CPU x86 clasa inalta, și totul indică faptul că în viitorul 2013 diferența dintre tablete și laptopuri se va estompa și mai mult.

Este arhitectura lui Haswell demnă să fie numită nouă și reproiectată?

De mai bine de cinci ani, Intel a urmat o strategie tic-tac, alternând tranziția unei arhitecturi specifice la norme tehnologice mai sofisticate cu lansarea unei noi arhitecturi.

Drept urmare, în fiecare an primim fie o nouă arhitectură, fie o tranziție la un nou proces tehnic. „Așa” a fost planificat pentru 2013, adică lansarea unei noi arhitecturi - Haswell. Procesoarele cu noua arhitectură sunt produse folosind aceeași tehnologie de proces ca și generația anterioară Ivy Bridge: 22 nm, Tri-gate. Procesul tehnic nu s-a schimbat, dar numărul de tranzistori a crescut, ceea ce înseamnă că a crescut și zona finală a cristalului noului procesor - și după aceasta, consumul de energie.

Aderând la tradiții, în ziua anunțului Haswell, Intel a prezentat doar procesoare performante și scumpe din liniile Core i5 și i7. Anunțul procesoarelor dual-core de linii inferioare este, ca întotdeauna, întârziat. Este de remarcat faptul că prețurile pentru procesoarele noi au rămas la același nivel cu cele ale Ivy Bridge.

Să comparăm zonele de matriță ale diferitelor generații de procesoare quad-core:

După cum puteți vedea, Haswell quad-core are o suprafață de doar 177 mm², în timp ce podul de nord și controlerul sunt integrate în el. RAMși nucleul grafic. Astfel, numărul de tranzistori a crescut cu 200 de milioane, iar suprafața a crescut cu 17 mm². Dacă comparăm Haswell cu Sandy Bridge de 32 nm, atunci numărul de tranzistori a crescut cu 440 de milioane (38%), iar zona datorată trecerii la tehnologia procesului de 22 nm a scăzut cu 39 mm² (18%). Disiparea căldurii a rămas aproape la același nivel în toți acești ani (95 W pentru SB și 84 W pentru Haswell), iar zona a scăzut.

Toate acestea au dus la faptul că trebuie îndepărtată mai multă căldură din fiecare milimetru pătrat al cristalului. Dacă mai devreme de la 216 mm² era necesar să se ia 95 W, adică 0,44 W/mm², acum de la o suprafață de 177 mm² este necesar să se ia 84 W - 0,47 W/mm², ceea ce este cu 6,8% mai mult decât înainte . Dacă această tendință continuă, în curând va fi pur și simplu greu fizic să eliminați căldura din zone atât de mici.

Pur teoretic, putem presupune că dacă la Broadwell, care va fi produsă folosind o tehnologie de proces de 14 nm, numărul de tranzistori va crește cu 21%, ca și în trecerea de la 32 la 22 nm, iar aria se va reduce cu 26 % (cu aceeași cantitate ca atunci când trecem de la 32 la 22 nm), obținem 1,9 miliarde de tranzistori pe o suprafață de 131 mm². Dacă și disiparea căldurii scade cu 19%, atunci obținem 68 W, sau 0,52 W/mm².

Acestea sunt calcule teoretice, în practică va fi diferit - trecerea procesului tehnologic de la 32 la 22 nm a fost marcată și de introducerea tranzistoarelor 3D, care au redus curenții de scurgere și, odată cu ei, generarea de căldură. Cu toate acestea, nu s-a auzit încă nimic de genul acesta despre trecerea de la 22 nm la 14 nm, așa că, în practică, valorile de disipare a căldurii vor fi cel mai probabil și mai rele și nu ar trebui să sperați la 0,52 W/mm². Cu toate acestea, chiar dacă nivelul de disipare a căldurii este de 0,52 W/mm², problema supraîncălzirii locale și dificultatea de a îndepărta căldura dintr-un cristal mic va deveni și mai gravă.

Apropo, tocmai dificultățile legate de disiparea căldurii cu un nivel de disipare a căldurii de 0,52 W/mm² pot sta la baza dorinței Intel de a trece la BGA sau încercările de a desființa priza. Dacă procesorul este lipit de placa de bază, atunci căldura va fi transferată direct de la cip la radiator fără un capac intermediar. Acest lucru pare și mai relevant în lumina înlocuirii lipirii cu pastă termică sub capace procesoare moderne. Ne putem aștepta din nou la apariția procesoarelor „goale” cu cristale deschise, urmând exemplul lui Athlon XP, adică fără capac ca legătură intermediară în radiatorul.

Acest lucru se face pe plăcile video de mult timp, iar pericolul de ciobire a cristalului este atenuat de cadrul de fier din jurul acestuia, astfel încât plăcile video nu au astfel de „probleme urgente” precum pasta termică sub capacul procesorului. Cu toate acestea, overclockarea va deveni și mai dificilă, iar răcirea corectă a procesoarelor „mai subțiri” va deveni aproape o știință. Și toate acestea ne așteaptă foarte curând, dacă, bineînțeles, nu se întâmplă un miracol...

Dar hai să venim la pământ și să ne întoarcem să vorbim despre Haswell. După cum știm, Haswell a primit o serie de „îmbunătățiri/modificări” în raport cu Sandy Bridge (și, în consecință, Ivy Bridge, care a fost, în general, un transfer al SB la un proces tehnic mai subtil):

  • regulator de tensiune încorporat;
  • noi moduri de economisire a energiei;
  • creșterea volumului de buffer-uri și cozi;
  • creșterea capacității cache-ului;
  • creșterea numărului de porturi de lansare;
  • adăugarea de noi blocuri, funcții, API-uri în nucleul grafic integrat;
  • creșterea numărului de conducte din nucleul grafic.

Astfel, revizuirea noii platforme poate fi împărțită în trei părți: procesor, accelerator grafic integrat, chipset.

Partea procesorului

Modificările aduse procesorului includ adăugarea de noi instrucțiuni și noi moduri de economisire a energiei, includerea unui regulator de tensiune, precum și modificări la nucleul procesorului însuși.

Seturi de instrucțiuni

Arhitectura Haswell are noi seturi de instrucțiuni. Ele pot fi împărțite în două grupuri mari: care vizează creșterea performanței vectoriale și vizează segmentul de server. Primele includ AVX și FMA3, cele din urmă - virtualizare și memorie tranzacțională.

Extensii vectoriale avansate 2 (AVX2)

Suita AVX a fost extinsă la versiunea AVX 2.0. Kit-ul AVX2 oferă:

  • suport pentru vectori întregi pe 256 de biți (anterior exista suport doar pentru 128 de biți);
  • suport pentru instrucțiuni de colectare, care elimină cerința pentru locația adiacentă a datelor în memorie; acum datele sunt „colectate” de la diferite adrese de memorie - va fi interesant de văzut cum afectează acest lucru performanța;
  • adăugarea de instrucțiuni de manipulare/operații pe biți.

În general, noul set este mai axat pe aritmetica întregului, iar principalul beneficiu de la AVX 2.0 va fi vizibil doar în operațiunile întregi.

Fused Multiply-Add (FMA3)

FMA este o operație combinată de înmulțire-adunare în care două numere sunt înmulțite și adăugate la acumulator. Acest tip operațiunile sunt destul de comune și vă permit să implementați mai eficient multiplicarea vectorilor și matricelor. Suportul pentru această extensie ar trebui să crească semnificativ performanța operațiunilor vectoriale. FMA3 este deja acceptat în procesoarele AMD cu nucleul Piledriver, iar FMA4 este deja acceptat în Bulldozer.

FMA este o combinație de operație de înmulțire și adunare: a=b×c+d.

În ceea ce privește FMA3, acestea sunt instrucțiuni cu trei operanzi, adică rezultatul este scris pe unul dintre cei trei operanzi care participă la instrucțiune. Ca rezultat, obținem o operație de genul a=b×c+a, a=a×b+c, a=b×a+c.

FMA4 sunt instrucțiuni cu patru operanzi cu rezultatul scris în al patrulea operand. Instrucțiunea ia forma: a=b×c+d.

Apropo de FMA3: această inovație va crește productivitatea cu peste 30% dacă codul este adaptat la FMA3. Merită remarcat faptul că, atunci când Haswell era încă departe la orizont, Intel plănuia să implementeze FMA4 mai degrabă decât FMA3, dar ulterior și-a schimbat decizia în favoarea FMA3. Cel mai probabil, din această cauză Bulldozer a apărut cu suport FMA4: se spune că nu au avut timp să-l convertească la Intel (dar Piledriver a apărut cu FMA3). Mai mult, inițial Bulldozer în 2007 a fost planificat cu FMA3, dar după ce Intel a anunțat planurile de a implementa FMA4 în 2008, AMD și-a schimbat decizia lansând Bulldozer cu FMA4. Și Intel a schimbat apoi FMA4 în FMA3 în planurile sale, deoarece câștigul de la FMA4 în comparație cu FMA3 este mic, iar complicația circuitelor logice electrice este semnificativă, ceea ce crește și bugetul tranzistorului.

Câștigurile de la AVX2 și FMA3 vor apărea după ce software-ul este adaptat la aceste seturi de instrucțiuni, așa că nu ar trebui să vă așteptați la niciun câștig de performanță „aici și acum”. Și din moment ce producătorii de software sunt destul de inerți, performanța „suplimentară” va trebui să aștepte.

Memoria tranzacțională

Evoluția microprocesoarelor a dus la creșterea numărului de fire de execuție - un procesor desktop modern are opt sau mai multe dintre ele. Un număr mare de fire de execuție creează din ce în ce mai multe dificultăți la implementarea accesului la memorie multi-threaded. Este necesar să se controleze relevanța variabilelor din RAM: este necesar să se blocheze datele pentru scriere în timp util pentru unele fire și să se permită citirea sau modificarea datelor pentru alte fire. Acest sarcină dificilă, iar memoria tranzacțională a fost dezvoltată pentru a menține datele la zi în programele cu mai multe fire. Dar până acum, a fost implementat în software, ceea ce a redus productivitatea.

Haswell are o nouă extensie de sincronizare tranzacțională (TSX) - memorie tranzacțională, care este concepută pentru a implementa eficient programe cu mai multe fire și pentru a le crește fiabilitatea. Această extensie vă permite să implementați memoria tranzacțională „în hardware”, crescând astfel performanța generală.

Ce este memoria tranzacțională? Aceasta este o memorie care are în interior un mecanism de control procese paralele pentru a oferi acces la datele partajate. Extensia TSX constă din două componente: Hardware Lock Elision (HLE) și Restricted Transaction Memory (RTM).

Componenta RTM este un set de instrucțiuni pe care un programator le poate folosi pentru a începe, încheia și anula o tranzacție. Componenta HLE introduce prefixe care sunt ignorate de procesoarele fără suport TSX. Prefixele asigură blocarea variabilelor, permițând altor procese să folosească (citească) variabile blocate și să execute codul acestora până când apare un conflict de scriere a datelor blocate.

În acest moment, au apărut deja aplicații care folosesc această extensie.

Virtualizare

Importanța virtualizării este în continuă creștere: sunt din ce în ce mai multe servere virtuale situat pe unul fizic, iar serviciile cloud devin din ce în ce mai răspândite. Prin urmare, creșterea vitezei tehnologiilor de virtualizare și a mediilor virtualizate este o sarcină foarte urgentă în segmentul serverelor. Haswell conține mai multe îmbunătățiri care vizează în mod special creșterea performanței mediilor virtualizate. Să le enumerăm:

  • îmbunătățiri pentru a reduce timpul de tranziție de la sistemele oaspeți la sistemul gazdă;
  • a adăugat biți de acces la Extended Page Table (EPT);
  • Timpul de acces TLB a fost redus;
  • noi instrucțiuni pentru apelarea hypervisorului fără a executa comanda vmexit;

Ca rezultat, timpul de tranziție între mediile virtualizate a fost redus la mai puțin de 500 de cicluri de procesor. Acest lucru ar trebui să conducă la o reducere a performanței generale asociate cu virtualizarea. Și noul Xeon E3-12xx-v3 va fi probabil mai rapid în această clasă de sarcini decât Xeon E3-12xx-v2.

Regulator de tensiune încorporat

În Haswell, regulatorul de tensiune a fost mutat de pe placa de bază sub capacul procesorului. Anterior (Sandy Bridge), procesorul trebuia alimentat cu tensiuni diferite pentru miezul grafic, pentru agentul de sistem, pentru nucleele procesorului etc. Acum doar o singură tensiune Vccin 1,75 V este furnizată procesorului prin mufa, care este furnizată. la regulatorul de tensiune încorporat. Regulatorul de tensiune este format din 20 de celule, fiecare celulă creează 16 faze cu un curent total de 25 A. În total, obținem 320 de faze, ceea ce este semnificativ mai mult chiar decât cele mai sofisticate plăci de bază. Această abordare permite nu numai simplificarea aspectului plăcilor de bază (și, prin urmare, reducerea costului acestora), ci și reglarea mai precisă a tensiunilor din interiorul procesorului, ceea ce, la rândul său, duce la economii mai mari de energie.

Acesta este unul dintre principalele motive pentru care Haswell nu poate fi compatibil fizic cu vechiul soclu LGA1155. Da, putem vorbi despre dorința Intel de a câștiga bani lansând o nouă platformă (nou chipset) în fiecare an și un nou socket la fiecare doi ani, dar în acest caz există o modalitate de a schimba socket-ul motive obiective: incompatibilitate fizică/electrică.

Totuși, totul are un preț. Regulatorul de tensiune este o altă sursă vizibilă de căldură în noul procesor. Și având în vedere că Haswell este fabricat folosind aceeași tehnologie de proces ca și predecesorul său Ivy Bridge, ar trebui să ne așteptăm ca procesorul să fie mai fierbinte.

În general, această îmbunătățire va fi mai benefică în segmentul mobil: schimbările de tensiune mai rapide și mai precise vor reduce consumul de energie, precum și vor controla mai eficient frecvența nucleelor ​​procesorului. Și aparent, aceasta nu este o declarație de marketing goală, pentru că Intel urmează să anunțe procesoare mobile cu consum de energie ultra-scăzut.

Noi moduri de economisire a energiei

Haswell are noi stări de somn S0ix, care sunt similare stărilor S3/S4, dar cu timp de tranziție a procesorului mult mai rapid stare de functionare. A fost adăugată și o nouă stare inactivă C7.

Modul C7 este însoțit de oprirea părții principale a procesorului, în timp ce imaginea de pe ecran rămâne activă.

Frecvența minimă de inactivitate a procesoarelor este de 800 MHz, ceea ce ar trebui să reducă și consumul de energie.

Arhitectura procesorului

În față

Conducta Haswell, ca și în SB, are 14–19 etape: 14 etape pentru o lovitură în cache µop, 19 pentru o ratare. Dimensiunea cache-ului µop nu s-a schimbat în comparație cu SB - 1536 µop. Organizarea uop cache-ului a rămas aceeași ca în SB - 32 de seturi de opt linii, fiecare cu șase uop-uri. Deși, din cauza creșterii numărului de dispozitive de execuție, precum și a buffer-urilor ulterioare după uop cache, ne-am putea aștepta la o creștere a uop cache - până la 1776 uops (de ce exact acest volum va fi discutat mai jos).

Decodor

Decodorul, s-ar putea spune, nu s-a schimbat - rămâne cu patru căi, ca SB. Este format din patru canale paralele: un translator complex (decodor complex) și trei canale simple (decodor simplu). Un traducător complex poate procesa/decoda instrucțiuni complexe care generează mai multe uop. Celelalte trei canale sunt decodificate instructiuni simple. Apropo, datorită prezenței îmbinării macro-operațiilor, încărcarea cu instrucțiuni de execuție și descărcare generează, de exemplu, un uop și poate fi decodificat în canale de decodor „simple”. Instrucțiunile SSE generează, de asemenea, un uop, astfel încât acestea pot fi decodificate în oricare dintre cele trei canale simple. Având în vedere apariția AVX, FMA3 pe 256 de biți, precum și un număr crescut de porturi de declanșare și dispozitive funcționale, această viteză a decodorului poate să nu fie suficientă - și poate deveni un blocaj. Parțial, acest blocaj este „extins” de memoria cache L0m uop, dar totuși, având un procesor cu 8 porturi de lansare, Intel ar trebui să se gândească la extinderea decodorului - în special, nu ar strica să crească numărul de canale complexe.

Scheduler, reordonare buffer, unități de execuție

După decodor vine o coadă de instrucțiuni decodificate și aici vedem prima schimbare. SB a avut două cozi de 28 de intrări - o coadă per fir virtual Hyper-Threading (HT). În Haswell, două cozi au fost combinate într-unul comun pentru două fire de execuție HT cu 56 de intrări, adică volumul cozii nu s-a schimbat, dar conceptul s-a schimbat. Acum, întregul volum de 56 de înregistrări este disponibil pentru un fir în absența unei secunde - prin urmare, ne putem aștepta la o creștere atât a aplicațiilor low-thread, cât și a celor cu mai multe fire (acest lucru se datorează faptului că două fire pot folosi un o singură coadă mai eficient).

Buffer-ul de reordonare a fost de asemenea modificat - a fost crescut de la 168 la 192 de intrări. Acest lucru ar trebui să îmbunătățească eficiența HT prin mai probabil prezența mopurilor care sunt „independente” unul față de celălalt. Coada micro-op decodificată a fost mărită de la 54 la 60. Fișierele de registru fizic care au apărut în SB au fost, de asemenea, mărite - de la 160 la 168 de registre pentru operanzi întregi și de la 144 la 168 pentru operanzi în virgulă mobilă, care ar trebui să aibă un pozitiv efect asupra performanței calculelor vectoriale.

Să rezumăm toate datele despre modificările din buffer-uri și cozi într-un singur tabel.

În principiu, modificările parametrilor din Haswell par destul de așteptate, având în vedere logica generală a dezvoltării arhitecturii procesorului Intel. Pe baza aceleiași logici, putem presupune că în următoarea generație de Core dimensiunile bufferelor și cozilor vor crește cu cel mult 14%, adică dimensiunea bufferului de reordonare va fi în jur de 218. Dar acestea sunt pur teoretice. presupuneri.

În urma cozii de operații decodificate sunt porturile de declanșare și dispozitivele funcționale atașate acestora. În această etapă ne vom opri mai detaliat.

După cum știm, Sandy Bridge avea șase porturi de lansare, pe care le-a moștenit de la Nehalem, care la rândul său de la Conroe. Adică din 2006, când Intel a adăugat încă două porturi celor patru disponibile pentru Pentium 4, numărul de porturi de lansare nu s-a schimbat - au fost adăugate doar noi dispozitive funcționale. Cu toate acestea, merită menționat faptul că P4 avea un fel de arhitectură NetBurst originală, în care cele două porturi ale sale puteau efectua două operații într-un singur ciclu de ceas (deși nu cu toate operațiunile). Dar cel mai corect ar fi să urmărim evoluția numărului de porturi de lansare nu folosind exemplul lui P4, ci folosind exemplul lui PIII, deoarece P4 are o conductă lungă și porturi de lansare cu performanță „dublă” și un cache de urmărire. , iar întreaga sa arhitectură este vizibil diferită de cea general acceptată. Iar Pentium III este foarte aproape diagrama functionala lansează porturi către Conroe și are, de asemenea, un container scurt. Deci, în general, putem spune că Conroe este succesorul direct al PIII. Pe baza acestui fapt, se poate afirma că în 2006 a fost adăugat un singur port de lansare în comparație cu PIII, care avea cinci porturi de lansare.

Astfel, numărul de porturi de lansare crește destul de lent, iar dacă se adaugă altele noi, pe rând. Haswell a adăugat două simultan, oferind un total de opt porturi - doar puțin mai mult și vom ajunge la Itanium. În consecință, Haswell arată o performanță teoretică pe calea de execuție de 8 UOP-uri/ciclu, dintre care 4 UOP-uri sunt cheltuite pe operații aritmetice, iar restul de 4 sunt pe operațiuni de memorie. Amintiți-vă că Conroe/Nehalem/SB au avut 6 mop/curs: 3 mop operatii aritmeticeși 3 module de operații de memorie. Această îmbunătățire ar trebui să ridice scorul IPC și, prin urmare, există într-adevăr schimbări foarte serioase în arhitectura Haswell care își justifică pe deplin locul „așa” în planul de dezvoltare al Intel.

Schimbări FU în Haswell

Numărul de actuatoare a fost, de asemenea, crescut. Noul port al șaselea (al șaptelea) a adăugat două dispozitive de acționare suplimentare - un dispozitiv de aritmetică și schimbare a numărului întreg și un dispozitiv de predicție a ramurilor. Al șaptelea (al optulea) port este responsabil pentru descărcarea adresei.

Astfel, obținem patru unități întregi de execuție aritmetică, în timp ce Sandy Bridge ne-a oferit doar trei. Prin urmare, ne putem aștepta la o creștere a vitezei aritmeticii întregi. În plus, teoretic, acest lucru ar trebui să ne permită să efectuăm atât calcule cu virgulă mobilă, cât și calcule întregi simultan, ceea ce, la rândul său, ar putea crește eficiența NT. În SB, calculele cu virgulă mobilă au fost efectuate pe aceleași porturi în care au fost utilizate dispozitive cu funcții întregi, astfel încât a avut loc în mare măsură blocarea, adică nu puteați avea o sarcină „eterogenă”. De asemenea, trebuie remarcat faptul că adăugarea unui predictor de ramificație suplimentar la Haswell va permite predicția ramurilor fără „blocare” în timpul calculelor aritmetice - anterior, în timpul calculelor întregi, predictorul unic de ramificație era blocat, adică era posibil să se opereze fie unitatea de execuție aritmetică. sau predictorul. Porturile 0 și 1 au suferit și ele modificări - acum acceptă FMA3. Intel a introdus al șaptelea (al optulea) port pentru a crește eficiența și a elimina „blocarea” - atunci când al doilea și al treilea port funcționează pentru descărcare, al șaptelea (al optulea) port poate fi angajat în încărcare, ceea ce era pur și simplu imposibil înainte. Această soluție este necesară pentru a asigura o viteză mare de execuție a codului AVX/FMA3.

În general, o cale executivă atât de largă poate duce la o schimbare în HT - făcându-l cu patru fire. În coprocesoarele Intel Xeon Phi cu o cale de execuție mult mai îngustă, HT-ul are patru fire și, după cum arată studiile și testele, coprocesorul se scalează destul de bine. Adică, chiar și o cale de execuție mai îngustă, în principiu, vă permite să lucrați eficient cu patru fire. Și o cale cu opt porturi de lansare poate rula destul de eficient patru fire și, în plus, prezența a patru fire poate încărca mai bine opt porturi de lansare. Adevărat, pentru o eficiență mai mare va fi necesar să se mărească tampoanele (în primul rând buffer-ul de reordonare) pentru o probabilitate mai mare de date „independente”.

Haswell a dublat, de asemenea, debitul L1-L2, menținând în același timp aceleași valori de latență. Această măsură era pur și simplu necesară, deoarece scrierea pe 32 de octeți și citirea pe 16 octeți pur și simplu nu ar fi suficiente, având în vedere prezența a opt porturi de lansare, precum și AVX și FMA3 pe 256 de biți.

Podul de nisipHaswell
L1i32k, 8 direcții32k, 8 direcții
L1d32k, 8 direcții32k, 8 direcții
Latența4 masuri4 masuri
Viteza de descărcare32 de octeți/ceas64 de octeți/ceas
Viteza de scriere16 octeți/ciclu32 de octeți/ceas
L2256k, 8 direcții256k, 8 direcții
Latența11 măsuri11 măsuri
Lățimea de bandă între L2 și L132 de octeți/ceas64 de octeți/ceas
L1i TLB4k: 128, cu 4 căi
2M/4M: 8/fir
4k: 128, cu 4 căi
2M/4M: 8/fir
L1d TLB4k: 128, cu 4 căi
2M/4M: 7/fir
1G: 4, 4 căi
4k: 128, cu 4 căi
2M/4M: 7/fir
1G: 4, 4 căi
L2 TLB4k: 512, cu 4 căi4k+2M partajat: 1024, 8 căi

TLB L2 a fost crescut la 1024 de intrări și a apărut suportul pentru pagini de doi megaocteți. Creșterea TLB L2 a presupus și o creștere a asociativității de la patru la opt.

În ceea ce privește cel de-al treilea nivel cache, situația cu acesta este ambiguă: în noul procesor, latența de acces ar trebui să crească din cauza pierderilor de sincronizare, deoarece acum cache-ul L3 funcționează la frecvența proprie și nu la frecvența nucleelor ​​procesorului, asa cum era inainte. Deși accesul este încă efectuat la 32 de octeți pe ciclu de ceas. Pe de altă parte, Intel vorbește despre modificări aduse Agentului de sistem și îmbunătățiri ale blocului Load Balancer, care acum poate procesa mai multe cereri de cache L3 în paralel și le poate separa în cereri de date și non-date. Acest lucru ar trebui să crească debitul cache-ului L3 (unele teste confirmă acest lucru, lățimea de bandă a cache-ului L3 este puțin mai mare decât IB).

Principiul de funcționare al cache-ului L3 din Haswell este oarecum similar cu Nehalem. În Nehalem, cache-ul L3 era situat în Uncore și avea propria frecvență fixă, în timp ce în SB cache-ul L3 era legat de nucleele procesorului - frecvența sa a devenit egală cu frecvența nucleelor ​​procesorului. Din această cauză, au apărut probleme - de exemplu, atunci când nucleele procesorului funcționau la frecvențe reduse când nu era încărcare (și LLC „a adormit”), iar GPU-ul avea nevoie de un PS LLC ridicat. Adică, această soluție a limitat performanța GPU-ului și, de asemenea, a cerut ca nucleele procesorului să fie scoase din starea inactivă doar pentru a trezi LLC. În noul procesor, pentru a îmbunătăți situația de consum de energie și a crește eficiența GPU-ului în situațiile descrise mai sus, cache-ul L3 funcționează la frecvența proprie. Soluțiile mobile, mai degrabă decât desktop, ar trebui să beneficieze cel mai mult de pe urma acestei soluții.

Este de remarcat faptul că dimensiunile cache au o anumită dependență. Cache-ul de al treilea nivel este de doi megaocteți per nucleu, al doilea nivel de cache este de 256 KB, ceea ce este de opt ori mai mic decât volumul L3 per nucleu. Volumul cache-ului de prim nivel, la rândul său, este de opt ori mai mic decât L2 și este de 32 KB. Cache-ul uop se încadrează perfect în această dependență: volumul său de 1536 uops este de 7-9 ori mai mic decât L1 (este imposibil să se determine acest lucru cu precizie, deoarece dimensiunea de biți a unui uop este necunoscută, iar Intel este puțin probabil să se extindă pe acest subiect ). La rândul său, buffer-ul de reordonare de 168 uop-uri este exact de opt ori mai mic decât uop cache-ul de 1536 uop-uri, deși, pe baza creșterii pe scară largă a buffer-urilor și a cozilor, s-ar putea aștepta la o creștere a uop cache-ului cu 14%, adică până la 1776. Astfel, volumele de buffere și cache au dimensiuni proporționale. Acesta este probabil un alt motiv pentru care Intel nu mărește cache-urile L1/L2, considerând astfel de proporții în volume ca fiind cele mai eficiente în ceea ce privește creșterea performanței pe suprafață. Este demn de remarcat faptul că procesoarele cu un nucleu grafic de top încorporat au memorie rapidă intermediară cu o magistrală de acces larg, care memorează în cache toate solicitările către RAM - atât procesor, cât și accelerator video. Volumul acestei memorie este de 128 MB. Pentru nucleele de procesor, dacă privim această memorie ca cache L4, volumul ar fi trebuit să fie de 64 de megaocteți, iar cu adăugarea unui nucleu grafic, utilizarea a 128 MB pare destul de logică.

În ceea ce privește controlerul de memorie, acesta nu a primit nici o creștere a numărului de canale, nici o creștere a frecvenței de funcționare a RAM, adică este încă același controler de memorie cu acces dublu-canal la o frecvență de 1600 MHz. . Această decizie pare destul de ciudată, deoarece trecerea de la SB la IB a crescut frecvența de operare a ICP de la 1333 MHz la 1600 MHz, deși aceasta a fost doar o tranziție a arhitecturii la un nou proces tehnic. Și acum avem o nouă arhitectură, în timp ce frecvența de funcționare a memoriei rămâne la același nivel.

Acest lucru pare și mai ciudat dacă ne amintim îmbunătățirile din nucleul grafic - la urma urmei, ne amintim că până și placa video HD2500 de gamă scăzută din IB a folosit complet lățimea de bandă de 25 GB/s. Acum, atât performanța procesorului, cât și performanța grafică au crescut, în timp ce lățimea de bandă a memoriei a rămas la același nivel. La o scară mai largă, concurentul crește constant lățimea de bandă a memoriei în APU-urile sale și este mai mare decât cea a Intel. Ar fi logic să ne așteptăm ca Haswell să accepte memorie cu o frecvență de 1866 MHz sau 2133 MHz, ceea ce ar crește lățimea de bandă la 30 și, respectiv, 34 GB/s.

Drept urmare, această decizie a Intel nu este complet clară. În primul rând, concurentul a introdus fără probleme suport pentru memorie mai rapidă. În al doilea rând, costul modulelor de memorie care funcționează la o frecvență de 1866 MHz nu este cu mult mai mare în comparație cu modulele de 1600 MHz și, în plus, nimeni nu este obligat să cumpere memorie de 1866 MHz - alegerea ar fi la latitudinea utilizatorului. În al treilea rând, nu pot exista probleme cu suportul nu numai pentru 1866 MHz, ci și pentru 2133 MHz: de la anunțul lui Haswell, au fost stabilite recorduri mondiale pentru overclockarea RAM, adică ICP-ul ar fi putut face față mai mult decât atât fără orice probleme memorie rapidă. În al patrulea rând, linia de servere Xeon E5-2500 V2 (Ivy Bridge-EP) pretinde suport pentru 1866 MHz, dar Intel introduce de obicei suport pentru standarde de memorie mai rapide pe această piață mult mai târziu decât soluțiile desktop.

În principiu, s-ar putea presupune că, în absența concurenței, Intel nu are nevoie să își dezvolte mușchii și să-și crească în continuare superioritatea, dar această presupunere este absolut incorectă, deoarece creșterea lățimii de bandă a memoriei, de regulă, crește performanța nucleului grafic integrat și aproape că nu crește performanța procesorului. În același timp, Intel rămâne în urmă cu AMD în performanța grafică, iar în ultimii ani Intel însuși a acordat din ce în ce mai multă atenție graficii, iar rata de îmbunătățire a acesteia este mult mai mare decât a nucleului procesorului. În plus, dacă ne bazăm pe rezultatele testării nucleului grafic integrat generația anterioară HD4000, care a arătat că o creștere a lățimii de bandă a memoriei duce la o creștere a performanței grafice cu până la 30% și, de asemenea, având în vedere că noul nucleu grafic HD4600 este vizibil mai rapid decât HD4000, dependența performanței nucleului grafic de lățimea de bandă a memoriei devine uniformă. mai evident. Noul nucleu grafic va fi și mai restrâns de lățimea de bandă „îngustă” a memoriei. Rezumând toate faptele, decizia Intel este complet de neînțeles: compania însăși și-a „sugrumat” grafica, dar o creștere a lățimii de bandă a memoriei i-ar fi putut îmbunătăți performanța.

Revenind la arhitectura cache-urilor, să aruncăm un gând în gol: deoarece a fost adăugat un cache intermediar (mop cache), atunci de ce să nu adăugați un cache intermediar de date de aproximativ 4-8 KB și cu un acces mai mic. latența dintre memoria cache L1d și dispozitivele executive, cum ar fi de la P4 (deoarece conceptul de cache uop a fost preluat de la Netburst)? Reamintim că în P4 acest cache de date intermediar avea un timp de acces de două cicluri de ceas, iar un ciclu P4 a fost egal cu aproximativ 0,75 cicluri de ceas ale unui procesor convențional, adică timpul de acces a fost de aproximativ un ciclu de ceas și jumătate. Cu toate acestea, poate vom vedea din nou ceva similar - Intel adoră să-și amintească lucrurile vechi bine uitate.

După cum puteți vedea, Intel a vizat majoritatea modificărilor arhitecturale spre creșterea performanței codului AVX/FMA3: aceasta a inclus o creștere a debitului cache-ului, o creștere a numărului de porturi și o creștere a ratei de încărcare/încărcare în calea de execuție. Ca rezultat, principalul câștig de performanță ar trebui să provină din software-ul scris folosind AVX/FMA3. În principiu, judecând după rezultatele testelor, se pare că așa este. Performanța uscată la aceeași frecvență în aplicațiile „vechi” a primit o creștere de aproximativ 10% față de nucleul anterior, iar aplicațiile scrise folosind noile seturi de instrucțiuni arată o creștere de peste 30%. Așadar, beneficiile arhitecturii Haswell vor fi dezvăluite pe măsură ce aplicațiile sunt optimizate pentru noile seturi de instrucțiuni. Atunci va deveni evidentă superioritatea lui Haswell asupra SB.

Principalul beneficiu al unei părți semnificative a inovațiilor va fi dispozitivele mobile. Aceștia vor fi ajutați de o nouă abordare a memoriei cache L3, un regulator de tensiune încorporat, noi moduri de repaus și frecvențe minime de operare mai scăzute ale nucleelor ​​de procesor.

Concluzie (partea procesorului)

La ce te poți aștepta de la Haswell?

Datorită creșterii numărului de porturi de lansare, ne putem aștepta la o creștere a indicatorului IPC, astfel că noua arhitectură Haswell va avea un ușor avantaj față de Sandy Bridge la aceeași frecvență chiar și acum, chiar și cu neoptimizate. software. Instrucțiunile AVX2/FMA3 sunt fundamentul viitorului, iar acel viitor depinde de dezvoltatorii de software: cu cât își adaptează mai repede aplicațiile, cu atât mai repede utilizatorul final va vedea câștiguri de performanță. Cu toate acestea, nu trebuie să vă așteptați la creștere în orice și peste tot: instrucțiunile SIMD sunt utilizate în principal în lucrul cu date multimedia și în calcule științifice, așa că ar trebui să se aștepte creșterea performanței în aceste sarcini. Principalul beneficiu al creșterii eficienței energetice va fi în sistemele mobile, unde această problemă este cu adevărat importantă. Astfel, cele două domenii principale în care noua arhitectură Intel Haswell beneficiază semnificativ sunt performanța SIMD crescută și eficiența energetică crescută.

În ceea ce privește aplicabilitatea noilor procesoare Haswell, merită să examinăm mai multe opțiuni diferite pentru utilizarea lor: în computere desktop, în servere, în soluții mobile, pentru gameri, pentru overclocker.

Desktop

Consumul de energie nu este un aspect cheie pentru un procesor desktop, așa că chiar și în Europa cu electricitatea sa scumpă, este puțin probabil ca cineva să treacă la Haswell din generațiile anterioare doar din această cauză. Mai mult, TDP-ul lui Haswell este mai mare decât cel al IB, astfel încât economiile vor fi doar în cazul sarcinilor minime. Când întrebarea este pusă în acest fel, nu poate exista nicio îndoială - nu merită.

Din punct de vedere al performanței, nici tranziția nu arată ca o afacere atât de profitabilă: creșterea vitezei maxime în sarcinile procesorului nu va depăși acum 10%. Trecerea la Haswell de la Sandy Bridge sau Ivy Bridge va fi justificată doar dacă intenționați să utilizați aplicații cu suport competent pentru FMA3 și AVX2: suportul FMA3 poate da o creștere a unor aplicații de la 30% la 70%. Îmbunătățirile legate de virtualizare și introducerea memoriei tranzacționale sunt de puțin interes și utilizare pentru desktop.

Servere și stații de lucru

Având în vedere că serverele funcționează continuu 24 de ore pe zi și au o sarcină constantă destul de mare pe procesor, este puțin probabil ca Haswell să fie mai bun decât IB în ceea ce privește consumul pur de energie, deși poate oferi un anumit câștig în ceea ce privește performanța pe watt. Suportul AVX2/FMA3 este puțin probabil să fie util în servere, dar în stațiile de lucru implicate în calcule științifice, acest suport va fi foarte, foarte util – dar numai dacă noile instrucțiuni sunt suportate în software-ul folosit. Memoria tranzacțională este un lucru destul de util, dar și nu întotdeauna: poate da o creștere a programelor multi-threaded și a programelor care funcționează cu baze de date, dar optimizarea software este necesară și pentru utilizarea eficientă a acestuia.

Dar toate îmbunătățirile asociate cu virtualizarea vor avea cel mai probabil un efect bun, deoarece mediile virtuale sunt acum utilizate foarte activ, iar majoritatea serverelor fizice au mai multe virtuale. Mai mult, prevalența virtualizării se explică nu numai printr-o reducere vizibilă a costurilor mediului virtual în ceea ce privește performanța, ci și eficienta economica: Conținerea mai multor servere virtuale pe un server fizic este mai ieftin și permite o utilizare mai eficientă a resurselor, inclusiv a resurselor procesorului.

Așa că apariția lui Haswell ar trebui salutată pozitiv pe piața serverelor. După schimbarea serverelor bazate pe Xeon E3-1200v1 și Xeon E3-1200v2 la servere cu Xeon E3-1200v3 (Haswell), veți primi imediat o creștere a eficienței, iar după optimizarea software-ului pentru AVX2/FMA3 și memoria tranzacțională, performanța va crește chiar mai mult.

Soluții mobile

Principalul beneficiu al introducerii lui Haswell în segmentul mobil constă, desigur, în zona consumului de energie îmbunătățit. Judecând după prezentările Intel, precum și după rezultatele testelor care apar deja pe Internet, există într-adevăr un efect și unul vizibil.

În ceea ce privește performanța pură, tranziția de la Ivy Bridge la Haswell nu pare a fi o întreprindere atât de justificată: câștigul net ar trebui să fie relativ mic, iar îmbunătățirile componentelor individuale (aceeași instrucțiuni de virtualizare sau multimedia) sunt puțin probabil să ofere mult pentru utilizator al unui sistem mobil, deoarece laptopurile și tabletele sunt rareori folosite pentru a crea medii sau pentru a efectua calcule științifice complexe.

În general, în ceea ce privește performanța procesorului, nu ar trebui să vă așteptați la multe, dar în sisteme mobile Cu siguranță va exista cerere pentru performanțe sporite de bază pentru grafică. Prin urmare, dacă problemele de consum de energie nu sunt critice pentru dvs., atunci nu ar trebui să luați în considerare în mod serios actualizarea de la Sandy Bridge sau Ivy Bridge - este mai bine să continuați să operați sistemele existente până când acestea devin complet depășite. Dacă lucrați des la baterii, atunci Haswell poate oferi o creștere semnificativă a duratei de viață a bateriei.

Jucătorii

Problema consumului de energie în rândul jucătorilor din Rusia, de regulă, nu este o problemă - și de ce ar trebui să fie atunci când plăcile video pentru jocuri consumă 200 de wați sau mai mult? De asemenea, jucătorii nu au nevoie de virtualizare și memorie tranzacțională. Nu este un fapt că AVX2/FMA3 va fi solicitat special pentru jocuri, deși pot fi utile în calculele fizice. Ceea ce rămâne este performanța pură a procesorului, iar aici diferența cu același Ivy Bridge este mică. Ca urmare, pentru această categorie de utilizatori o tranziție directă de la SB sau IB la Haswell nu pare relevantă. Dar are sens să treci la procesoare noi de la Nehalem și Lynifield, și cu atât mai mult Conroe.

Overclockeri

Pentru overclockeri, noul procesor (dar, bineînțeles, doar versiunea sa „deblocată” K) poate fi interesant, mai ales dacă este posibil să îl „scalpiți”, adică să scoateți capacul metalic și să răciți direct cristalul. Dacă nu se face acest lucru, atunci rezultatele overclockării par și mai modeste decât cele ale Ivy Bridge. În plus, regulatorul de tensiune integrat poate fi un factor limitator. Citiți mai multe despre asta

Tipurile de procesoare intel sunt numeroase. Haswell este numele celei de-a patra generații de echipamente care au folosit arhitectură inovatoare.

O familie de chipset-uri noi din seria a opta a fost dezvoltată special pentru ei. Lucrul cu SSD este optimizat. Arhitectura a fost lansată la începutul lunii iunie 2013.

Revista Haswell

Din 2013, au fost dezvoltate multe modele de procesoare. Procesorul autonom a fost poziționat de dezvoltatori pentru utilizare în laptopuri, ultrabook-uri și tablete, datorită consumului redus de energie. Performanța se va îmbunătăți, permițând dezvoltatorilor să-și imagineze Haswell ca cele mai bune procesoare intel pentru dispozitive mobileÎn prezent. Procesoarele dual-core Core i3 Haswell sunt disponibile în trei variante:

  1. i3-4340;
  2. i3-4330;
  3. i3-4130.

Ele diferă prin frecvența de ceas, care pentru cele trei modele este de 3,6, 3,5, respectiv 3,4 GHz. Noul nucleu grafic pentru primele două modele este HD Graphics 4600, iar pentru al treilea - HD Graphics 4400. Frecvența acestor nuclee este de 1150 MHz pentru toate. LZ – cache 4, 4 și, respectiv, 3 MB. Prețul diferă ușor - pentru prima opțiune - 160 USD, pentru a doua - 150 USD și pentru a treia - 130 USD.

Quad-core i5 Haswell sunt echipate cu un nucleu grafic HD Graphics 4600. Frecvența de ceas este de 3,2 GHz, cu accelerație turbo – 3,6. 6 MB cache. Disiparea căldurii este scăzută, astfel încât nici în timpul utilizării active nu este necesar un răcitor suplimentar.

Dar procesorul i7 este superior i3 sau i5. Prezentat alături de i7-4770K, i7-4770, i7-4770S, i7-4770T și i7-4765T. Primele două rulează pe un procesor quad-core cu 8 fire, în timp ce restul rulează pe patru.

Viteza ceasului este cea mai mică ultimul modelși este egal cu 2 GHz, cel mai mare este primul - 3,5 GHz. Cache 8 MB

Caracteristici Haswell

Haswell este numele noii arhitecturi de procesoare bazate pe ea. Nucleul de calcul al dispozitivului a suferit modificări față de versiunea anterioară. Preprocesorul este aproape neschimbat. Decodorul de bază este cu patru canale și, deoarece lungimea medie a instrucțiunii este de 4 octeți, poate procesa simultan până la 16 octeți. Constă din patru decodoare simple și unul complex. Instrucțiunile sunt decodificate folosind tehnologiile Macro-Fusion și Micro-Fusion.

Cache-ul de operare decodificat cu 8 canale stochează 1500 de micro-operații în 4 octeți. Fiecare dintre cele 8 bănci are 32 de linii de numerar, care includ câte 6 micro-operațiuni. Scopul unei astfel de bănci nu este să efectueze decodare repetată, ci să tragă o operație deja decodificată direct din cache.

Unitățile de execuție din nucleu au fost modificate. Numărul de porturi a fost crescut la 8. Acum sunt efectuate până la 8 micro-operații într-un singur ciclu de ceas. A fost introdus un nou set de instrucțiuni.

Testele de performanță ale dispozitivului au fost efectuate pe Windows și Android. Testarea intel core i7 – 4770 a fost efectuată cu procese și aplicații de bază, iar timpul de performanță al unei anumite operațiuni a fost luat ca indicator. Ca urmare a testului pe aplicații non-gaming, indicii procesoarelor Intel Haswell s-au dovedit a fi mai mari decât în ​​modelele anterioare.

Cea mai mare creștere a indicatorilor este în Photoshop, Adobe Premier Pro etc.

Folosind 3DMark Professional, am testat performanța aplicațiilor de jocuri. Rezultatele arată că există progrese în funcționarea subsistemului grafic. Jocul este imposibil fără utilizarea unei plăci grafice discrete. Grafica integrată a procesorului nu este bună.

Avantajele procesorului Haswell

Haswell - generația Intel Core, care are destul de mulți adversari. Își găsesc dezavantaje, precum prețul ridicat sau necesitatea de a actualiza prea des platforma. Cu toate acestea, a acestui echipament există o serie de avantaje. Aceasta include eficiență și productivitate ridicate, o platformă funcțională etc.

  • Principalul avantaj pe care îl are procesorul este nucleul grafic integrat. A devenit competitiv. Există acum capacitatea de a suporta mai multe monitoare și o creștere semnificativă a performanței;
  • Dispozitivul are o eficiență energetică crescută. Față de versiunile anterioare, am reușit să-l reducem cu 5 Wați în modul idle. Aceasta nu este o diferență atât de mare pentru un PC desktop, dar semnificativă dacă alegi un laptop sau un ultrabook. Consumul de energie sub sarcină este scăzut;
  • Productivitatea a crescut cu 5 - 10% față de generațiile anterioare. Variază în funcție de condițiile de testare. În unele cazuri, poate fi mai mare sau mai mică. Diferența nu este suficient de semnificativă pentru a justifica un upgrade. sistem existent generația anterioară, dar semnificativă dacă alegeți un procesor Haswell în loc de unul semnificativ depășit;
  • Sistemul de overclockare a procesorului prin frecvența de bază a devenit mai flexibil. Astfel, dezvoltatorii au răspuns la reclamațiile utilizatorilor versiunile anterioare dispozitive.

Procesoarele Intel Pentium Haswell sunt concepute în primul rând pentru a fi utilizate în laptopuri. Hardware-ul puternic pentru computerele desktop nu este încă disponibil, iar în laptopuri nu este posibil să se atingă cele mai mari viteze de ceas, cache uriașe și utilizarea a 8 nuclee complete. Astfel, fanii computerelor desktop vor trebui să aștepte și alte evoluții.

Deci, s-a făcut. După luni de așteptare, entuziaștii, overclockerii și utilizatorii pretențioși vor putea pune mâna pe cele mai noi procesoare Haswell-E, introdus astăzi de Intel.

După cum a fost raportat de multe ori, cipurile Haswell-E sunt proiectate pentru computere desktop clasa high-end. Linia include trei produse: acestea sunt modelele Core i7-5960X, Core i7-5930K și Core i7-5820K. Toate sunt produse folosind tehnologia de 22 de nanometri folosind tranzistori cu structură volumetrică. Funcția Hyper-Threading este acceptată, permițând fiecărui nucleu să proceseze simultan două fire de instrucțiuni și sistemul de îmbunătățire dinamică a performanței Turbo Boost.

Procesorul senior din familia Haswell-E este cipul Core i7-5960X. Acesta este primul produs Intel cu opt nuclee destinat în mod special desktop-urilor de ultimă generație. Procesorul funcționează la o frecvență nominală de 3,0 GHz cu capacitatea de a crește dinamic la 3,5 GHz. Cristalul Haswell-E cu opt nuclee are o suprafață de 356 mm 2, iar numărul de tranzistori pe care îi conține a ajuns la 2,6 miliarde Volumul cache-ului de al treilea nivel este de 20 MB. Cipul vă permite să utilizați până la 40 de benzi PCI Express.

Modelul Core i7-5930K are șase nuclee. Dar, în comparație cu fratele său mai mare, frecvențele nominale și amplificate sunt mai mari - 3,5 și, respectiv, 3,7 GHz. Dimensiunea cache-ului L3 este de 15 MB; Sunt acceptate 40 de benzi PCI Express.

În cele din urmă, procesorul Core i7-5820K are șase nuclee cu o frecvență de 3,3/3,6 GHz și 15 MB de cache L3. Cu toate acestea, sunt acceptate doar 28 de benzi PCI Express și, prin urmare, anumite limitări vor fi resimțite în sistemele cu mai multe acceleratoare grafice.

Toți reprezentanții Haswell-E sunt caracterizați de un multiplicator deblocat. Este important de remarcat faptul că capacul procesorului este lipit de cipul semiconductor folosind o lipire specială pe bază de indi cu conductivitate termică ridicată (în produsele convenționale Haswell, între cip și capac este plasată pastă termică cu caracteristici destul de mediocre). Utilizarea lipirii ar trebui să crească potențialul de overclocking. Apropo, pe lângă overclockarea prin modificarea factorului de multiplicare, este permisă și overclockarea frecvenței magistralei: procesoarele acceptă valorile sale de bază de 100, 125, 167 și 250 MHz.

Cipurile au o valoare maximă de disipare termică (TDP) de 140 W.

O altă caracteristică a lui Haswell-E este un controler RAM DDR4-2133 cu patru canale. Aceasta înseamnă că o nouă generație de memorie cu tensiune mai mică și viteză crescută vine în sfârșit pe segmentul desktop.

Procesoarele sunt proiectate să funcționeze cu plăci de bază bazate pe chipset-ul Intel X99 Express echipat cu un socket LGA 2011-3. Platforma oferă suport pentru zece porturi SATA 3.0 (6 Gb/s), interfețe SATA Express și M.2. Setul de logică include un controler de magistrală USB de mare viteză: din 14 porturi disponibile, șase pot funcționa nu numai în modul USB 2.0, ci și în modul USB 3.0, oferind un debit de până la 5 Gbit/s. În plus, chipsetul are un generator de ceas încorporat, ceea ce elimină necesitatea ca producătorii de plăci de bază să utilizeze componente electroniceși simplifică designul platformei. Plăci de bază Bazat pe Intel X99, toți producătorii de top s-au pregătit.

Și despre prețuri. Modelul Core i7-5960X va costa 999 USD, în timp ce modificările Core i7-5930K și Core i7-5820K vor costa 583 USD, respectiv 389 USD.

Vă puteți familiariza cu toate caracteristicile noilor produse din detaliile noastre material de Ilya Gavrichenkov.