Antalet texturenheter. Hur man väljer grafikkort

Antalet texturenheter.  Hur man väljer grafikkort
Antalet texturenheter. Hur man väljer grafikkort

GPU-arkitektur: funktioner

Realismen i 3D-grafik är mycket beroende av grafikkortets prestanda. Ju fler pixelskuggningsblock processorn innehåller och ju högre frekvens, desto fler effekter kan appliceras på 3D-scenen för att förbättra dess visuella uppfattning.

GPU:n innehåller många olika funktionsblock. Genom antalet komponenter är det möjligt att uppskatta hur GPU kraftfull. Innan vi går vidare, låt oss titta på de viktigaste funktionella blocken.

Vertex-processorer (Vertex Shader-enheter)

Precis som pixelskuggare, exekverar vertexprocessorer skuggningskod som berör hörn. Eftersom en större vertexbudget tillåter dig att skapa mer komplexa 3D-objekt, är prestandan hos vertexprocessorer mycket viktig i 3D-scener med komplexa eller stora antal objekt. Dock har vertex shader-enheter fortfarande inte en så uppenbar inverkan på prestanda som pixelprocessorer.

Pixelprocessorer (pixel shaders)

En pixelprocessor är en komponent i ett grafikchip som är dedikerat till att bearbeta pixelskuggningsprogram. Dessa processorer utför beräkningar endast för pixlar. Eftersom pixlar innehåller färginformation kan pixelskuggningar uppnå imponerande grafiska effekter. Till exempel skapas de flesta av vatteneffekterna du ser i spel med hjälp av pixelskuggningar. Vanligtvis används antalet pixelprocessorer för att jämföra pixelprestanda för grafikkort. Om ett kort är utrustat med åtta pixel shader-enheter och det andra med 16 enheter, så är det ganska logiskt att anta att ett grafikkort med 16 enheter kommer att bearbeta komplexa pixelprogram snabbare. Även klockhastigheten bör övervägas, men idag är en fördubbling av antalet pixelprocessorer effektivare när det gäller strömförbrukning än att fördubbla frekvensen på ett grafikchip.

Unified shaders

Unified (enkla) shaders har ännu inte kommit till PC-världen, men den kommande DirectX 10-standarden bygger på en liknande arkitektur. Det vill säga, kodstrukturen för vertex-, geometriska och pixelprogram kommer att vara densamma, även om shaders kommer att fungera diverse arbeten. Den nya specifikationen kan ses på Xbox 360, där GPU:n specialdesignades av ATi för Microsoft. Det ska bli mycket intressant att se vilken potential den nya DirectX 10 ger.

Texture Mapping Units (TMU)

Texturer bör väljas och filtreras. Detta arbete utförs av texturmappningsenheterna, som fungerar tillsammans med pixel- och vertex-skuggningsenheterna. TMU:s uppgift är att tillämpa texturoperationer på pixlarna. Antalet texturenheter i en GPU används ofta för att jämföra texturprestandan hos grafikkort. Det är ganska rimligt att anta att ett grafikkort med fler TMU:er ger bättre strukturprestanda.

Raster Operator Unit (ROP)

RIP:er är ansvariga för att skriva pixeldata till minnet. Den hastighet med vilken denna operation utförs är fyllningshastigheten. I början av 3D-acceleratorer var ROP:er och fyllnadsgrader mycket viktiga egenskaper hos grafikkort. Idag är arbetet med ROP fortfarande viktigt, men grafikkortets prestanda begränsas inte längre av dessa block, som det brukade vara. Därför används sällan prestanda (och antal) för ROP för att utvärdera hastigheten på ett grafikkort.

Transportörer

Pipelines används för att beskriva grafikkortens arkitektur och ger en mycket visuell representation av prestanda hos en GPU.

Transportören kan inte betraktas som en strikt teknisk term. GPU:n använder olika pipelines som utför olika funktioner. Historiskt sett uppfattades en pipeline som en pixelprocessor som var ansluten till sin egen texturmappningsenhet (TMU). Till exempel kl Radeon grafikkort 9700 använder åtta pixelprocessorer, som var och en är ansluten till sin egen TMU, så kortet anses ha åtta pipelines.

Men moderna processorer det är mycket svårt att beskriva antalet rörledningar. Jämfört med tidigare konstruktioner använder de nya processorerna en modulär, fragmenterad struktur. ATi kan betraktas som en innovatör inom detta område, som med X1000-serien av grafikkort bytte till en modulär struktur, vilket gjorde det möjligt att uppnå prestandavinster genom intern optimering. Vissa CPU-block används mer än andra, och för att förbättra prestanda hos GPU:n har ATi försökt hitta en kompromiss mellan antalet block som behövs och formytan (den kan inte ökas särskilt mycket). I denna arkitektur har termen "pixelpipeline" redan förlorat sin betydelse, eftersom pixelprocessorerna inte längre är anslutna till sina egna TMU:er. Till exempel har ATi Radeon X1600 GPU 12 pixel shaders och totalt fyra TMU:er. Därför kan man inte säga att det finns 12 pixlars pipelines i arkitekturen för denna processor, precis som man inte kan säga att det bara finns fyra av dem. Men av tradition nämns fortfarande pixelpipelines.

Med dessa antaganden i åtanke används ofta antalet pixelpipelines i en GPU för att jämföra grafikkort (med undantag för ATi X1x00-linjen). Om vi ​​till exempel tar grafikkort med 24 och 16 pipelines, så är det ganska rimligt att anta att ett kort med 24 pipelines kommer att vara snabbare.


INNEHÅLL

Moderna grafikprocessorer innehåller många funktionella block, vars antal och egenskaper bestämmer den slutliga renderingshastigheten, vilket påverkar spelets bekvämlighet. Genom det jämförande antalet av dessa block i olika videochips kan du grovt uppskatta hur snabb en viss GPU är. Videochips har många egenskaper, i det här avsnittet kommer vi bara att överväga de viktigaste av dem.

Videochippets klockfrekvens

Driftsfrekvensen för en GPU mäts vanligtvis i megahertz, det vill säga miljontals cykler per sekund. Denna egenskap påverkar direkt prestandan hos videochippet - ju högre det är, desto mer arbete kan GPU utföra per tidsenhet, process stor kvantitet hörn och pixlar. Ett exempel från det verkliga livet: frekvensen för videochippet installerat på Radeon HD 6670-kortet är 840 MHz, och exakt samma chip i Radeon HD 6570-modellen arbetar med en frekvens på 650 MHz. Följaktligen kommer alla de viktigaste prestandaegenskaperna också att skilja sig åt. Men inte bara chipets driftsfrekvens bestämmer prestandan, dess hastighet påverkas också starkt av själva grafikarkitekturen: designen och antalet exekveringsenheter, deras egenskaper, etc.

I vissa fall skiljer sig klockfrekvensen för enskilda GPU-block från frekvensen för resten av chippet. Det vill säga att olika delar av GPU:n arbetar med olika frekvenser, och detta görs för att öka effektiviteten, eftersom vissa block kan arbeta vid förhöjda frekvenser medan andra inte gör det. De flesta av dessa GPU:er är utrustade GeForce grafikkort från NVIDIA. Från de senaste exemplen, låt oss ta ett videochip i GTX 580-modellen, varav de flesta fungerar med en frekvens på 772 MHz, och chipets universella datorenheter har en fördubblad frekvens - 1544 MHz.

Fyllnadsgrad (fyllnadsgrad)

Fyllningsgraden visar hur snabbt videochippet kan rita pixlar. Det finns två typer av fyllnadshastighet: pixelfyllningshastighet och texelhastighet. Pixelfyllningshastigheten visar hastigheten med vilken pixlar ritas på skärmen och beror på driftsfrekvensen och antalet ROP:er (enheter för rasterisering och blandning), medan texturfyllningshastigheten är samplingshastigheten för texturdata, som beror på driftfrekvens och antalet texturenheter.

Till exempel den maximala pixelfyllningshastigheten för GeForce GTX 560 Ti är 822 (chipfrekvens) × 32 (ROPs) = 26304 megapixlar per sekund, och texturen är 822 × 64 (textureringsenheter) = 52608 megatexel/s. Förenklat är situationen som följer - ju större det första numret är, desto snabbare kan grafikkortet rendera färdiga pixlar, och ju större den andra, desto snabbare samplas texturdata.

Även om betydelsen av "ren" fillrate nyligen har minskat avsevärt, vilket ger vika för hastigheten på beräkningar, är dessa parametrar fortfarande mycket viktiga, speciellt för spel med enkel geometri och relativt enkla pixel- och vertexberäkningar. Så båda parametrarna är fortfarande viktiga för moderna spel, men de måste vara balanserade. Därför är antalet ROPs i moderna videochips vanligtvis mindre än antalet texturenheter.

Antal beräkningsenheter (shader) eller processorer

Kanske är dessa block nu huvuddelarna i videochippet. De uppträder specialprogram, känd som shaders. Dessutom, om tidigare pixelshaders utförde block av pixel shaders och vertex - vertexblock, så har grafiska arkitekturer sedan en tid förenats, och dessa universella beräkningsblock har varit engagerade i olika beräkningar: vertex, pixel, geometriska och till och med universella beräkningar .

Den enhetliga arkitekturen användes först i videochippet på Microsoft Xbox 360-spelkonsolen, denna grafikprocessor utvecklades av ATI (senare förvärvad av AMD). Och i videochips för personliga datorer enhetliga shader-block dök upp i tavlan NVIDIA GeForce 8800. Och sedan dess är alla nya videochips baserade på en enhetlig arkitektur, som har en universell kod för olika skuggningsprogram (vertex, pixel, geometrisk, etc.), och motsvarande enhetliga processorer kan köra vilka program som helst.

Genom antalet beräkningsenheter och deras frekvens kan du jämföra den matematiska prestandan för olika grafikkort. De flesta spel är nu begränsade av prestanda hos pixelshaders, så antalet av dessa block är mycket viktigt. Till exempel, om en grafikkortsmodell är baserad på en GPU med 384 datorprocessorer i sin sammansättning, och en annan från samma linje har en GPU med 192 datorenheter, kommer den andra med samma frekvens att vara dubbelt så långsam som bearbeta alla typer av shader, och i allmänhet kommer att vara samma mer produktiva.

Även om det är omöjligt att dra entydiga slutsatser om prestanda enbart på basis av antalet beräkningsenheter, är det absolut nödvändigt att ta hänsyn till klockfrekvensen och olika arkitektur för block av olika generationer och chiptillverkare. Enbart dessa siffror kan användas för att jämföra chips inom samma linje från en tillverkare: AMD eller NVIDIA. I andra fall måste du vara uppmärksam på prestandatester i spel eller applikationer av intresse.

Texturing Units (TMU)

Dessa GPU-enheter arbetar tillsammans med beräkningsprocessorerna för att sampla och filtrera textur och annan data som behövs för scenbyggande och allmänt bruk. Antalet texturenheter i videochippet bestämmer texturprestandan - det vill säga hastigheten med vilken texel hämtas från texturer.

Även om det nyligen har lagts mer vikt vid matematiska beräkningar, och vissa texturer har ersatts av procedurmässiga, är belastningen på TMU:er fortfarande ganska hög, eftersom utöver huvudtexturerna även prover måste göras från normala och förskjutningskartor, eftersom samt renderingsbuffertar för målrendering utanför skärmen.

Med hänsyn till betoningen av många spel, inklusive prestanda hos textureringsenheter, kan vi säga att antalet TMU:er och motsvarande höga texturprestanda också är en av de viktigaste parametrarna för videochips. Den här parametern har en speciell effekt på renderingshastigheten för en bild när du använder anisotropisk filtrering, vilket kräver ytterligare texturhämtningar, såväl som med komplexa mjuka skuggalgoritmer och nymodiga algoritmer som Screen Space Ambient Occlusion.

Rasterization Operations Units (ROPs)

Rasteriseringsenheterna utför operationerna att skriva pixlarna som beräknats av grafikkortet till buffertar och operationerna för deras blandning (blandning). Som vi noterade ovan påverkar prestandan hos ROP-enheter fyllhastigheten och detta är en av de viktigaste egenskaperna hos grafikkort genom tiderna. Och även om dess värde nyligen också har minskat något, finns det fortfarande fall där applikationsprestanda beror på hastigheten och antalet ROP:er. Oftast beror detta på den aktiva användningen av efterbehandlingsfilter och kantutjämning aktiverad vid höga spelinställningar.

Återigen noterar vi att moderna videochips inte bara kan utvärderas utifrån antalet olika block och deras frekvens. Varje serie av GPU:er använder en ny arkitektur, där exekveringsenheterna skiljer sig mycket från de gamla, och förhållandet mellan antalet olika enheter kan skilja sig åt. Till exempel kan AMD:s ROP:er i vissa lösningar göra mer arbete per klocka än NVIDIA:s ROP:er, och vice versa. Detsamma gäller förmågan hos TMU-texturenheter - de är olika i olika GPU-generationer. olika tillverkare, och detta måste beaktas vid jämförelse.

geometriska block

Tills nyligen var antalet geometribearbetningsenheter inte särskilt viktigt. Ett block per GPU räckte för de flesta uppgifter, eftersom geometrin i spel var ganska enkel och huvudfokus för prestanda var matematiska beräkningar. Vikten av parallell bearbetning av geometri och antalet motsvarande block ökade dramatiskt i och med införandet av stöd för geometri tessellation i DirectX 11. NVIDIA var det första företaget som parallelliserade behandlingen av geometriska data, när flera motsvarande block dök upp i dess GF1xx-chips. Sedan släppte AMD en liknande lösning (endast i topplösningarna i Radeon HD 6700-linjen baserad på Cayman-chips).

Inom ramen för detta material kommer vi inte att gå in på detaljer, de kan hittas i grundmaterialet på vår webbplats dedikerad till DirectX 11-kompatibla grafikprocessorer. I det här fallet är det som är viktigt för oss att antalet geometribearbetningsenheter i hög grad påverkar den övergripande prestandan i de nyaste spelen som använder tessellation, som Metro 2033, HAWX 2 och Crysis 2 (med de senaste patcharna). Och när du väljer ett modernt spelvideokort är det mycket viktigt att vara uppmärksam på geometrisk prestanda.

Videominne

Eget minne används av videochips för att lagra nödvändiga data: texturer, hörn, buffertdata, etc. Det verkar som att ju mer det är, desto bättre. Men allt är inte så enkelt, att uppskatta ett grafikkorts kraft med mängden videominne är det vanligaste misstaget! Oerfarna användare överskattar värdet av mängden videominne oftast och använder det fortfarande för jämförelse olika modeller grafikkort. Detta är förståeligt - den här parametern är en av de första som anges i listorna över egenskaper hos färdiga system, och den är också skriven på kartongerna med grafikkort stort tryck. Därför verkar det för en oerfaren köpare att eftersom det finns dubbelt så mycket minne, bör hastigheten på en sådan lösning vara dubbelt så hög. Verkligheten skiljer sig från denna myt genom att minnet är olika typer och egenskaper, och produktivitetstillväxten växer bara upp till en viss volym, och efter att ha nått den stannar den helt enkelt.

Så, i varje spel och med vissa inställningar och spelscener finns det en viss mängd videominne som räcker till all data. Och även om du lägger 4 GB videominne där, kommer det inte att ha skäl att påskynda renderingen, hastigheten kommer att begränsas av exekveringsenheterna som diskuterats ovan, och det kommer helt enkelt att finnas tillräckligt med minne. Det är därför, i många fall, ett grafikkort med 1,5 GB VRAM presterar i samma hastighet som ett kort med 3 GB (ceteris paribus).

Det finns situationer där mer minne leder till en synlig ökning av prestanda - det här är mycket krävande spel, speciellt vid ultrahöga upplösningar och med maximala kvalitetsinställningar. Men sådana fall uppstår inte alltid och mängden minne måste tas med i beräkningen, utan att glömma att prestandan helt enkelt inte kommer att öka över en viss mängd. Minneschips har också viktigare parametrar, såsom bredden på minnesbussen och dess arbetsfrekvens. Detta ämne är så omfattande att vi kommer att uppehålla oss vid val av mängd videominne mer detaljerat i den sjätte delen av vårt material.

Minnesbuss bredd

Minnesbussens bredd är den viktigaste egenskapen, vilket påverkar minnesbandbredden (PSP). En stor bredd gör att du kan överföra mer information från videominnet till GPU:n och tillbaka per tidsenhet, vilket har en positiv effekt på prestandan i de flesta fall. Teoretiskt sett kan en 256-bitars buss överföra dubbelt så mycket data per klocka som en 128-bitars buss. I praktiken är skillnaden i renderingshastighet, även om den inte når två gånger, i många fall väldigt nära den, med tonvikt på videominnets bandbredd.

Modern gaming grafikkort använd olika bussbredder: från 64 till 384 bitar (tidigare fanns det chips med en 512-bitars buss), beroende på prisklass och släpptid specifik modell GPU. För de billigaste low-end grafikkorten används oftast 64 och mer sällan 128 bitar, för mellannivån från 128 till 256 bitar, men grafikkort från den övre prisklassen använder bussar från 256 till 384 bitar breda. Bussbredden kan inte längre växa enbart på grund av fysiska begränsningar - storleken på GPU-chippet räcker inte för att dirigera mer än en 512-bitars buss, och den är för dyr. Därför utökas nu minnesbandbredden genom att använda nya typer av minne (se nedan).

Videominnesfrekvens

En annan parameter som påverkar minnesbandbredden är dess klockfrekvens. Och att öka minnesbandbredden påverkar ofta grafikkortets prestanda i 3D-applikationer. Minnesbussfrekvensen på moderna grafikkort sträcker sig från 533 (1066, med fördubbling) MHz till 1375 (5500, med fyrdubbling) MHz, det vill säga den kan skilja sig mer än fem gånger! Och eftersom bandbredden beror på både minnesfrekvensen och bredden på dess buss, kommer ett minne med en 256-bitars buss som arbetar med en frekvens på 800 (3200) MHz att ha en större bandbredd jämfört med ett minne som arbetar på 1000 (4000) MHz med en 128-bitars buss.

Särskild uppmärksamhet bör ägnas åt parametrarna för minnesbussens bredd, dess typ och frekvens när du köper relativt billiga grafikkort, av vilka många är utrustade med endast 128-bitars eller till och med 64-bitars gränssnitt, vilket negativt påverkar deras prestanda. I allmänhet rekommenderar vi inte alls att köpa ett grafikkort med en 64-bitars videominnesbuss för en speldator. Det är tillrådligt att ge företräde till minst en genomsnittlig nivå med minst en 128- eller 192-bitars buss.

Minnestyper

Flera olika typer av minne installeras på moderna grafikkort samtidigt. Det gamla single rate SDR-minnet finns ingenstans, men moderna typer av DDR- och GDDR-minnen har väsentligt olika egenskaper. Olika typer DDR och GDDR låter dig överföra två eller fyra gånger mer data med samma klockfrekvens per tidsenhet, och därför indikeras driftfrekvenssiffran ofta med dubbelt eller fyrdubblat, multiplicerat med 2 eller 4. Så om en frekvens på 1400 MHz indikeras för DDR-minne, då arbetar detta minne med en fysisk frekvens på 700 MHz, men indikerar den så kallade "effektiva" frekvensen, det vill säga den där SDR-minnet måste fungera för att ge samma bandbredd. Samma sak med GDDR5, men frekvensen är till och med fyrdubblad här.

Den största fördelen med de nya typerna av minne är möjligheten att arbeta med höga klockhastigheter, och därmed öka genomströmningen jämfört med tidigare tekniker. Detta uppnås på grund av ökade förseningar, som dock inte är så viktiga för grafikkort. Det första kortet som använde DDR2-minne var NVIDIA GeForce FX 5800 Ultra. Sedan dess har grafikminnestekniken avancerat avsevärt, med utvecklingen av GDDR3-standarden, som ligger nära DDR2-specifikationerna, med vissa förändringar specifikt för grafikkort.

GDDR3 är ett grafikkortsspecifikt minne med samma teknik som DDR2, men med förbättrad förbrukning och värmeavledningsegenskaper, vilket gör att kretsar kan arbeta med högre klockhastigheter. Trots det faktum att standarden utvecklades av ATI, var det första grafikkortet som använde det den andra modifieringen av NVIDIA GeForce FX 5700 Ultra, och nästa var GeForce 6800 Ultra.

GDDR4 är en vidareutveckling av "grafik"-minne, som går nästan dubbelt så snabbt som GDDR3. De huvudsakliga skillnaderna mellan GDDR4 och GDDR3, som är betydande för användarna, är återigen ökade driftsfrekvenser och minskad strömförbrukning. Tekniskt sett skiljer sig GDDR4-minnet inte mycket från GDDR3, det är en vidareutveckling av samma idéer. De första grafikkorten med GDDR4-chips ombord var ATI Radeon X1950 XTX, medan NVIDIA inte släppte produkter baserade på denna typ av minne alls. Fördelarna med nya minneschip framför GDDR3 är att strömförbrukningen för moduler kan vara ungefär en tredjedel lägre. Detta uppnås till priset av en lägre spänningsklass för GDDR4.

GDDR4 används dock inte ens i AMD-lösningar. Från och med RV7x0-familjen av GPU: er, stöder grafikkortsminneskontroller en ny typ av GDDR5-minne, som arbetar med en effektiv fyrfaldig frekvens på upp till 5,5 GHz och högre (frekvens upp till 7 GHz är teoretiskt möjlig), vilket ger en genomströmning på upp till till 176 GB/s med 256-bitars gränssnitt. Om det var nödvändigt att använda en 512-bitars buss för att öka bandbredden på GDDR3/GDDR4-minnet, så tillät byte till GDDR5 att fördubbla prestandan med mindre storlekar kristaller och mindre strömförbrukning.

Mest videominne moderna typer- dessa är GDDR3 och GDDR5, det skiljer sig från DDR i vissa detaljer och fungerar även med dubbel/fyrdubbel dataöverföring. I dessa typer av minne används vissa speciella tekniker för att öka driftfrekvensen. Till exempel kör GDDR2-minne vanligtvis mer höga frekvenser jämfört med DDR är GDDR3 ännu högre, och GDDR5 ger maximal frekvens och bandbredd vid det här ögonblicket. Men billiga modeller är fortfarande utrustade med "icke-grafiskt" DDR3-minne med en mycket lägre frekvens, så du måste välja ett grafikkort mer noggrant.

Kanske är dessa block nu huvuddelarna i videochippet. De kör speciella program som kallas shaders. Dessutom, om tidigare pixelshaders utförde block av pixel shaders och vertex - vertexblock, så har grafiska arkitekturer sedan en tid förenats, och dessa universella beräkningsblock har varit engagerade i olika beräkningar: vertex, pixel, geometriska och till och med universella beräkningar .

Den enhetliga arkitekturen användes först i videochippet på Microsoft Xbox 360-spelkonsolen, denna grafikprocessor utvecklades av ATI (senare förvärvad av AMD). Och i videochips för persondatorer dök unified shader-enheter upp i NVIDIA GeForce 8800-kortet. Och sedan dess är alla nya videochips baserade på en enhetlig arkitektur som har en universell kod för olika shader-program (vertex, pixel, geometrisk, etc.) .), och motsvarande enhetliga processorer kan köra alla program.

Genom antalet beräkningsenheter och deras frekvens kan du jämföra den matematiska prestandan för olika grafikkort. De flesta spel är nu begränsade av prestanda hos pixelshaders, så antalet av dessa block är mycket viktigt. Till exempel, om en grafikkortsmodell är baserad på en GPU med 384 datorprocessorer i sin sammansättning, och en annan från samma linje har en GPU med 192 datorenheter, kommer den andra med samma frekvens att vara dubbelt så långsam som bearbeta alla typer av shader, och i allmänhet kommer att vara samma mer produktiva.

Även om det är omöjligt att dra entydiga slutsatser om prestanda enbart på basis av antalet beräkningsenheter, är det absolut nödvändigt att ta hänsyn till klockfrekvensen och olika arkitektur för block av olika generationer och chiptillverkare. Enbart dessa siffror kan användas för att jämföra chips inom samma linje från en tillverkare: AMD eller NVIDIA. I andra fall måste du vara uppmärksam på prestandatester i spel eller applikationer av intresse.

Texturing Units (TMU)

Dessa GPU-enheter arbetar tillsammans med beräkningsprocessorerna för att sampla och filtrera textur och annan data som behövs för scenbyggande och allmänt bruk. Antalet texturenheter i ett videochip bestämmer texturprestandan - det vill säga hastigheten med vilken texel hämtas från texturer.

Även om det nyligen har lagts mer vikt vid matematiska beräkningar, och vissa texturer har ersatts av procedurmässiga, är belastningen på TMU:er fortfarande ganska hög, eftersom utöver huvudtexturerna även prover måste göras från normala och förskjutningskartor, eftersom samt renderingsbuffertar för målrendering utanför skärmen.

Med hänsyn till betoningen av många spel, inklusive prestanda hos textureringsenheter, kan vi säga att antalet TMU:er och motsvarande höga texturprestanda också är en av de viktigaste parametrarna för videochips. Den här parametern har en speciell effekt på renderingshastigheten för en bild när du använder anisotropisk filtrering, vilket kräver ytterligare texturhämtningar, såväl som med komplexa mjuka skuggalgoritmer och nymodiga algoritmer som Screen Space Ambient Occlusion.

Rasterization Operations Units (ROPs)

Rasteriseringsenheterna utför operationerna att skriva pixlarna som beräknats av grafikkortet till buffertar och operationerna för deras blandning (blandning). Som vi noterade ovan påverkar prestandan hos ROP-enheter fyllhastigheten och detta är en av de viktigaste egenskaperna hos grafikkort genom tiderna. Och även om dess värde nyligen också har minskat något, finns det fortfarande fall där applikationsprestanda beror på hastigheten och antalet ROP:er. Oftast beror detta på den aktiva användningen av efterbehandlingsfilter och kantutjämning aktiverad vid höga spelinställningar.

examensarbete

Rasterization Operations Units (ROPs)

Rasteriseringsenheterna utför operationerna att skriva pixlarna som beräknats av grafikkortet till buffertar och operationerna för deras blandning (blandning). Som nämnts ovan påverkar prestandan hos ROP-enheter fyllningsgraden, och detta är en av de viktigaste egenskaperna hos grafikkort. Och även om dess värde nyligen har minskat något, finns det fortfarande fall där applikationsprestanda är starkt beroende av hastigheten och antalet ROP-block. Oftast beror detta på aktiv användning av efterbehandlingsfilter och kantutjämning aktiverad vid höga bildinställningar.

Automatisering av redovisning för bankverksamhet och dess implementering i programmet "1C Accounting"

Om alla aktiviteter i företaget kan delas in i affärsprocesser, kan processerna delas upp i mindre komponenter. I metodiken för att bygga affärsprocesser kallas detta nedbrytning ...

Inrikes och kringutrustning PC

Studerar diskret modell populationer som använder Model Vision Studio

Den grundläggande "byggstenen" för en beskrivning i MVS är blocket. Ett block är något aktivt objekt som fungerar parallellt och oberoende av andra kontinuerliga objekt. Blocket är ett riktat block...

Använder LMS Moodle i utbildningsprocessen

För varje kurs är närvaron av ett centralt område obligatoriskt. Det kanske inte finns några vänster- och högerkolumner med block. Men de olika blocken som utgör Moodle learning management system ökar funktionaliteten...

Studie av lärarförmåga i distansutbildningssystemet Moodle

För att lägga till nya resurser, element, block eller redigera befintliga i din kurs, klicka på knappen Redigera som finns i kontrollblocket. Allmän form Kursfönstret i redigeringsläge visas i Figur 2.5: Figur 2...

Utvecklingssimulering programvara

Ordförrådet för UML-språket inkluderar tre typer av byggstenar: entiteter; relation; diagram. Entiteter är abstraktioner som är grundelementen i en modell...

Simulering av arbete i biblioteket

Operatörer - block utgör modellens logik. Det finns ett 50-tal olika typer av block i GPSS/PC, som var och en utför sina egna specifik funktion. Bakom vart och ett av dessa block finns en motsvarande översättarsubrutin...

Huvuddragen i CSS3

Du kan stila texten på ett originellt sätt med hjälp av en mängd olika konversationsblock, som återigen är gjorda på basis av CSS3-teknologier. (Fig 5.) Fig 5...

Huvuddragen i CSS3

Elementets genomskinlighetseffekt syns tydligt på bakgrundsbilden och har blivit utbredd i olika operativsystem för det ser stiligt och vackert ut...

Förberedelse textdokument i enlighet med STP 01-01

Block (kort) expansion eller kort (Card), som de ibland kallas, kan användas för att serva enheter anslutna till IBM PC. De kan användas för att ansluta ytterligare enheter (displayadaptrar, diskkontroller, etc.)...

Nedbrytning och reparation av grafikkortet

Dessa enheter arbetar tillsammans med shader-processorer av alla de specificerade typerna, de väljer och filtrerar texturdata som behövs för att bygga scenen...

Produktionsprocessen registreringsprogram för automatiserat system elektronikindustrins företagsledning

Det finns 11 typer av block från vilka ett specifikt MES-system kan göras för en viss produktion...

Utveckling mjukvarupaket beräkning av ersättning för kapitalreparationer

På den lägsta granularitetsnivån lagras Oracle-databasdata i datablock. Ett datablock motsvarar ett visst antal byte fysiskt utrymme på disken...

Utveckling av hårdvara och mjukvara för styrsystemet för transportplattformar i Simatic Step-7

Systemblock är komponenter i operativsystemet. Stanken kan hämnas av program (systemfunktioner, SFC) eller data (systemdatablock, SDB). Systemblock ger tillgång till viktiga systemfunktioner...

Enheter som ingår i datorn

Block (kort) expansion eller kort (Card), som de ibland kallas, kan användas för att serva enheter anslutna till IBM PC. De kan användas för att ansluta ytterligare enheter (displayadaptrar, diskkontroller, etc.)...

På vårt forum frågar dussintals människor varje dag om råd om att modernisera sitt eget, där vi gärna hjälper dem. Varje dag, när vi "utvärderade monteringen" och kontrollerade komponenterna som valts av våra kunder för kompatibilitet, började vi märka att användarna främst uppmärksammar andra, utan tvekan, viktiga komponenter. Och sällan kommer någon ihåg att när man uppgraderar en dator är det nödvändigt att uppdatera en lika viktig detalj -. Och idag ska vi berätta och visa varför detta inte bör glömmas.

“... Jag vill uppgradera min dator så att allt flög, jag köpte en i7-3970X-processor och en ASRock X79 Extreme6-mamma, plus ett RADEON HD 7990 6GB grafikkort. Vad mer nan????777"
- så här börjar ungefär hälften av alla meddelanden som rör uppdatering av en stationär dator. Baserat på sin egen budget eller familjebudget försöker användarna välja de mest, de flesta och mest smidiga och vackra minnesmoduler. Samtidigt naivt att tro att deras gamla 450W kommer att klara av både ett glupskt grafikkort och en "het" processor under överklockning samtidigt.

Vi för vår del har redan skrivit mer än en gång om vikten av strömförsörjningen - men, vi erkänner, det var nog inte tillräckligt tydligt. Därför korrigerade vi oss idag och förberedde ett memo för dig om vad som kommer att hända om du glömmer det när du uppgraderar din PC - med bilder och detaljerade beskrivningar.

Så vi bestämde oss för att uppdatera konfigurationen...


För vårt experiment bestämde vi oss för att ta en helt ny genomsnittlig dator och uppgradera den till nivån "spelmaskin". Du behöver inte ändra konfigurationen mycket - det räcker med att ändra minnet och grafikkortet så att vi har möjlighet att spela mer eller mindre moderna spel med anständiga detaljinställningar. Den initiala konfigurationen av vår dator är som följer:

Kraftenhet: ATX 12V 400W

Det är tydligt att för spel är en sådan konfiguration, för att uttrycka det milt, ganska svag. Så det är dags för en förändring! Vi börjar med samma sak som de flesta som vill ha en "uppgradering" börjar med - med. Vi kommer inte att byta moderkort – så länge det passar oss.

Eftersom vi bestämde oss för att inte röra moderkortet kommer vi att välja ett som är kompatibelt med FM2-uttaget (som tur är finns det en speciell knapp på NIX-webbplatsen för detta på beskrivningssidan moderkort). Låt oss inte vara giriga - låt oss ta en prisvärd, men snabb och kraftfull processor med en frekvens på 4,1 GHz (upp till 4,4 GHz i Turbo CORE-läge) och en olåst multiplikator - vi älskar också att "överklocka", inget mänskligt är främmande för oss. Här är specifikationerna för den processor vi har valt:

Egenskaper
CPU buss frekvens 5000 MHz Effektförlust 100 W Processorfrekvens 4,1 GHz eller upp till 4,4 GHz i Turbo CORE-läge Kärna Richland L1 cache 96 kB x2 L2 cache 2048 KB x2, körs med processorfrekvens 64 bitars stöd Ja Antal kärnor 4 Multiplikation 41, olåst multiplikator Processor video kärna AMD Radeon HD 8670D vid 844 MHz; Shader Model 5-stöd Max volym random access minne 64 GB Max. antal anslutna bildskärmar 3 direktanslutna eller upp till 4 skärmar med DisplayPort-delare

En bar för 4GB är inte vårt val. För det första vill vi ha 16 GB, och för det andra måste vi aktivera dubbelkanaldrift, för vilket vi kommer att installera två minnesmoduler på 8 GB vardera i vår dator. hög genomströmning, brist på radiatorer och ett anständigt pris gör dessa till det mest "läckra" valet för oss. Dessutom, från AMD-webbplatsen kan du ladda ner Radeon RAMDisk-programmet, vilket gör att vi kan skapa en supersnabb virtuell enhet upp till 6 GB helt gratis - och alla älskar gratis användbara saker.


Egenskaper
Minne 8 GB
Antal moduler 2
Minnesstandard PC3-10600 (DDR3 1333MHz)
Arbetsfrekvens upp till 1333 MHz
Tider 9-9-9-24
Matningsspänning 1,5 V
Bandbredd 10667 Mbps

Du kan bekvämt spela upp den inbyggda videon endast i Minesweeper. Därför, för att uppgradera datorn till en spelnivå, valde vi en modern och kraftfull, men inte den dyraste,.


Hon blev med 2GB videominne, stöd för DirectX 11 och OpenGL 4.x. och ett utmärkt Twin Frozr IV-kylsystem. Dess prestanda borde vara mer än tillräckligt för oss att njuta av senaste delarna de mest populära spelfranchiserna som Tomb Raider, Crysis, Hitman och Far Cry. Egenskaperna för vårt val är följande:


Egenskaper
GPU GeForce GTX 770
GPU-frekvens 1098 MHz eller upp till 1150 MHz med GPU Boost
Antal shader-processorer 1536
videominne 2 GB
Videominnestyp GDDR5
Videominnes bussbredd 256 bitar
Videominnesfrekvens 1753 MHz (7,010 GHz QDR)
Antal pixlar pipelines 128, 32 texturprovtagningsenheter
Gränssnitt PCI Express 3.0 16x (kompatibel med PCI Express 2.x/1.x) med möjlighet att kombinera kort med SLI.
Hamnar DisplayPort, DVI-D, DVI-I, HDMI, D-Sub-adapter ingår
Kylning av grafikkort Aktiv (kylfläns + 2 dubbla Frozr IV-fläktar på framsidan av brädan)
Strömkontakt 8pin+8pin
API-stöd DirectX 11 och OpenGL 4.x
Videokorts längd (mätt i NYX) 263 mm
Stöd för generell GPU-beräkning Direct Compute 11, NVIDIA PhysX, CUDA, CUDA C++, OpenCL 1.0
Maximal strömförbrukning FurMark+WinRar 255 W
prestandabetyg 61.5

Oväntade svårigheter

Nu har vi allt vi behöver för att uppgradera vår dator. Vi kommer att installera nya komponenter i vårt befintliga fall.


Vi lanserar – och det fungerar inte. Och varför? Men eftersom budgetnätaggregat inte är fysiskt kapabla att starta en dator med någon liten bit. Faktum är att i vårt fall krävs två 8-stiftskontakter för strömförsörjning, och strömförsörjningen har bara en 6-stifts strömkontakt för grafikkort "i basen". Med tanke på att många fler behöver ännu fler kontakter än i vårt fall blir det tydligt att strömförsörjningen behöver bytas.

Men det är fortfarande halva besväret. Tänk bara, det finns ingen strömkontakt! I vårt testlabb fanns det ganska sällsynta adaptrar från 6-stift till 8-stift och från molex till 6-stift. Som dessa:


Det är värt att notera att även på budgetmoderna nätaggregat, med varje ny version av Molex-kontakter, blir det mindre och mindre - så vi kan säga att vi hade tur.

Vid första anblicken är allt bra, och med några knep kunde vi uppdatera systemenhet till "spel"-konfigurationen. Låt oss nu simulera belastningen genom att köra Furmark-testet och 7Zip-arkivet i Xtreme Burning-läge på vår nya speldator samtidigt. Vi kunde starta datorn - redan bra. Systemet klarade även lanseringen av Furmark. Vi lanserar arkivet - och vad är det?! Datorn stängdes av, efter att tidigare ha belåtit oss med bruset från en fläkt som inte vrids maximalt. Den "snabba" vanliga 400W misslyckades, hur mycket han än försökte, att mata grafikkortet och den kraftfulla processorn. Och på grund av det mediokra kylsystemet blev vårt väldigt varmt, och till och med den maximala fläkthastigheten tillät den inte att producera åtminstone de deklarerade 400W.

Det finns en utgång!

Seglade. Vi köpte dyra komponenter för att montera en speldator, men det visar sig att du inte kan spela på den. Det är synd. Slutsatsen är tydlig för alla: den gamla är inte lämplig för vår speldator, och den måste snarast bytas ut mot en ny. Men vilken exakt?

För vår pumpade dator valde vi enligt fyra huvudkriterier:

Det första är naturligtvis makt. Vi föredrog att välja med marginal – vi vill också överklocka processorn och få poäng i syntetiska tester. Med hänsyn till allt vi kan behöva i framtiden bestämde vi oss för att välja en effekt på minst 800W.

Det andra kriteriet är tillförlitlighet.. Vi vill verkligen att den som tas "med en marginal" ska överleva nästa generations grafikkort och processorer, inte bränna ut sig och samtidigt inte bränna dyra komponenter (tillsammans med testplatsen). Därför är vårt val endast japanska kondensatorer, endast skydd mot kortslutningar Och pålitligt skydd från att överbelasta någon av utgångarna.

Den tredje punkten i våra krav är bekvämlighet och funktionalitet.. Till att börja med behöver vi - datorn kommer att fungera ofta, och speciellt bullriga PSU:er, tillsammans med ett grafikkort och en processorkylare, kommer att göra alla användare galna. Dessutom är vi inte främmande för skönhetskänslan, så det nya nätaggregatet till vår speldator ska vara modulärt och ha löstagbara kablar och kontakter. Så att det inte är något överflödigt.

Och sist men inte minst är kriteriet energieffektivitet. Ja, vi bryr oss miljö och elräkningar. Därför måste strömförsörjningen vi väljer uppfylla minst energieffektivitetsstandarden 80+ Bronze.

Genom att jämföra och analysera alla krav valde vi bland de få sökande som till fullo uppfyllde alla våra krav. De blev kraften på 850W. Observera att det i ett antal parametrar till och med överträffade våra krav. Låt oss se dess specifikation:

Specifikationer för strömförsörjning
Typ av utrustning Strömförsörjning med aktiv PFC-modul (Power Factor Correction).
Egenskaper Slingfläta, japanska kondensatorer, Kortslutningsskydd (SCP), Överspänningsskydd (OVP), Överbelastningsskydd för någon av utgångarna på enheten individuellt (OCP)
+3,3V - 24A, +5V - 24A, +12V - 70A, +5VSB - 3,0A, -12V - 0,5A
Löstagbara strömkablar Ja
effektivitet 90 %, 80 PLUS guldcertifierad
Strömförsörjning ström 850 W
Moderkorts strömkontakt 24+8+8 stift, 24+8+4 stift, 24+8 stift, 24+4 stift, 20+4 stift
Strömkontakt för grafikkort 6x 6/8-stifts kontakter (avtagbar 8-stiftskontakt - 2 stift löstagbar)
MTBF 100 tusen timmar
Strömförsörjning kyla 1 fläkt: 140 x 140 mm (på bottenvägg). Passivt kylsystem under belastning upp till 50 %.
Fläkthastighetskontroll Från termostaten. Ändring av fläkthastighet beroende på temperaturen inuti strömförsörjningen. Manuellt val av fläktdriftsläge. I normalt läge snurrar fläkten konstant och i tyst läge stannar den helt vid låg belastning.


, en av de bästa för pengarna. Låt oss installera det i vårt fall:


Något hände här som förvirrade oss lite. Det verkar som att allt var korrekt monterat, allt var anslutet, allt fungerade - och strömförsörjningen är tyst! Det vill säga i allmänhet: fläkten, som den stod still, står fortfarande, och systemet har startat och fungerar korrekt. Faktum är att vid en belastning på upp till 50% fungerar strömförsörjningen i det så kallade tysta läget - utan att snurra kylsystemets fläkt. Fläkten brummar bara under tung belastning - den samtidiga lanseringen av arkiveringsmaskiner och Furmark fick fortfarande det svalare att snurra.


Strömförsörjningen har så många som sex 8-stifts 6-stifts grafikkorts strömkontakter, som var och en är en hopfällbar 8-stiftskontakt, från vilken vid behov 2 stift kan lossas. Således kan den mata vilket grafikkort som helst utan onödigt krångel och svårigheter. Och inte ens en.


Det modulära strömförsörjningssystemet låter dig lossa onödiga och onödiga strömkablar, vilket förbättrar väskans ventilation, systemets stabilitet och, naturligtvis, förbättras estetiskt. utseende inre utrymme, vilket gör att vi säkert kan rekommendera det till modders och fans av fall med fönster.
köp en pålitlig och kraftfull strömförsörjning. I vår recension blev han. - och som ni ser, inte av en slump. Efter att ha köpt samma i NYKS kan du vara säker på att alla komponenter i ditt högpresterande system kommer att förses med tillräckliga och oavbruten strömförsörjning, även under extrem överklockning.


Dessutom kommer strömförsörjningen att hålla i flera år framåt – bättre med marginal, ifall du ska uppgradera systemet med komponenter på hög nivå i framtiden.