computadores multinucleo

37
COMADOE MLINCLEO . C O A 8

Upload: ric-ogama-geurs

Post on 14-Apr-2018

224 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 1/37

COMPUTADORES MULTINUCLEO

Stallings W. “Computer Organization and Architecture” 8ed

Page 2: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 2/37

Computador multinucleo• Un computador multinúcleo combina dos o

mas procesadores (llamados núcleos) en unaúnica pieza de silicio.

 componentes de un procesadorindependiente e incluye memoria cache de

nivel 1, nivel 2 y, en algunos casos, nivel 3

Page 3: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 3/37

ASPECTOS DE RENDIMIENTO DEL HARDWARE• Los sistemas de

microprocesadores hanexperimentado uncrecimiento permanente yexponencial en rendimiento

,gracias a: –  Mejoras en su organización –  Incremento de su frecuencia

de reloj. –  Incremento del nivel de

integración

Page 4: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 4/37

ASPECTOS DE RENDIMIENTO DEL HARDWARE

• Incremento del nivel de integración.

Page 5: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 5/37

ASPECTOS DE RENDIMIENTO DEL HARDWARE• Rendimiento de los procesadores de Intel.

Page 6: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 6/37

LIMITACIONES DE LAS ARQUITECTURAS

TRADICIONALES• Limitaciones de la tecnología subyacente

 –  Frecuencia de operación. –  Limitaciones en la escala de integración. –  Consumo de energía. –  Retardo RC: a altos niveles de integración, la resistencia de los cables se

incrementa, así como la capacitancia entre cables cada vez mas próximos. –  Latencia de memoria.

 •

Agotamiento de la arquitectura secuencial

• Necesidad de mayor capacidad de procesamiento.

Page 7: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 7/37

Incremento en paralelismo• Los cambios organizacionales en el diseño del

procesador se han enfocado principalmenteen incrementar el paralelismo a nivel de

.

 –  Segmentación

 –  Superescalarabilidad.

 – 

Multithreading simultáneo (SMT) – bancos deregistros se replican para que múltiples hilospuedan compartir los recursos de la segmentación

Page 8: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 8/37

Superescalarabilidad• Se utilizan múltiples cauces para la ejecución

paralela de instrucciones, en la medida que lopermitan los riesgos de control y dependencia dedatos

Page 9: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 9/37

Multithreading simultáneo (SMT)• Los bancos de registros se replican para que

múltiples hilos puedan compartir los recursos dela segmentación

Page 10: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 10/37

Multinucleo• Combinación de dos o mas procesadores en

una única pieza de silicio

Page 11: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 11/37

Incremento en paralelismo• El incremento de rendimiento ha conducido a

un incremento de la complejidad del sistema.• Una parte creciente del chip se dedica a la

.

• A su vez, esto incrementa la complejidad deldiseño, fabricación y depuración de los chips.

• La energía que un chip requiere ha pasado aser un factor crítico.

Page 12: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 12/37

Consumo de energía• Para mantener la tendencia de mayor rendimiento a

medida que se incrementa el número de transistoresy las frecuencias de reloj, los requerimientos deenergía han crecido exponencialmente.

Page 13: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 13/37

Consumo de energía• Una forma de controlar la densidad de energía es

utilizar más área del chip para memoria cache, puesesta consume menos energía que el área de lógica.

Page 14: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 14/37

Consumo de energía• Regla de Pollack:

 –  El incremento de rendimiento es aproximadamenteproporcional a la raíz cuadrada del incremento encomplejidad. Es decir, si se duplica la lógica en un

,

de solo el 40%.

 –  En principio, el uso de múltiples núcleos tiene el potencialde proporcionar un incremento del rendimiento casi lineal

con el incremento del número de núcleos. –  Los problemas de energía proporcionan otro motivo para

optar por organizaciones multinúcleo.

Page 15: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 15/37

ASPECTOS DE RENDIMIENTO DEL SOFTWARE• Software en multinúcleo

 – 

Los beneficios potenciales de rendimiento de unaorganización multinúcleo depende de la habilidad deexplotar efectivamente los recursos paralelos

.

 –  Ley de Amdahl:

 –  f: fracción de código paralelizable

Page 16: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 16/37

• Esta ley parece hacer atractiva la organizaciónmultinúcleo.

• Sin embargo, aun una pequeña porción de códigosecuencial, tiene un impacto significativo

ASPECTOS DE RENDIMIENTO DEL SOFTWARE

Page 17: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 17/37

ASPECTOS DE RENDIMIENTO DEL SOFTWARE• Las aplicaciones que más se benefician de la

organización multinúcleo son aquellas quepueden manejar múltiples transaccionesrelativamente independientes en paralelo y

las que manejan multiples hilos: –  Aplicaciones multihilo nativas.

 –  Aplicaciones multiproceso.

 –  Aplicaciones Java. –  Aplicaciones de múltiples instancias

Page 18: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 18/37

ORGANIZACIÓN MULTINUCLEO• A un alto nivel de descripción, las variables

principales de una organización multinúcleoson:

 

 –  El número de niveles de memoria cache.

 –  La cantidad de memoria cache que es compartida.

Page 19: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 19/37

ORGANIZACIÓN MULTINUCLEO• Ejemplos de organización multinúcleo:

• Utilizada en chips embebidos.• Utiliza una memoria cache de nivel 1 on-chip dedicada.

• Ejemplo: ARM11 MPCore

Page 20: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 20/37

ORGANIZACIÓN MULTINUCLEO• Ejemplos de organización multinúcleo:

• Cache on-chip no compartida.• Incluye memoria cache dedicada de nivel 2.

• Ejemplo: AMD Opteron

Page 21: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 21/37

ORGANIZACIÓN MULTINUCLEO• Ejemplos de organización multinúcleo:

• Utiliza memoria cache L2 compartida on-chip.• Ejemplo: Intel Core Duo

Page 22: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 22/37

ORGANIZACIÓN MULTINUCLEO• Ejemplos de organización multinúcleo:

• Se incrementa la cantidad de memoria cache disponible.• Incluye cache L1 y L2 dedicado y cache L3 compartida.

• Ejemplo: Intel Core i7.

Page 23: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 23/37

ORGANIZACIÓN MULTINUCLEO• El uso de una memoria cache L2 compartida

en el chip tiene varias ventajas frente a ladependencia exclusiva de caches dedicadas: –  Se puede mejorar la tasa de aciertos. 

 –  Los datos compartidos por múltiples núcleos no sereplican en el nivel de memoria cache compartida.

 –  Con algoritmos de reemplazo adecuados, la

cantidad de cache compartida asignada a cadanúcleo es dinámica y los hilos con menor localidadpueden emplear mas cache.

Page 24: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 24/37

ORGANIZACIÓN MULTINUCLEO –  La comunicación interprocesadores es fácil de

implementar mediante posiciones de memoria

compartidas. –  El uso de memoria cache L2 compartida confina los

problemas de coherencia cache a la cache L1, lo que

rendimiento.• Una ventaja potencial de solo tener memoria

cache L2 dedicada en los chips es que cada

núcleo obtiene acceso más rápido a su cache L2privada. Esto es ventajoso para hilos conlocalidad fuerte.

Page 25: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 25/37

ORGANIZACIÓN MULTINUCLEO• Otra decisión de diseño organizacional en un

sistema multinúcleo es si los núcleos individualesserán superescalares o implementarán SMT.

• ,

superescalares, mientras que el Intel Core i7utiliza núcleos SMT.

• SMT tiene el efecto de escalar el número de hilosde nivel hardware que el sistema multinúcleosoporta.

Page 26: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 26/37

ORGANIZACIÓN MULTINUCLEO• Por tanto, un sistema multinúcleo con cuatro

núcleos y SMT que soporta cuatro hilossimultáneos en cada núcleo es equivalente a

.

• En tanto que el software se desarrolla paraexplotar plenamente los recursos paralelos, un

enfoque SMT parece ser más atractivo que unenfoque superescalar.

Page 27: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 27/37

ORGANIZACIÓN MULTINUCLEO INTEL• Intel Core Duo

 – Se introdujo el2006.

  – 

Implementa dosprocesadores x86superescalares con

una memoria cacheL2 compartida.

Page 28: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 28/37

ORGANIZACIÓN MULTINUCLEO INTEL• Intel Core Duo

 – 

Cada núcleo tiene su propia cache dedicadaL1 (32KB para datos y 32KB parainstrucciones).

  –  c uTérmico independiente para maximizar elrendimiento del procesador dentro de lasrestricciones térmicas. Si la temperatura de

un núcleo excede un umbral, la UCT reduce lafrecuencia de reloj para reducir la generaciónde calor de dicho núcleo.

Page 29: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 29/37

ORGANIZACIÓN MULTINUCLEO INTEL• Intel Core Duo

 – El Advanced Programmable InterruptController (APIC) realiza las siguientes

• Proporciona interrupciones interprocesador, lo quepermite que cualquier proceso interrumpa cualquierprocesador o conjunto de procesadores .

• Acepta interrupciones de E/S y enruta estas al núcleoapropiado.

• Cada APIC incluye un timer, que puede ser fijado porel SO para generar una interrupción en el núcleo local.

Page 30: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 30/37

ORGANIZACIÓN MULTINUCLEO INTEL• Intel Core Duo

 –  El Power Management Logic es responsable dereducir el consumo de energía, cuando sea

,

las batería en equipos móviles. –  Incluye una memoria cache L2 compartida de

2MB (MESI) con mejoras para SMP

Page 31: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 31/37

ORGANIZACIÓN MULTINUCLEO INTEL• Intel Core i7

 – Se introdujo el2008.

 

procesadores x86SMT, cada uno conuna cache L2

dedicada y unacache L3compartida.

Page 32: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 32/37

ORGANIZACIÓN MULTINUCLEO INTEL• Intel Core i7

 – 

Utiliza un mecanismo de pre extracción paramejorar la efectividad de la memoria cache. –  El hardware examina los patrones de acceso a

c cespeculativa con datos que probablementesean requeridos pronto

Page 33: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 33/37

ORGANIZACIÓN MULTINUCLEO INTEL• Intel Core i7

 –  Cada núcleo tiene su propia cache L2dedicada y los cuatro núcleos comparten unacache L3 de 8MB con pre extracción basada

en el análisis de patrones de acceso –  El controlador DDR3 soporta tres canales de 8

bytes de ancho para un ancho de bus total de

192 bits y una tasa de transferencia agregadade hasta 32GBps

 –  Se elimina la necesidad del Front Side Bus.

Page 34: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 34/37

ORGANIZACIÓN MULTINUCLEO INTEL• Intel Core i7

 –  El Quick Path Interconnect (QPI) es un enlacepunto a punto que permite comunicación dealta velocidad entre chips de procesadores

interconectados. Opera a 6,4GTps(transferencias por segundo). Con 16 bits portransferencia, alcanza 12.8GBps.

 – 

Puesto que los enlaces QPI comprenden paresbidireccionales dedicados, el ancho de bandatotal es de 25.6GBps

Page 35: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 35/37

ORGANIZACIÓN MULTINUCLEO ARM11 MPCore

• Basado en la familia de procesadores ARM11• Puede configurarse hasta con cuatro procesadores,

cada uno con su propia memoria cache L1.• La siguiente tabla muestra las opciones de

Page 36: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 36/37

ORGANIZACIÓN MULTINUCLEO ARM11 MPCore

• Distributed interrupt controller (DIC) – maneja la detección deinterrupciones y su priorización. Distribuye las interrupciones a losprocesadores individuales.

• Timer – cada CPU tiene su propio timer privado que puede generarinterrupciones.

• Watchdog – Alerta en eventos de fallos de software.• –•

Interface CPU – maneja la confirmación de interrupciones, elenmascaramiento de interrupciones y la confirmación de la finalizaciónde interrupciones.

• Vector floating-point unit (VFP) – un coprocesador que implementaoperaciones de punto flotante en hardware.

Cache L1 – cada CPU tiene su propia memoria cache dedicad L1 de datose instrucciones.• Snoop control unit (SCU) – responsable de la coherencia cache entre

caches de datos L1.

Page 37: COMPUTADORES MULTINUCLEO

7/27/2019 COMPUTADORES MULTINUCLEO

http://slidepdf.com/reader/full/computadores-multinucleo 37/37

ORGANIZACIÓN MULTINUCLEO ARM11 MPCore