Виды процессоров

Содержание

Слайд 2

1. Архитектуры МП Внешняя – для программиста (команды, регистры и т.

1. Архитектуры МП

Внешняя – для программиста (команды, регистры и т. п.)

Внутренняя

– для инженера (эл. схемы и т. п.)
Слайд 3

Внешняя RISC CISC VLIW

Внешняя

RISC

CISC

VLIW

Слайд 4

CISC – Complex Instruction Set Computer Удобно для asm-программиста, но УУ

CISC – Complex Instruction Set Computer

Удобно для asm-программиста, но УУ сложное

+ простои конвейера

Н-р, «провести интерполяцию полиномом»

Слайд 5

Вывод IBM: компиляторы языков высокого уровня чаще генерируют простые команды (типа A->B) неэффективно используют сложные

Вывод IBM:
компиляторы языков высокого уровня
чаще генерируют простые команды (типа

A->B)
неэффективно используют сложные
Слайд 6

Можно ограничиться простыми Нужны RISC-процессоры (Reduced Instruction Set Computer)

Можно ограничиться простыми

Нужны RISC-процессоры
(Reduced Instruction Set Computer)

Слайд 7

Простые операции можно делать быстро Высокие тактовые частоты Нужно хорошее кэширование. Иначе – холостые такты.

Простые операции можно делать быстро

Высокие тактовые частоты

Нужно хорошее кэширование. Иначе

– холостые такты.
Слайд 8

VLIW – «очень длинное командное слово»: параллельно выполняемые команды собраны «в

VLIW – «очень длинное командное слово»: параллельно выполняемые команды собраны «в

пачки», н-р, по 128 бит

Нужен особый компилятор, но меньше работы для УУ

Первые VLIW: Sun SPARC (1991),
DEC Alpha (1992)

Слайд 9

Современная тенденция – смесь: RISC ядро + транслятор из CISC в RISC + поддержка VLIW

Современная тенденция – смесь: RISC ядро + транслятор из CISC в

RISC + поддержка VLIW
Слайд 10

2. По назначению (функциям) Универсальные – вычислят всё, если есть ПО,

2. По назначению (функциям)

Универсальные – вычислят всё, если есть ПО,

но не всегда эффективны

Используются в качестве ЦП обычных ЭВМ

Слайд 11

Специализированные – со «вшитым» алгоритмом работы, оптимизированы а) сигнальные – для

Специализированные – со «вшитым» алгоритмом работы, оптимизированы

а) сигнальные – для

цифровой обработки аналоговых сигналов

Н-р,
Фурье-преобразование,
АЦП в телевизорах

Слайд 12

б) медийные – для быстрой обработки видео и аудио Н-р, генерировать треугольники

б) медийные – для быстрой обработки видео и аудио
Н-р, генерировать треугольники

Слайд 13

Пример: графический процессор GeForce GTX 280 10 модулей по три 8-ядерных процессора = 240 ядер

Пример: графический процессор GeForce GTX 280

10 модулей по три 8-ядерных

процессора = 240 ядер
Слайд 14

Слайд 15

Модуль

Модуль

Слайд 16

Рекорд: оптический векторно-матричный умножитель EnLight 256T

Рекорд: оптический векторно-матричный умножитель EnLight 256T

Слайд 17

8 трилл. оп/с ! Заменяет многопроцессорные системы Для видео (де)кодирования.

8 трилл. оп/с !

Заменяет многопроцессорные системы

Для видео (де)кодирования.

Слайд 18

Слайд 19

в) микроконтроллеры – для управления техникой Н-р, НЖМД, стиральная машина, подвеска

в) микроконтроллеры – для управления техникой

Н-р, НЖМД, стиральная машина, подвеска автомобиля

г)

ввода-вывода – для связи ЦП с УВВ

Н-р, есть в чипсете

Слайд 20

д) транспьютерные (серверные) – для многопроц. систем – имеют спец. каналы

д) транспьютерные (серверные)

– для многопроц. систем – имеют спец. каналы (линки)

для связи друг с другом
Слайд 21

Слайд 22

е) нейропроцессоры – для построения нейросетей – имитации мозга

е) нейропроцессоры – для построения нейросетей – имитации мозга

Слайд 23

Нейросети эффективны, если задача плохо формализуется (нет строгих алгоритмов) Н-р, распознавание образов

Нейросети эффективны, если задача плохо формализуется (нет строгих алгоритмов)
Н-р, распознавание образов

Слайд 24

ж) научные Н-р, GRAPE (gravity pipe) и MDGRAPE (molecular dynamic) Кулон, ВДВ

ж) научные

Н-р, GRAPE (gravity pipe) и MDGRAPE (molecular dynamic)

Кулон, ВДВ

Слайд 25

Для параллельных вычислений с плавающей точкой

Для параллельных вычислений с плавающей точкой

Слайд 26

3. По числу ядер 8+1 = Cell BE 3.2 ГГц

3. По числу ядер

8+1 = Cell BE

3.2 ГГц

Слайд 27

Kilocore KC256 Rapport + IBM 100 МГц, 8 бит, 0.5 Вт в сумме мобильное ТВ

Kilocore KC256

Rapport + IBM

100 МГц, 8 бит, 0.5 Вт в сумме

мобильное

ТВ
Слайд 28

Общая схема:

Общая схема: