Содержание
- 2. Схема простого компьютера Концептуально простой персональный компьютер можно представить в виде модели, аналогичной изображенной на рисунке.
- 3. Центральный процессор Центральный процессор выбирает команды из памяти и выполняет их. Обычный цикл работы центрального процессора
- 4. В дополнение к регистрам общего назначения, которые обычно применяются для хранения переменных и промежуточных результатов, у
- 5. Большинство центральных процессоров, за исключением самых простых, используемых во встраиваемых системах, имеют два режима работы: режим
- 6. В процессорах с набором команд x86 или x86-64 предусмотрено 4 уровня привилегий, от наиболее привилегированного уровня
- 7. Конвейерная обработка команд Для повышения производительности процессоров их разработчики давно отказались от простой модели извлечения, декодирования
- 8. Более совершенной конструкцией по сравнению с конвейерной обладает суперскалярный процессор. Он имеет несколько исполнительных блоков, например:
- 9. Типы архитектур аппаратных средств Наиболее общий способ классификации архитектур базируется на понятиях потока команд и потока
- 11. SISD – включает компьютеры, в которых имеется только один поток команд, команды обрабатываются последовательно и каждая
- 12. MIMD – здесь несколько независимых процессоров работают как часть большой системы. Структурная схема класса MIMD приведена
- 13. Мультипроцессор представляет собой несколько процессоров в рамках одного вычислительного устройства Для систематики мультипроцессоров учитывается способ построения
- 15. SMP (Symmetric Multiprocessor) содержит несколько полностью равноправных процессоров. PVP (parallel vector processor) параллельный векторный процессор. Важной
- 16. Увеличение производительности процессоров Идея поддержки одновременной многопоточности (simultaneous multithreading, SMT) была предложена в 1995 г. и
- 17. Технология одновременной многопоточности позволяет достичь многопроцессорности на логическом уровне. Возможное продвижение по направлению к большей вычислительной
- 19. В последнее время активно разрабатываются различные ускорители вычислений. Компанией ClearSpeed Technology представлен ускоритель операций над данными
- 20. Системы команд CISC и RISC Основную идею CISC-архитектуры отражает ее название — «полный набор команд» (Complex
- 21. CISC-подход, однако, привел к тому, что некоторые команды стало невозможно выполнять чисто аппаратными средствами. В результате
- 22. Главные усилия в архитектуре RISC направлены на построение максимально эффективного конвейера команд, то есть такого, где
- 24. Скачать презентацию
Схема простого компьютера
Концептуально простой персональный компьютер можно представить в виде модели,
Схема простого компьютера
Концептуально простой персональный компьютер можно представить в виде модели,
Центральный процессор
Центральный процессор выбирает команды из памяти и выполняет их. Обычный
Центральный процессор
Центральный процессор выбирает команды из памяти и выполняет их. Обычный
Для каждого типа центрального процессора существует определенный набор команд, которые он может выполнять. Поэтому x86 не может выполнять программы, написанные для ARM-процессоров, а те, в свою очередь, не в состоянии выполнять программы, написанные для x86. Поскольку доступ к памяти для получения команды или данных занимает намного больше времени, чем выполнение команды, у всех центральных процессоров есть несколько собственных регистров для хранения основных переменных и промежуточных результатов. Соответственно набор команд содержит, как правило, команды на загрузку слова из памяти в регистр и на запоминание слова из регистра в память. Другие команды объединяют два операнда из регистров, памяти или обоих этих мест для получения результата — например, складывают два слова и сохраняют результат в регистре или в памяти.
В дополнение к регистрам общего назначения, которые обычно применяются для хранения
В дополнение к регистрам общего назначения, которые обычно применяются для хранения
Другой специальный регистр, называемый указателем стека, ссылается на вершину текущего стека в памяти. Стек содержит по одному фрейму (области данных) для каждой процедуры, в которую уже вошла, но из которой еще не вышла программа. В стековом фрейме процедуры хранятся ее входные параметры, а также локальные и временные переменные, не содержащиеся в регистрах.
Еще один регистр содержит слово состояния программы — PSW (Program Status Word). В этом регистре содержатся биты кода условия, устанавливаемые инструкциями сравнения, а также биты управления приоритетом центрального процессора, режимом (пользовательским или ядра) и другие служебные биты. Обычно пользовательские программы могут считывать весь регистр PSW целиком, но записывать — только в некоторые из его полей. Регистр PSW играет важную роль в системных вызовах и операциях ввода-вывода.
Большинство центральных процессоров, за исключением самых простых, используемых во встраиваемых системах,
Большинство центральных процессоров, за исключением самых простых, используемых во встраиваемых системах,
Пользовательские программы всегда работают в режиме пользователя, который допускает выполнение только подмножества команд и дает доступ к определенному подмножеству возможностей аппаратуры. Как правило, в пользовательском режиме запрещены все команды, касающиеся операций ввода-вывода и защиты памяти. Также, разумеется, запрещена установка режима ядра за счет изменения значения бита режима PSW.
Для получения услуг от операционной системы пользовательская программа должна осуществить системный вызов, который перехватывается внутри ядра и вызывает операционную систему.
В процессорах с набором команд x86 или x86-64 предусмотрено 4 уровня
В процессорах с набором команд x86 или x86-64 предусмотрено 4 уровня
Конвейерная обработка команд
Для повышения производительности процессоров их разработчики давно отказались от
Конвейерная обработка команд
Для повышения производительности процессоров их разработчики давно отказались от
Более совершенной конструкцией по сравнению с конвейерной обладает суперскалярный процессор. Он
Более совершенной конструкцией по сравнению с конвейерной обладает суперскалярный процессор. Он
Типы архитектур аппаратных средств
Наиболее общий способ классификации архитектур базируется на понятиях
Типы архитектур аппаратных средств
Наиболее общий способ классификации архитектур базируется на понятиях
SISD – Simple Instruction / Simple Data – архитектура с простым потоком команд и простым потоком данных
MISD – Multiple Instruction / Simple Data – архитектура с множественным потоком команд и простым потоком данных
SIMD – Simple Instruction / Multiple Data – архитектура с простым потоком команд и множественным потоком данных
MIMD – Multiple Instruction / Multiple Data – архитектура с множественным потоком команд и множественным потоком данных
SISD – включает компьютеры, в которых имеется только один поток команд,
SISD – включает компьютеры, в которых имеется только один поток команд,
MISD - к данному классу относят конвейерные системы. Некоторые специалисты считают, что пока данный класс пуст.
SIMD – к этому классу относят системы, где множество элементов данных подвергается параллельной, но однотипной обработке.
Многие технические задачи используют векторы, над компонентами которых выполняются однотипные операции (например, сложение двух векторов). Для работы с такими данными используются матричные и векторные процессоры. Матричный процессор содержит решетку вычислительных элементов, операции в которых выполняются одновременно. Векторный процессор содержит векторный регистр, в котором операции над компонентами вектора выполняются последовательно с помощью конвейерной обработки..
Машины с архитектурой SIMD используются в научных исследованиях.
MIMD – здесь несколько независимых процессоров работают как часть большой системы.
MIMD – здесь несколько независимых процессоров работают как часть большой системы.
Мультипроцессор представляет собой несколько процессоров в рамках одного вычислительного устройства Для
Мультипроцессор представляет собой несколько процессоров в рамках одного вычислительного устройства Для
SMP (Symmetric Multiprocessor) содержит несколько полностью равноправных процессоров.
PVP (parallel vector
SMP (Symmetric Multiprocessor) содержит несколько полностью равноправных процессоров.
PVP (parallel vector
Важной проблемой при организации параллельных вычислений является обеспечение информационной целостности (когерентности) кэшей (cache coherence problem).
COMA (cache-only memory architecture) - системы, в которых для представления данных используется только локальная кэш-память.
CC-NUMA (cache-coherent NUMA) - системы, в которых обеспечивается когерентность локальных кэшей разных процессоров.
NCC-NUMA (non-cache coherent NUMA) - системы, в которых обеспечивается общий доступ к локальной памяти разных процессоров без поддержки на аппаратном уровне когерентности кэша
Увеличение производительности процессоров
Идея поддержки одновременной многопоточности (simultaneous multithreading, SMT) была предложена
Увеличение производительности процессоров
Идея поддержки одновременной многопоточности (simultaneous multithreading, SMT) была предложена
Технология одновременной многопоточности позволяет достичь многопроцессорности на логическом уровне.
Возможное продвижение
Технология одновременной многопоточности позволяет достичь многопроцессорности на логическом уровне.
Возможное продвижение
На логическом уровне архитектура многоядерного процессора соответствует практически архитектуре симметричного мультипроцессора. На рисунке внизу приведена возможная архитектура двуядерного процессора – различия для разных многоядерных процессоров могут состоять в количестве имеющихся ядер и в способах использования кэш-памяти ядрами процессора – кэш-память может быть как общей, так и распределенной для разных ядер. Так, на рисунке кэш-память первого уровня L1 локальна для каждого ядра, в то же время кэш-память всех последующих уровней и оперативная память является общей.
Многоядерность позволяет повышать производительность процессоров, и данный подход обладает целым рядом привлекательных моментов (уменьшение энергопотребления, снижение сложности логики процессоров и т. п.). Все сказанное приводит к тому, что многоядерность становится одним из основных направлений развития компьютерной техники.
В последнее время активно разрабатываются различные ускорители вычислений.
Компанией ClearSpeed Technology представлен
В последнее время активно разрабатываются различные ускорители вычислений.
Компанией ClearSpeed Technology представлен
Компания NVIDIA представила продукты семейства Tesla для построения высокопроизводительных вычислительных систем. Tesla поддерживает операционные системы семейств Windows и Linux. В комплект поставки входят следующие компоненты: CUDA Driver, CUDA Toolkit, CUDA SDK.
CUDA (Compute Unified Device Architecture) - программно аппаратное решение, позволяющее использовать видеопроцессоры для вычислений общего назначения.
Системы команд CISC и RISC
Основную идею CISC-архитектуры отражает ее название —
Системы команд CISC и RISC
Основную идею CISC-архитектуры отражает ее название —
Исторически CISC-архитектура была одной из первых. Совершенствование процессоров шло по пути создания машин, способных выполнять как можно больше разных команд. Это упрощало работу программистов, которые писали программы на языке ассемблера. Использование сложных команд позволяло сократить размер и время разработки программы.
В итоге сложились следующие черты организации CISC-процессоров:
большое количество различных машинных команд (сотни), каждая из которых выполняется за несколько тактов центрального процессора;
устройство управления с программируемой логикой;
небольшое количество регистров общего назначения (РОН);
различные форматы команд с разной длиной;
преобладание двухадресной адресации;
развитый механизм адресации операндов, включающий различные методы косвенной адресации.
CISC-подход, однако, привел к тому, что некоторые команды стало невозможно выполнять
CISC-подход, однако, привел к тому, что некоторые команды стало невозможно выполнять
Все эти факторы привели к повороту в сторону RISC-архитектуры (Reduce Instruction Set Computer). В то же время целый ряд несомненных достоинств CISC-архитектуры сохраняют ее актуальность (прежде всего, в глазах разработчиков программных приложений).
Именно поэтому ведущие фирмы-производители ВМ (Intel, AMD, IBM и др.) в своих последних разработках, по-прежнему, не отказываются от CISC-подхода.
Главные усилия в архитектуре RISC направлены на построение максимально эффективного конвейера
Главные усилия в архитектуре RISC направлены на построение максимально эффективного конвейера
Для этого нужно, чтобы все команды имели стандартную длину, равную ширине шины данных, соединяющей ЦП и память. Помимо одинаковой длины команд важно иметь относительно простую подсистему декодирования и управления: сложное устройство управления будет вносить дополнительные задержки в формирование сигналов управления. Очевидный путь существенного упрощения устройства управления — сокращение числа выполняемых команд, форматов команд и данных, а также способов адресации.
Основная причина, препятствующая сведению всех этапов цикла команды к одному тактовому периоду — потенциальная необходимость доступа к памяти для выборки операндов и/или записи результатов. По этой причине желательно максимально сократить число команд, имеющих доступ к памяти.
Для упрощения выполнения большинства команд и приведения их к формату «регистр-регистр» требуется снабдить ЦП значительным числом регистров общего назначения.