Архитектура операционных систем. Процессы и потоки

Сентябрь 7, 2022

Главная
Алгебра
Архитектура операционных систем. Процессы и потоки

Содержание

2. Процесс Определения: Это программа в состоянии выполнения Объект, выполняемый на процессоре Процессы – фундаментальное понятие в
3. Процесс 2 Процесс состоит из трех основных компонент Исполняемого программного кода Ассоциированных с ним данных, необходимых
4. Образ процесса Это выделенное место в памяти Каждый процесс выполняется в собственном виртуальном адресном пространстве, которое
5. Структуры управления процессом Таблица процессов. Одна запись на каждый процесс Блок управления процессом: Process Control Block
6. Process Control Block Содержит всю информацию, необходимую для приостановки и последующего возобновления процесса Идентификатор процеса №
7. Диспетчеризация «Диспетчер» отправляет процессы на выполнение: выделяет время ЦП, переключает ЦП с одного процесса на другой
8. Модель состояний процесса 1 Можно выделить три основных состояния Выполнения (исполняется на ЦП) Готовности (временно остановлен)
9. Модель состояний процесса 2 Модель из пяти состояний Новый: процесс создан, но ещё не помещён операционной
10. Планирование процессов В ОС есть различные очереди (или списки) для планирования процессов Очередь задач: множество всех
11. Управление процессами Используется одна очередь «готовых» и одна очередь «заблокированных» Недостатки: При наступлении события, все ожидающие
12. Создание процесса Загрузка системы При инициализации системы создаются несколько процессов В Unix, это процессы «демоны» sched
13. Создание процесса 2 Присвоить уникальный идентификатор новому процессу Выделить место для процесса Программа, данные, стэк Инициализировать
14. Иерархия процессов (UNIX) Строгая иерархия между процессами: дочерний и родительский процессы всегда взаимосвязаны Группы процессов Напр.
15. Иерархия процессов (Windows) Её нет. Все равны. Хэндл процесса: когда новый процесс создаётся родительским, то родитель
16. Создание процесса (UNIX) Процессы создаются через fork() / exec() fork() создаёт точный клон вызывающего процесса, т.н.
17. Создание процесса (UNIX) 2 Адресное пространство родителя (код, статические данные, куча, стэк) Родительский PCB Адресное пространство
18. Создание процесса (UNIX) 3 Как же создать новую программу, а не ещё одну копию старой? «Легко».
19. Что в Linux? clone() заменяет fork() (и vfork() тоже). У clone() есть дополнительные опции. Но всё-равно
20. Создание процесса (NT) Процессы создаются через системный вызов NtCreateProcess().
21. Переключение между процессами При необходимости переключиться на другой процесс, ОС выполняет «переключение контекста» Состояние старого процесса
22. Переключение контекста События, вызывающие переключение контекста: Прерывания Исключения Системные вызовы
23. Потоки (нити) Процесс состоит как минимум из: Адресного пространства Набор инструкций (код) программы Данные для программы
24. Потоки, зачем они нужны Потоки – для параллелизма и одновременности. Параллелизм – это физически одновременное выполнение
25. Параллелизм Возьмём пример про веб-сервер со слайда 12, который должен обслуживать несколько запросов параллельно Ожидая данных
26. Параллелизм 2 В каждом из этих примеров параллелизма есть общее: Один код Доступ к одним данным
27. Параллелизм 3 Как этого достичь? Используя знания о процессах, можно fork-нуть несколько процессов Заставить каждый из
28. Решение – потоки! Основная мысль отделить понятие процесса (адресного пространства, ресурсов ОС) от Минимальной нити, потока
29. Потоки и процессы Большинство современных ОС поддерживает два объекта: Процесс, который определяет адресное пространство и общие
30. Потоки и процессы 2 Многопоточность полезна для: Обработки одновременных событий Построения параллельных программ Поддержка многопоточности –
31. Потоки и процессы 3 Раньше: «процесс» = адресное пространство + ресурсы ОС + подразумевался единственный поток
32. Потоки режима ядра и пользователя На уровне ядра Есть функция ядра для создания нового потока Выделяет
33. Потоки режима пользователя Библиотека pthreads Каждый поток представляется регистром PC, остальными регистрами ЦП, стэком и небольшим
34. Сравнение производительности По данным Gribble, Lazowska, Levy, Zahorjan из Университета им. Вашингтона: Создание потока режима ядра
36. Скачать презентацию

Слайд 2

Процесс
Определения:
Это программа в состоянии выполнения
Объект, выполняемый на процессоре
Процессы – фундаментальное понятие

в ОС
Как исполняемый объект, процесс позволяет параллельное выполнение нескольких программ в системе (ЦП переключается между процессами)
Всё ПО, работающее на компьютере, включая саму ОС, организовано в виде множества процессов

Слайд 3

Процесс 2
Процесс состоит из трех основных компонент
Исполняемого программного кода
Ассоциированных с ним

данных, необходимых для выполнения этой программы
Контекста (информация, необходимая ОС для управления процессом)
№ процесса
Регистры ЦП
Содержимое стэка
Контекст – основа для переключения процессов
ОС ведёт список всех процессов, находящихся в системе

Слайд 4

Образ процесса
Это выделенное место в памяти
Каждый процесс выполняется в собственном виртуальном

адресном пространстве, которое состоит из:
Сегмента стэка: используется для вызовов функций и системных вызовов
Сегмента данных: переменные, статические и динамические выделяемые из кучи
Сегмент кода: код программы, обычно доступ в режиме только для чтения
Запуск одной и той же программы несколько раз – порождает новые процессы, у каждого из которых своё виртуальное адресное пространство и окружение

стэк

код программы

данные

куча

макс.

Сегмент кода

Сегмент данных

Сегмент стэка

Слайд 5

Структуры управления процессом
Таблица процессов. Одна запись на каждый процесс
Блок управления процессом:

Process Control Block (PCB)
Описывает свой процесс и его текущее состояние
Образ процесса (Process Image)
Память, выделенная для процесса

Слайд 6

Process Control Block
Содержит всю информацию, необходимую для приостановки и последующего возобновления

процесса
Идентификатор процеса
№ процесса, информация о пользователе, …
Состояние процессора
Регистры, указатели стэка, и т.д.
Состояние процесса
Информация для планировщика: приоритет, …
Привилегии: доступ к памяти, допустимые инструкции
Информация о виртуальной памяти, присвоенной процессу
Статистика и ограничения (ограничения по времени выполнения, статистика о затраченном процессорном времени)
Ввод/вывод: владение ресурсами, открытые файлы, выделенные устройства

Слайд 7

Диспетчеризация
«Диспетчер» отправляет процессы на выполнение: выделяет время ЦП, переключает ЦП с

одного процесса на другой
В любой момент времени, процесс может находится в каком-либо состоянии
Ожидания ввода/вывода
Выполнения
Готовности к выполнению
Выгруженном
…

Слайд 8

Модель состояний процесса 1
Можно выделить три основных состояния
Выполнения (исполняется на ЦП)
Готовности

(временно остановлен)
Блокировки (ожидает внешнего события)

Выполнение

Блокировка

Готовность

Диспетчеризация

Таймаут

Ожидание события

Событие произошло

Процесс заблокирован для В/В
Диспетчер планирует другой процесс
Диспетчер планирует этот процесс
В/В произошёл, процесс возобновляет выполнение

Слайд 9

Модель состояний процесса 2
Модель из пяти состояний
Новый: процесс создан, но ещё

не помещён операционной системой в пул выполняемых процессов. Создан PCB, но процесс ещё не в памяти
Готовность: процесс полностью готов для выполнения
Выполнение: процесс исполняется
Блокировка: процесс ожидает внешнего события (В/В, и т.п.)
Завершен: процесс удаляется из пула выполняемых процессов (он закончил работу)

Готов

Новый

Заблокирован

Выполняется

Завершен

Диспетчеризация

Таймаут

Ожидание события

Событие произошло

Принят

Завершение

Слайд 10

Планирование процессов
В ОС есть различные очереди (или списки) для планирования процессов
Очередь

задач: множество всех процессов в системе
Очередь готовых: множество всех процессов, готовых для выполнения
Очередь ожидающих: множество всех заблокированных процессов
Процессы перемещаются между этими очередями

Слайд 11

Управление процессами
Используется одна очередь «готовых» и одна очередь «заблокированных»
Недостатки:
При наступлении события,

все ожидающие этого события процессы нужно переместить из «заблокированных» в очередь «готовых»
ОС нужно просмотреть все заблокированные процессы в очереди, чтобы выбрать правильный
Решение: Использовать несколько очередей «заблокированных» процессов

Очередь «готовых»

Поступление

Диспетчинг

ЦП

Освобождение

Таймаут

Очередь «заблокированных»

Ожидание события

Произошло событие

Слайд 12

Создание процесса
Загрузка системы
При инициализации системы создаются несколько процессов
В Unix, это процессы

«демоны» sched (pid 0), init (pid 1), и другие более высокоуровневые (веб-сервер, емейл-сервер и т.п.). Ядро – не процесс!
В NT, ядро - это системный процесс System (pid 4), далее загружаются система управления подсистемами smss.exe и т.д.
Текущий процесс порождает дочерний процесс
Напр. веб-сервер может порождать дочерний процесс для каждого нового запроса. Ужас! :)
В UNIX процесс init ожидает авторизации пользователя для того, чтобы запустить оболочку (новый процесс)
Пользователь создаёт новый процесс
Пользователь вызывает команду из текстовой оболочки, или запускает новую программу через графическую оболочку. Это создаёт новый процесс, родитель которого – оболочка.

Слайд 13

Создание процесса 2
Присвоить уникальный идентификатор новому процессу
Выделить место для процесса
Программа, данные,

стэк
Инициализировать PCB
Добавить процесс в очередь «готовых» к выполнению

Слайд 14

Иерархия процессов (UNIX)
Строгая иерархия между процессами: дочерний и родительский процессы всегда

взаимосвязаны
Группы процессов
Напр. интерпретатор командной строки (shell) является родительским для всех процессов, которые пользователь запускает из командной строки
Если пользователь посылает сигнал (напр. SIGKILL) группе процессов, то сигнал доставляется каждому процессу из группы

Слайд 15

Иерархия процессов (Windows)
Её нет. Все равны.
Хэндл процесса: когда новый процесс создаётся

родительским, то родитель получает хэндл дочернего процесса. Т.о. может им управлять.
Этот хэндл можно передавать другим процессом (в отличие от Unix, где родительский процесс не может менять множество дочерних процессов)

Слайд 16

Создание процесса (UNIX)
Процессы создаются через fork() / exec()
fork() создаёт точный клон

вызывающего процесса, т.н. «дочерний» процесс
exec() заменяет образ процесса этого клона новой программой, которая должна быть выполнена
Поэтому всегда есть иерархия
После создания у родительского и дочернего процессов собственные, разные адресные пространства. Некоторые ресурсы могут быть общими (напр. открытые файлы)
Поэтому системный вызов fork() «возвращается дважды»
Один раз в родительский процесс, и один раз во вновь созданный

Слайд 17

Создание процесса (UNIX) 2
Адресное пространство родителя
(код, статические данные, куча, стэк)
Родительский PCB
Адресное

пространство дочернего процесса
(код, статические данные, куча, стэк)

Дочерний PCB

идентичная копия (единственное исключение – аргумент PID на вершине стэка)

Похожие, но не копия

Слайд 18

Создание процесса (UNIX) 3
Как же создать новую программу, а не ещё

одну копию старой?
«Легко». Вначале fork(), потом exec().
exec() не создаёт нового процесса, а заменяет данные текущего процеса новыми данными
У такой модели есть недостатки:
fork() очень медленный (нужно создать полную копию всего)
Решения в виде vfork(), copy-on-write, и т.п.

Слайд 19

Что в Linux?
clone() заменяет fork() (и vfork() тоже). У clone() есть

дополнительные опции.
Но всё-равно нужно чётко понимать, как работает fork()
В Linux exec() не является системным вызовом.
execve() – единственный системный вызов, аналогичный по функционалу exec()
Всё-равно нужно чётко понимать, как работает exec()

Слайд 20

Создание процесса (NT)
Процессы создаются через системный вызов NtCreateProcess().

Слайд 21

Переключение между процессами
При необходимости переключиться на другой процесс, ОС выполняет «переключение

контекста»
Состояние старого процесса сохраняется в его PCB
Состояние нового процесса восстанавливается из его PCB
Время затраченное на переключение контекста – накладные расходы ОС
Зависит от аппаратной реализации

Слайд 22

Переключение контекста
События, вызывающие переключение контекста:
Прерывания
Исключения
Системные вызовы

Слайд 23

Потоки (нити)
Процесс состоит как минимум из:
Адресного пространства
Набор инструкций (код) программы
Данные для

программы
Состояния потока выполнения
Счётчик команд (регистр IP)
Указатель стэка SP
Другие регистры
Множества ресурсов ОС
Открытые файлы, сетевые соединения, …
И всё это в одном понятии процесса. Не есть хорошо.
Разделим соответственно на 3 области

Слайд 24

Потоки, зачем они нужны
Потоки – для параллелизма и одновременности.
Параллелизм – это

физически одновременное выполнение для достижения наибольшей производительности.
Одновременность – логическое и/или физическое одновременное выполнение. Далее «параллелизм».
Один из вариантов достижения параллелизма – использование множества процессов
Программы в разных процессах изолированы друг от друга
Потоки – другой способ достичь параллелизма
Потоки работают внутри одного процесса, все потоки процесса имеют одно адресное пространство, и те же ресурсы ОС
У потоков есть свой стэк и своё состояние ЦП

Слайд 25

Параллелизм
Возьмём пример про веб-сервер со слайда 12, который должен обслуживать несколько

запросов параллельно
Ожидая данных по запросу клиента из базы данных, сервер мог бы загрузить данные с диска для другого клиента, и обработать запрос третьего клиента
Или, веб-браузер
В момент обращения к веб-страничке, он мог бы параллельно загружать данные из различных источников
Некая вычислительная программа, использующая физический параллелизм
Нужно обработать большой массив данных

Слайд 26

Параллелизм 2
В каждом из этих примеров параллелизма есть общее:
Один код
Доступ к

одним данным
Один уровень доступа
Одно множество ресурсов
Но есть разное:
Стэк и указатель на стэк SP
Счётчик инструкций (регистр IP), указывающий на следующую инструкцию
Множество регистров ЦП

Слайд 27

Параллелизм 3
Как этого достичь?
Используя знания о процессах, можно
fork-нуть несколько процессов
Заставить каждый

из них отображать своё виртуальное адресное пространство на одну и ту же физическую память
Неэффективно!
Затраты на PCB, таблицы страниц, создание операционной системой структур данных, копирование адресного пространства, и т.д.

Слайд 28

Решение – потоки!
Основная мысль
отделить понятие процесса (адресного пространства, ресурсов ОС) от
Минимальной

нити, потока управления (т.е. состояния выполнения – стэка, регистров ЦП)
Иногда такое состояние выполнения называют «лёгким процессом» или потоком

Слайд 29

Потоки и процессы
Большинство современных ОС поддерживает два объекта:
Процесс, который определяет адресное

пространство и общие атрибуты процесса
Поток, который определяет последовательный поток выполнения в рамках процесса
Поток привязывается к одному процессу (адресному пространству)
Но может быть много потоков в одном адресном пространстве
Лёгкий доступ к общим данным
Создание потоков занимает очень мало времени
Потоки стали единицей планирования
Процессы – всего-лишь контейнер, в котором выполняются потоки

Слайд 30

Потоки и процессы 2
Многопоточность полезна для:
Обработки одновременных событий
Построения параллельных программ
Поддержка многопоточности

– разделение понятия процесса от минимального потока управления
Для параллельного выполнения не нужно создавать новые процессы
Быстрее, меньше требования к памяти

Слайд 31

Потоки и процессы 3
Раньше: «процесс» = адресное пространство + ресурсы ОС

+ подразумевался единственный поток
Теперь: «процесс» = адресное пространство + ресурсы ОС + все потоки процесса

Слайд 32

Потоки режима ядра и пользователя
На уровне ядра
Есть функция ядра для создания

нового потока
Выделяет стэк выполнения внутри адресного пространства процесса
Создаёт и инициализирует Thread Control Block (указатель стэка и другие регистры ЦП)
Каждый поток идентифицируется своим номером (TID, по аналогии с PID)
На уровне пользователя
Есть возможность управлять потоками из библиотеки режима пользователя

Слайд 33

Потоки режима пользователя
Библиотека pthreads
Каждый поток представляется регистром PC, остальными регистрами ЦП,

стэком и небольшим блоком TCB
Создание потока, переключение между потоками и синхронизация потоков выполняется вообще без участия ядра!
Потоки уровня пользователя могут быть в 10-100 раз быстрее, чем потоки режима ядра

Слайд 34

Сравнение производительности
По данным Gribble, Lazowska, Levy, Zahorjan из Университета им. Вашингтона:
Создание

потока режима ядра pthread_create()/pthread_join() в 2.5 раза быстрее создания нового процесса fork/exit.
Создание потока режима пользователя в 20 раз быстрее создания потока режима ядра
В тестах использовалось ядро Linux

Архитектура операционных систем. Процессы и потоки

Содержание

ПроцессОпределения:Это программа в состоянии выполненияОбъект, выполняемый на процессореПроцессы – фундаментальное понятие

Процесс 2Процесс состоит из трех основных компонентИсполняемого программного кодаАссоциированных с ним

Образ процессаЭто выделенное место в памятиКаждый процесс выполняется в собственном виртуальном

Структуры управления процессомТаблица процессов. Одна запись на каждый процессБлок управления процессом:

Process Control BlockСодержит всю информацию, необходимую для приостановки и последующего возобновления

Диспетчеризация«Диспетчер» отправляет процессы на выполнение: выделяет время ЦП, переключает ЦП с

Модель состояний процесса 1Можно выделить три основных состоянияВыполнения (исполняется на ЦП)Готовности

Модель состояний процесса 2Модель из пяти состоянийНовый: процесс создан, но ещё

Планирование процессовВ ОС есть различные очереди (или списки) для планирования процессовОчередь

Управление процессамиИспользуется одна очередь «готовых» и одна очередь «заблокированных»Недостатки:При наступлении события,

Создание процессаЗагрузка системыПри инициализации системы создаются несколько процессовВ Unix, это процессы

Создание процесса 2Присвоить уникальный идентификатор новому процессуВыделить место для процессаПрограмма, данные,

Иерархия процессов (UNIX)Строгая иерархия между процессами: дочерний и родительский процессы всегда

Иерархия процессов (Windows)Её нет. Все равны.Хэндл процесса: когда новый процесс создаётся

Создание процесса (UNIX)Процессы создаются через fork() / exec()fork() создаёт точный клон

Создание процесса (UNIX) 2Адресное пространство родителя(код, статические данные, куча, стэк)Родительский PCBАдресное

Создание процесса (UNIX) 3Как же создать новую программу, а не ещё

Что в Linux?clone() заменяет fork() (и vfork() тоже). У clone() есть

Создание процесса (NT)Процессы создаются через системный вызов NtCreateProcess().

Переключение между процессамиПри необходимости переключиться на другой процесс, ОС выполняет «переключение

Переключение контекстаСобытия, вызывающие переключение контекста:ПрерыванияИсключенияСистемные вызовы

Потоки (нити)Процесс состоит как минимум из:Адресного пространстваНабор инструкций (код) программыДанные для

Потоки, зачем они нужныПотоки – для параллелизма и одновременности.Параллелизм – это

ПараллелизмВозьмём пример про веб-сервер со слайда 12, который должен обслуживать несколько

Параллелизм 2В каждом из этих примеров параллелизма есть общее:Один кодДоступ к

Параллелизм 3Как этого достичь?Используя знания о процессах, можноfork-нуть несколько процессовЗаставить каждый

Решение – потоки!Основная мысльотделить понятие процесса (адресного пространства, ресурсов ОС) отМинимальной

Потоки и процессыБольшинство современных ОС поддерживает два объекта:Процесс, который определяет адресное

Потоки и процессы 2Многопоточность полезна для:Обработки одновременных событийПостроения параллельных программПоддержка многопоточности

Потоки и процессы 3Раньше: «процесс» = адресное пространство + ресурсы ОС

Потоки режима ядра и пользователяНа уровне ядраЕсть функция ядра для создания

Потоки режима пользователяБиблиотека pthreadsКаждый поток представляется регистром PC, остальными регистрами ЦП,

Сравнение производительностиПо данным Gribble, Lazowska, Levy, Zahorjan из Университета им. Вашингтона:Создание

Похожие презентации

Процесс
Определения:
Это программа в состоянии выполнения
Объект, выполняемый на процессоре
Процессы – фундаментальное понятие

Процесс 2
Процесс состоит из трех основных компонент
Исполняемого программного кода
Ассоциированных с ним

Образ процесса
Это выделенное место в памяти
Каждый процесс выполняется в собственном виртуальном

Структуры управления процессом
Таблица процессов. Одна запись на каждый процесс
Блок управления процессом:

Process Control Block
Содержит всю информацию, необходимую для приостановки и последующего возобновления

Диспетчеризация
«Диспетчер» отправляет процессы на выполнение: выделяет время ЦП, переключает ЦП с

Модель состояний процесса 1
Можно выделить три основных состояния
Выполнения (исполняется на ЦП)
Готовности

Модель состояний процесса 2
Модель из пяти состояний
Новый: процесс создан, но ещё

Планирование процессов
В ОС есть различные очереди (или списки) для планирования процессов
Очередь

Управление процессами
Используется одна очередь «готовых» и одна очередь «заблокированных»
Недостатки:
При наступлении события,

Создание процесса
Загрузка системы
При инициализации системы создаются несколько процессов
В Unix, это процессы

Создание процесса 2
Присвоить уникальный идентификатор новому процессу
Выделить место для процесса
Программа, данные,

Иерархия процессов (UNIX)
Строгая иерархия между процессами: дочерний и родительский процессы всегда

Иерархия процессов (Windows)
Её нет. Все равны.
Хэндл процесса: когда новый процесс создаётся

Создание процесса (UNIX)
Процессы создаются через fork() / exec()
fork() создаёт точный клон

Создание процесса (UNIX) 2
Адресное пространство родителя
(код, статические данные, куча, стэк)
Родительский PCB
Адресное

Создание процесса (UNIX) 3
Как же создать новую программу, а не ещё

Что в Linux?
clone() заменяет fork() (и vfork() тоже). У clone() есть

Создание процесса (NT)
Процессы создаются через системный вызов NtCreateProcess().

Переключение между процессами
При необходимости переключиться на другой процесс, ОС выполняет «переключение

Переключение контекста
События, вызывающие переключение контекста:
Прерывания
Исключения
Системные вызовы

Потоки (нити)
Процесс состоит как минимум из:
Адресного пространства
Набор инструкций (код) программы
Данные для

Потоки, зачем они нужны
Потоки – для параллелизма и одновременности.
Параллелизм – это

Параллелизм
Возьмём пример про веб-сервер со слайда 12, который должен обслуживать несколько

Параллелизм 2
В каждом из этих примеров параллелизма есть общее:
Один код
Доступ к

Параллелизм 3
Как этого достичь?
Используя знания о процессах, можно
fork-нуть несколько процессов
Заставить каждый

Решение – потоки!
Основная мысль
отделить понятие процесса (адресного пространства, ресурсов ОС) от
Минимальной

Потоки и процессы
Большинство современных ОС поддерживает два объекта:
Процесс, который определяет адресное

Потоки и процессы 2
Многопоточность полезна для:
Обработки одновременных событий
Построения параллельных программ
Поддержка многопоточности

Потоки и процессы 3
Раньше: «процесс» = адресное пространство + ресурсы ОС

Потоки режима ядра и пользователя
На уровне ядра
Есть функция ядра для создания

Потоки режима пользователя
Библиотека pthreads
Каждый поток представляется регистром PC, остальными регистрами ЦП,

Сравнение производительности
По данным Gribble, Lazowska, Levy, Zahorjan из Университета им. Вашингтона:
Создание