Развитие архитектуры вычислительных систем – это история постоянного поиска баланса свойств, оптимального для множества целевых приложений. Пока не был исчерпан ресурс основных факторов роста, массовое производство и экономическая выгода сдерживали сколько-нибудь значительную специализацию основных вычислительных архитектур. Однако каждое новое инженерное решение в своем развитии со временем обнаруживало соответствующий противовес: частота и тепловыделение, многоядерность и когерентность кэшей, общая память и неоднородный доступ, конвейерность и ветвления и т.д. В условиях недостатка новых идей фактором роста в настоящее время становятся специализированные вычислители. Наибольший успех графических ускорителей (GPU) в этом качестве связан с их устойчивым положением в основной сфере применения. Устройство архитектуры GPU можно кратко охарактеризовать как «макроархитектуру вычислительного кластера, реализованную в микромасштабе». GPU состоит из однородных вычислительных элементов с общей памятью. Каждый вычислительный элемент способен исполнять тысячи потоков, переключение между которыми не имеет накладных расходов. Потоки могут быть сгруппированы в блоки, имеющие общий кэш и быструю разделяемую память, явно контролируемую пользователем. Данная реализация в сочетании с расширениями для процедурных языков программирования носит название Compute Unified Device Architecture(CUDA). Цель этой книги – дать достаточно полное практическое руководство по эффективному использованию CUDA 4.x на вычислительных системах различной сложности и в контексте других технологий. Книга предназначена для разработчиков и исследователей, применяющих параллельные вычисления.
Разместите ссылку на эту страницу в социальных сетях. Так о ней узнают тысячи человек:
Facebook
Twitter
Мой мир
Вконтакте
Одноклассники
Нашли ошибку? Сообщите администрации сайта: Выберите один из разделов меню и, если необходимо, напишите комментарий
За ложную информацию бан на месяц
Разместите, пожалуйста, ссылку на эту страницу на своём веб-сайте:
Код для вставки на сайт или в блог: Код для вставки в форум (BBCode): Прямая ссылка на эту публикацию:
Учебник дает общие сведения о многопроцессорных вычислительных системах, включая их назначение, область применения, оценку производительности, описание компонент и основных архитектур. Приводятся примеры систем различных производителей.Большое внимание уделено рассмотрению кластерных вычислительных систем, а также вычислительным системам веду ...
Излагаются основные структурные решения, воплощенные в параллельных вычислительных системах и способствующие их высокой производительности. Изучаются основные популярные архитектуры. Исследуются принципы оптимизации выполнения параллельных программ.
Учебное пособие подготовлено на основе лекций по курсам «Теоретические основы параллельного программирования» и «Параллельные вычисления», читаемых в Саратовском государственном университете бакалаврам направлений «Математическое обеспечение и администрирование информационных систем» и «Фундаментальная информатика и информационные технологии».
Рост сложных задач, решение которых связано с применением современных ИТ-технологий, ведет к необходимости использования параллельных вычислений. Параллельные вычисления носят междисциплинарный характер. Они затрагивают, в частности, такие области, как численные методы, структуры и алгоритмы обработки данных, аппаратное и программное обеспечение, с ...
Данный материал НЕ НАРУШАЕТ авторские права никаких физических или юридических лиц. Если это не так - свяжитесь с администрацией сайта. Материал будет немедленно удален. Электронная версия этой публикации предоставляется только в ознакомительных целях. Для дальнейшего её использования Вам необходимо будет приобрести бумажный (электронный, аудио) вариант у правообладателей.