!_Расширенный поиск_!    <НА ГЛАВНУЮ>

Скачать "Мигель Моралес - Грокаем глубокое обучение с подкреплением" бесплатно

Панель управления
Логин 
Пароль 
 


Основные категории

-- Книги
-- Аудиокниги
-- Журналы
-- Фильмы


Информация
Все вопросы и пожелания пишите на [email protected]
Правообладателям
Расширенный поиск
по сайту
Грокаем глубокое обучение с подкреплением : Информатика, Программирование
автор: brij | 15 сентября 2023 | Просмотров: 45
 
Грокаем глубокое обучение с подкреплением     Название:   
    Автор:   
    Формат:   Смешанный
    Размер:   22.9 MB
    Год:   
    Качество:   Отличное
    Язык:   Русский
    Страниц:   464

 
 

Мы учимся, взаимодействуя с окружающей средой, и получаемые вознаграждения и наказания определяют наше поведение в будущем. Глубокое обучение с подкреплением (reinforcement learning, RL) привносит этот естественный процесс в искусственный интеллект и предполагает анализ результатов для выявления наиболее эффективных путей движения вперед. Агенты глубокого обучения с подкреплением могут способствовать успеху маркетинговых кампаний, прогнозировать рост акций и побеждать гроссмейстеров в Го и шахматах. Давайте научимся создавать системы глубокого обучения на примере увлекательных упражнений, сопровождаемых кодом на Python с подробными комментариями и понятными объяснениями. Вы увидите, как работают алгоритмы, и научитесь создавать собственных агентов глубокого обучения с подкреплением, используя оценочную обратную связь.

В этой книге вы узнаете об обучении с подкреплением. Его сложно понять и объяснить по ряду причин. Во-первых, это довольно специфический подход — здесь много математики. Усвоить основные знания по этой теме и не увязнуть в них — уже непростая задача. Во-вторых, обучение с подкреплением изначально предполагает некоторое логическое несоответствие, так как это одновременно и способ осмысления задач принятия решений, и набор инструментов для решения этих задач. Под способом осмысления я имею в виду то, что RL служит основой для принятия решений: помимо прочего, в нем обсуждаются сигналы состояния и подкрепления. Говоря о наборе инструментов, я подразумеваю, что при обсуждении RL мы зачастую пользуемся такими терминами, как марковские процессы принятия решений и алгоритм Беллмана. На удивление легко спутать способ осмысления с математическими инструментами, которые мы используем.

Наконец, RL можно по-разному реализовать. Поскольку это способ осмысления, мы можем говорить о нем как о чем-то абстрактном, но его также можно воплотить в коде или, если уж на то пошло, в виде нейронов. Для изучения RL и глубоких нейронных сетей нужны разные фундаментальные знания — это два интересных направления исследований, которые развивались независимо друг от друга. Объяснить и то и другое в контексте средств разработки — непростая задача.

Не стоит забывать, что для понимания обучения с подкреплением нужно не только овладеть инструментами и их реализацией в глубоких нейросетях, но и перенять определенный способ осмысления RL. Иначе вы не сможете делать обобщения за рамками тех примеров, которые изучаете. Повторюсь, преподавать RL сложно, а в обучении глубокому RL очень много нюансов, которые могут свести весь процесс на нет. Чтобы всего этого избежать, мы обращаемся к книге Мигеля Моралеса.









Сосчитайте:   17 + один – 3 =      и нажмите   






Разместите ссылку на эту страницу в социальных сетях. Так о ней узнают тысячи человек:





Нашли ошибку? Сообщите администрации сайта:
Выберите один из разделов меню и, если необходимо, напишите комментарий
   17 + один – 2 =    
За ложную информацию бан на месяц


Разместите, пожалуйста, ссылку на эту страницу на своём веб-сайте:

Код для вставки на сайт или в блог:      
Код для вставки в форум (BBCode):      
Прямая ссылка на эту публикацию:      


Помощь по работе с нашей библиотекой :

Программа для открытия файлов формата .PDF
Программа для открытия файлов формата .DJVU
Программа для открытия файлов формата .FB2

 
 
  • 0
 (голосов: 0)
Распечатать
 
 


Другие книги (журналы) по этой теме:
 
Обучение с подкреплением для реальных задач. Инженерный подход | Уиндер Фил | Программирование | Скачать бесплатно Уиндер Фил - Обучение с подкреплением для реальных задач. Инженерный подход

Обучение с подкреплением для реальных задач. Инженерный подход — Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL).
 
 
Глубокое обучение с подкреплением: теория и практика на языке Python | Лаура Грессер, Ван Лун Кенг | Информатика | Скачать бесплатно Лаура Грессер, Ван Лун Кенг - Глубокое обучение с подкреплением: теория и практика на языке Python

В этой книге дано введение в глубокое обучение с подкреплением (Reinforcement Learning, RL) и сведены в целостную систему результаты работ за последние шесть лет. Обучение с подкреп­лением — это область машинного обучения, занимающаяся задачами последова­тельного принятия решений, то есть теми, решение которых занимает определенное время. Оно приме ...
 
 
Мультиагентное обучение с подкреплением | Алфимцев А.Н. | Информатика | Скачать бесплатно Алфимцев А.Н. - Мультиагентное обучение с подкреплением

Рассмотрены современные и классические алгоритмы одновременного машинного обучения множества агентов, основанные на теории игр, табличных, нейросетевых, эволюционных и роевых технологиях. Представлено последовательное развитие теоретической модели алгоритмов, базирующееся на марковских процессах принятия решений. Реализация алгоритмов выполнена на ...
 
 
Обучение с подкреплением на PyTorch. Сборник рецептов | Юси (Хэйден) Лю | Программирование | Скачать бесплатно Юси (Хэйден) Лю - Обучение с подкреплением на PyTorch. Сборник рецептов

Библиотека PyTorch выходит на передовые позиции в качестве средства обучения с подкреплением (ОП) благодаря эффективности и простоте ее использования.
 
 



Данный материал НЕ НАРУШАЕТ авторские права никаких физических или юридических лиц.
Если это не так - свяжитесь с администрацией сайта.
Материал будет немедленно удален.
Электронная версия этой публикации предоставляется только в ознакомительных целях.
Для дальнейшего её использования Вам необходимо будет
приобрести бумажный (электронный, аудио) вариант у правообладателей.

Администрация сайта

Наверх