Эта книга посвящена алгоритмам обработки текста, которые иногда называют алгоритмической стрингологией (stringology). Текст (слово, строка, последовательность строк) – один из основных типов неструктурированных данных, играющий важную роль в информатике.
Предмет нашего рассмотрения многогранный, потому что лежит в основе многих дисциплин, особенно информатики и инженерных наук. Исследование неструктурированных данных – активно развивающаяся область, требующая эффективных методов как вследствие присутствия в разных местах операционных систем, так и для анализа огромного объема данных, порождаемых цифровыми сетями и оборудованием. Последнее относится прежде всего к компаниям в сфере ИТ, которые управляют гигантскими массивами данных в ЦОДах, но также ко многим научным направлениям за пределами информатики.
В этой книге представлен репрезентативный набор самых интересных задач в области обработки текстов. Лаконичное и увлекательное изложение открывает путь к более сложным темам. Материалы были взяты из сотен серьезных научных публикаций – каким-то из них уже сотни лет, а какие-то были написаны совсем недавно. По большей части задачи связаны с конкретными приложениями, но есть и более абстрактные. В основе большинства задач лежит остроумный короткий алгоритм, исключение составляют разве что несколько вводных комбинаторных проблем.
Эта книга – не просто очередная монография, а серия задач (головоломок и упражнений). Ее можно рассматривать как дополнение к книгам на эту тему, в которых предмет излагается более полно, в академическом стиле. Тем не менее большинство относящихся к предмету идей включено, так что книга заполняет доселе существовавший пробел и представляет долгожданный подарок для студентов и преподавателей, поскольку является первым задачником с решениями на тему алгоритмов обработки текста.
Разместите ссылку на эту страницу в социальных сетях. Так о ней узнают тысячи человек:
Facebook
Twitter
Мой мир
Вконтакте
Одноклассники
Нашли ошибку? Сообщите администрации сайта: Выберите один из разделов меню и, если необходимо, напишите комментарий
За ложную информацию бан на месяц
Разместите, пожалуйста, ссылку на эту страницу на своём веб-сайте:
Код для вставки на сайт или в блог: Код для вставки в форум (BBCode): Прямая ссылка на эту публикацию:
Решение математических задач средствами Excel — Учебное пособие для студентов, изучающих математику, преподавателей, а также специалистов, по долгу службы имеющих дело с математической обработкой данных.
В книге рассмотрены структуры и основы методов машинной обработки данных. Изложены базовые аспекты асимптотического анализа вычислительной сложности итеративных и рекурсивных алгоритмов. Приведены классические алгоритмы сортировки и поиска информации. Значительная часть материала посвящена подходам к реализации абстрактных типов данных: списков, мн ...
Книга посвящена эффективному использованию инструментов приложения Excel для обработки и анализа многомерных данных, с целью их систематизации, выявления характера и структуры взаимосвязей.
Apache Airflow и конвейеры обработки данных — Конвейеры обработки данных управляют потоком данных с момента их первоначального сбора до консолидации, очистки, анализа, визуализации и многого другого. Apache Airflow предоставляет единую платформу, которую можно использовать для проектирования, реализации, мониторинга и обслуживания конвейеров ...
Данный материал НЕ НАРУШАЕТ авторские права никаких физических или юридических лиц. Если это не так - свяжитесь с администрацией сайта. Материал будет немедленно удален. Электронная версия этой публикации предоставляется только в ознакомительных целях. Для дальнейшего её использования Вам необходимо будет приобрести бумажный (электронный, аудио) вариант у правообладателей.