Категории

Блог
Справочная литература
- Справочники
- Энциклопедии
- Прочая справочная литература
- Руководства
- Словари
Научные и научно-популярные книги
- Шпаргалки
- Биофизика
- Ботаника
- Экология
- Биохимия
- О животных
- Государство и право
- Рефераты
- Математика
- Зарубежная публицистика
- Транспорт, военная техника
- Педагогика
- География
- Зоология
- География
- Ветеринария
- Зарубежная психология
- Астрология
- История
- Психология
- Деловая литература
- Политика
- Прочая научная литература
- Религиоведение
- Химия
- Радиотехника
- Архитектура
- Техническая литература
- Юриспруденция
- Науки: разное
- Любовные романы
- Психология, личное
- Медицина
- Научпоп
- Науки о космосе
- Беременность, ожидание детей
- Языкознание
- Детская психология
- Физика
- История Европы
- Культурология
- Социология
- Психотерапия
- Образовательная литература
- Биология
- Воспитание детей, педагогика
- Альтернативная медицина
- Учебники
- Литературоведение
- Филология
- Иностранные языки
- Обществознание
Проза
- Антисоветская литература
- Семейный роман/Семейная сага
- Новелла
- Юмор
- Феерия
- Сентиментальная проза
- Современная проза
- Классическая проза
- Повести
- Советская классическая проза
- Русская классическая проза
- Историческая проза
- Русская современная проза
- Контркультура
- Зарубежная современная проза
- Проза
- Зарубежная классика
- О войне
- Эпистолярная проза
- Магический реализм
- Разное
- Рассказы
- Афоризмы
- Очерки
- Эссе
Фантастика и фэнтези
- Ироническое фэнтези
- Ненаучная фантастика
- Романтическое фэнтези
- Бизнес
- Альтернативная история
- Научная Фантастика
- Социально-психологическая
- Фэнтези
- Юмористическая фантастика
- Космическая фантастика
- Разная фантастика
- Русское фэнтези
- Ужасы и Мистика
- Боевая фантастика
- Попаданцы
- Киберпанк
- LitRPG
- Городская фантастика
- Сказочная фантастика
- Мистика
- Эпическая фантастика
- Детективная фантастика
- Героическая фантастика
- Историческое фэнтези
- Разное фэнтези
- Боевое фэнтези
- Зарубежная фантастика
- Технофэнтези
- Иностранное фэнтези
- Любовное фэнтези
- Историческая фантастика
- Романтическая фантастика
- Городское фентези
- Книги магов
- Космоопера
- Ироническая фантастика
- Социально-философская фантастика
- Стимпанк
- Постапокалипсис
Любовные романы
- Порно
- Эротика
- Фемслеш
- Любовно-фантастические романы
- Современные любовные романы
- Короткие любовные романы
- Остросюжетные любовные романы
- Исторические любовные романы
- love
- Зарубежные любовные романы
- Роман
- Прочие любовные романы
Детская литература
- Школьные учебники
- Детская познавательная и развивающая литература
- Детские детективы
- Книга-игра
- Книги для подростков
- Детская проза
- Сказка
- Учебная литература
- Прочая детская литература
- Детская образовательная литература
- Детская фантастика
- Детские остросюжетные
- Детские приключения
- Детский фольклор
- Книги для дошкольников
- Детские стихи
- Зарубежные детские книги
- Внеклассное чтение
Религия и духовность
- Хиромантия
- Религия: окультизм
- Религия: протестантизм
- Религия: ислам
- Индуизм
- Религия
- Прочая религиозная литература
- Эзотерика
- Самосовершенствование
- Религия: христианство
- Язычество, паганизм
- Православие
- Буддизм
- Зарубежная религиозная литература и эзотерика
- Религии: разное
- Религия: иудаизм
Юмор
- Комедия
- Сатира
- Юмористическая проза
- Юмористическое фэнтези
- Прочий юмор
- Юмористические стихи
- Драматургия
- Анекдоты
Детективы и Триллеры
- Юридический триллер
- Зарубежные боевики
- Детектив
- Классический детектив
- Криминальный детектив
- Крутой детектив
- Полицейский детектив
- Триллер
- Боевик
- Шпионский детектив
- Иронический детектив
- Исторический детектив
- Иностранный детектив
- Политический детектив
- Маньяки
Поэзия, Драматургия
- Верлибры
- Зарубежная драматургия
- в стихах
- Палиндромы
- Водевиль
- Мистерия
- Экспериментальная поэзия
- Визуальная поэзия
- Басни
- Эпическая поэзия
- Зарубежная поэзия
- Поэзия
- Драматургия
- Драма
- Трагедия
- Лирика
- Песенная поэзия
- Сценарии
- Театр
- Киносценарии
- Кино, театр
Бизнес
- Работа с клиентами
- Кадровый менеджмент
- Ораторское искусство / риторика
- Личная эффективность
- Менеджмент
- Государственное и муниципальное управление
- Зарубежная деловая литература
- Переговоры
- Делопроизводство, офис
- Корпоративная культура, бизнес
- Управление, подбор персонала
- Менеджмент и кадры
- Маркетинг, PR, реклама
- Финансы
- Бизнес
- О бизнесе популярно
- Экономика
- Малый бизнес
- Тайм-менеджмент
- Бухучет и аудит
- Поиск работы
- Ценные бумаги и инвестиции
- Краткое содержание
- Банковское дело
- Продажи
- Личные финансы
- Интернет-бизнес
Разная литература
- Зарубежная литература о культуре и искусстве
- Отраслевые издания
- Начинающие авторы
- Подростковая литература
- Зарубежная прикладная литература
- Шахматы
- Недвижимость
- Спецслужбы
- Пословицы, поговорки
- Культура и искусство
- Современная литература
- Истории из жизни
- Прочее
- Периодические издания
- Фанфик
- Гиды, путеводители
- Военное
- Военная техника, оружие
- Современная зарубежная литература
- Литература 19 века
- Музыка, танцы
- Военная история
- Газеты и журналы
- Зарубежная образовательная литература
- Кино
- Визуальные искусства
- Музыка, музыканты
- Авто и ПДД
- Великолепные истории
- Изобразительное искусство, фотография
- Боевые искусства
- Цитаты из афоризмов
- Готические новеллы
Компьютеры и Интернет
- Компьютерное "железо"
- Программирование
- Прочая околокомпьтерная литература
- Программы
- Интернет
- Базы данных
- Программное обеспечение
Документальные книги
- Биографии и Мемуары
- Публицистика
- Прочая документальная литература
- Критика
- Искусство и Дизайн
- Военная документалистика
Домоводство, Дом и семья
- Фэн-шуй
- Домашнее хозяйство
- Охота
- Ремонт в квартире
- Интерьеры
- Рыбалка
- Спорт
- Эротика, Секс
- Кулинария
- Здоровье
- Прочее домоводство
- Сад и огород
- Хобби и ремесла
- Развлечения
- Домашние животные
- Семейная психология
- Сделай сам
- Дом, семья
- Отдых / туризм
Приключения
- Зарубежные приключения
- Вестерн
- Прочие приключения
- Путешествия и география
- Исторические приключения
- Морские приключения
- Приключения про индейцев
- Природа и животные
Старинная литература
- Зарубежная старинная литература
- Прочая старинная литература
- Европейская старинная литература
- Мифы. Легенды. Эпос
- Античная литература
- Фольклор
- Древнерусская литература
- Древневосточная литература

Меню

Самые читаемые

Мачеха Золушки - попаданка - Мария Максонова

Десерт для мажора и Лисёны - Маргарита Аланина

30 золотых за истинную - Наталья Дорофеева

Мы сгорим вместе. Сводные. - Маргарита Аланина

Россия в кривых зеркалах. Том 1 - Николай Левашов

RUSBOOK.SU » Компьютеры и Интернет » Программирование » Фундаментальные алгоритмы и структуры данных в Delphi - Джулиан Бакнелл

Фундаментальные алгоритмы и структуры данных в Delphi - Джулиан Бакнелл

19.06.2024 - 14:01 5 0

Категория: Компьютеры и Интернет / Программирование
Название: Фундаментальные алгоритмы и структуры данных в Delphi
Автор: Джулиан Бакнелл

Описание Фундаментальные алгоритмы и структуры данных в Delphi - Джулиан Бакнелл

Книга Фундаментальные алгоритмы и структуры данных в Delphi представляет собой уникальное учебное и справочное пособие по наиболее распространенным алгоритмам манипулирования данными, которые зарекомендовали себя как надежные и проверенные многими поколениями программистов. По данным журнала Delphi Informant за 2002 год, эта книга была признана сообществом разработчиков прикладных приложений на Delphi как «самая лучшая книга по практическому применению всех версий Delphi».В книге подробно рассматриваются базовые понятия алгоритмов и основополагающие структуры данных, алгоритмы сортировки, поиска, хеширования, синтаксического разбора, сжатия данных, а также многие другие темы, тесно связанные с прикладным программированием. Изобилие тщательно проверенных примеров кода существенно ускоряет не только освоение фундаментальных алгоритмов, но также и способствует более квалифицированному подходу к повседневному программированию.Несмотря на то что книга рассчитана в первую очередь на профессиональных разработчиков приложений на Delphi, она окажет несомненную пользу и начинающим программистам, демонстрируя им приемы и трюки, которые столь популярны у истинных «профи». Все коды примеров, упомянутые в книге, доступны для выгрузки на Web-сайте издательства.

Читать онлайн Фундаментальные алгоритмы и структуры данных в Delphi - Джулиан Бакнелл

Шрифт:

Интервал:

Закладка:

Сделать

1 ... 59 60 61 62 63 64 65 66 67 ... 119

Перейти на страницу:

Так зачем же вообще рассматривать группирование? Что ж, вероятно, это лучшая структура данных для хеш-таблиц, хранящихся на диске.

Хеш-таблицы на диске

Контроллеры для таких устройств постоянного хранения данных, как жесткие и гибкие диски, дисководы Iomega Zip и ленточные накопители разработаны для поблочного считывания и записи данных. Обычно размер этих блоков равен какой-то степени двойки, например, 512, 1024 или 4096 байт. Поскольку контроллер должен выполнить считывание всего блока даже в том случае, когда требуется всего несколько байт, имеет смысл попытаться извлечь выгоду из подобного поведения.

Предположим, что требуется создать приложение, в котором используется большое количество записей, хранящихся на диске. Записи должны быть доступны в произвольном порядке по ключу. При этом каждая запись имеет отдельный уникальный строковый ключ. Это - идеальное применение для хеш-таблицы, однако записи столь многочисленны и велики, что невозможно выполнить их одновременное считывание в память. Действительно, делать это не имеет смысла, поскольку можно предположить, что большинство из них не будет требоваться в ходе любого отдельного сеанса работы программы.

Примером такого применения служит система пункта продажи в большом продуктовом супермаркете. В магазине могут продаваться сотни тысяч различных наименований товаров, из которых средний покупатель приобретает, скажем, не больше сотни (а то и десятка). Это идеальное применение для хеш-таблицы: каждый товар в магазине известен по его всемирному шифру продукта (UPC -Universal Product Code), т.е. 12-значному строковому значению, которое представляет собой уникальный ключ каждого товара. С учетом этого, приложение в кассовом пункте использует сканированный универсальный код товара с целью его хеширования в хеш-таблицу, а затем в запись, соответствующую товару.

Однако обратите внимание, что хранящаяся на диске хеш-таблица подходит только для обработки типа извлечения данных: получив ключ, она возвращает запись. Подобно своему аналогу, хранящемуся в памяти, хеш-таблица на диске не подходит для последовательного извлечения записей.

Прежде всего, создадим файл данных, состоящий из множества записей одинакового размера, каждая из которых описывает отдельный элемент. Естественно, для этого мы будем использовать класс TtdRecordFile, описанный в главе 2.

Файл индексов - это, по сути дела, второй файл базы данных хеш-информации. Как и в предыдущем случае, нам не нужно считывать в память весь файл индексов. Например, если бы каждый ключ содержал 10 цифр, а связанный с каждым ключом номер записи имел бы длину, равную 4 байтам, для хранения одного ключа требовалось бы 15 байт (исходя из предположения, что ключ содержит либо ноль в качестве символа-ограничителя, либо байт-префикс, определяющий его длину). Если бы хеш-таблица содержала 100 000 элементов, то для хранения ее индексов в памяти потребовалось бы минимум 1 500 000 байт. Разумеется, мы еще и выделяем дополнительную память под хранение строк ключей хеш-таблицы в куче, что приведет к еще большим накладным расходам (например, в 32-разрядной системе каждая строка кучи содержит три дополнительных символа типа longint). Значительно целесообразнее было бы считывать фрагменты индекса, когда в них возникает необходимость.

Применим метод группирования. В индексе хеш-таблицы мы используем группы фиксированного размера, чтобы при наличии ключа его можно было хешировать с целью получения требуемого номера группы, выполнить его считывание из файла индекса, а затем выполнить поиск требуемого ключа в группе. Эта методика выглядит достаточно простой, но, естественно, при этом необходимо предусмотреть действия на случай переполнения группы.

Расширяемое хеширование

Алгоритм, который нам нужно использовать, называется расширяемым хешированием (extendible hashing), и чтобы им можно было воспользоваться, необходимо вернуться к функции хеширования.

При использовании исходного метода мы знали размер хеш-таблицы, и поэтому, выполнив хеширование ключа, нужно было немедленно разделить его по модулю на размер таблицы и использовать результат как индекс в хеш-таблице. С другой стороны, в случае применения расширяемого хеширования размер хеш-таблицы не известен, поскольку при необходимости она будет увеличиваться во избежание переполнения. В ранее рассмотренных версиях хеш-таблиц при необходимости мы увеличивали их размер, следуя принципу повторного хеширования всех видимых элементов. В случае хеш-таблиц, хранящихся на диске, этот метод оказывается чересчур уж радикальным, поскольку большая часть времени тратилась бы на выполнение операций дискового ввода/вывода. При использовании расширяемого хеширования мы реорганизуем лишь небольшую часть хеш-таблицы - в основном, только группу переполнения.

Теперь функция хеширования будет возвращать значение типа longint. Если вернуться к первоначальной хеш-функции PJW, можно убедиться, что она вычисляла 32-разрядное хеш-значение (фактически, 28-разрядное значение, поскольку значения четырех старших разрядов всегда устанавливались равными 0), а затем выполнялось деление по модулю этого значения на размер таблицы. При использовании расширяемого хеширования заключительное деление по модулю не выполняется. Вместо этого мы используем все хеш-значение полностью.

Означает ли это, что мы получаем хеш-таблицу с 268 миллионами ячеек? Нет, и это вполне согласуется со здравым смыслом. Мы используем только несколько разрядов хеш-значения, и по мере того, как таблица заполняется, мы начинаем использовать все больше разрядов хеш-значения.

Посмотрим, как работает этот алгоритм, на примере заполнения гипотетической хеш-таблицы. Первоначально в таблице имеется одна группа. Предположим, что каждая группа будет содержать 10 хеш-значений и номер записи каждого хеш-значения, чтобы ее можно было извлечь. Обратите внимание, что мы не помещаем в группы сами ключи. При использовании 28-разрядных хеш-значений, маловероятно, чтобы два ключа хешировались в одно и то же значение. (Фактически это будет происходить настолько редко, что для проверки ключей можно извлечь саму запись без заметного замедления всего процесса. Естественно, при этом предполагается, что используемая хеш-функция успешно справляется с рандомизацией.)

Начнем вставлять в таблицу хеш-значения вместе с номерами их записей. При наличии только одной группы их можно вставить только в одно место, поэтому после 10 вставок группа заполняется. Разобьем заполненную группу на две группы одинаковых размеров и повторим вставку всех элементов исходной группы в две новые группы. Причем все элементы, которые завершаются нулевым разрядом, поместим в одну группу, а завершающиеся единичным разрядом - в другую. Эти две группы имеют так называемую разрядную глубину (bit-depth), равную одному разряду. Теперь при каждой вставке пары хеш-значение/номер записи она будет помещаться в первую или во вторую группу, в зависимости от последнего разряда хеш-значения.

Со временем мы заполним еще одну группу. Предположим, что это группа, в которую мы вставляли все хеш-значения, завершающиеся 0. Снова разобьем группу на две отдельные группы. На этот раз все элементы, хеш-значения которых заканчиваются двумя нулевыми разрядами, т.е. 00, будут помещаться в первую группу, а завершающиеся разрядами 10 - во вторую группу. Обе группы имеют разрядную глубину, равную 2. Поэтому для определения места вставки необходимо проверять два младших разряда хеш-значения. Теперь у нас имеются три группы: в первую вставляются элементы, завершающиеся разрядами 00, во вторую -разрядами 10, а в третью - просто 1.

Предположим, что мы продолжаем вставку и заполняем группу 10. Мы снова разбиваем заполненную группу на две и повторяем вставку ее элементов в две новые группы. На этот раз две новые группы будут принимать элементы, завершающиеся разрядами 010 и 110. Таким образом, теперь у нас имеются четыре группы: одна с разрядной глубиной, равной 1, в которую выполняется вставка хеш-значений, завершающихся 1, одна с разрядной глубиной равной 2, содержащая хеш-значения, которые завершаются разрядами 00, и две группы с разрядной глубиной, равной 3, которые предназначены для хеш-значений, завершающихся разрядами 010 и 110.

Почему-то есть уверенность, что читатели уже получили представление о работе расширяемого хеширования, - все остальное не представляет сложности.

Для поддержания отображения того, какие хеш-значения помещаются в те или иные группы, используется структура, называемая каталогом (catalogue). По существу каталог содержит список всех возможных окончаний групп и связных с ними номеров групп. Вместо того чтобы поддерживать какой-либо причудливый набор значений разрядной глубины и номеров групп, выбранный методом проб и ошибок, каталог поддерживает собственное значение разрядной глубины, равное максимальной разрядной глубине группы, и имеет ячейку для каждого значения этой разрядной глубины.

1 ... 59 60 61 62 63 64 65 66 67 ... 119

Перейти на страницу:

На этой странице вы можете бесплатно скачать Фундаментальные алгоритмы и структуры данных в Delphi - Джулиан Бакнелл торрент бесплатно.