Лексикографічний порядок

Матеріал з testwiki
Перейти до навігації Перейти до пошуку

Лексикографічний порядок — відношення лінійного порядку на множині кортежів Σ*; Σ — упорядкований алфавіт. Свою назву лексикографічний порядок отримав по аналогії з сортуванням по алфавіту в словнику.

Нехай у списку букв алфавіту Σ порядок букв фіксований, тобто завжди один і той самий. Тоді цей список визначає повне впорядкування букв, які назвемо відношення передування і позначимо <= (ai<=aj, якщо ai передує aj у списку букв). На основі відношення передування букв — будуємо відношення передування слів, визначене наступним чином: Нехай дано слова a1=a11...a1m та a2=a21...a2m, тоді a1<=a2, якщо виконується перший або другий пункт.

  1. a1=βaig,a2=βajd та ai<=aj (β, g, d — деякі слова, можливо, порожні, ai та aj — букви)
  2. a2=a1β, де β — непорожнє слово.

Це відношення задає повне впорядкування множин всіх кінцевих слів у алфавіті «Σ», яке називається лексикографічним упорядкуванням слів.

Приклади

  • Приклад лексикографічного упорядкування є упорядкування слів в словнику. Вважається, що букви можна порівнювати, порівнюючи їх номери в абетці. Тоді лексикографічний порядок — це, наприклад, ААА, ААБ, ААВ, ААГ, …, ЯЯЯ, або А < АА < ААА < ААБ < ААВ < АБ < Б < … < ЯЯЯ.

Ліс <= літо (випадок — 1 визначення: β = лі, с <= т, g — пусто; d = о), тому слово «ліс» розташоване в словнику раніше слова «літо», ліс <= лісовик (випадок — 2 визначення: β = овик).

  • Якщо розглянути числа в позиційних системах числення (наприклад, у двійковій або десятковій системі) як слова в алфавіті цифр, то їх лексикографічний порядок збігається із звичайним, якщо всі числа, які порівнюємо мають однакове число розрядів. У загальному випадку ці два види упорядкування можуть не збігатися: наприклад, 10<1073 і 20<1073, але 10 <= 1073, а 20 =>1073. Для того щоб вони збігалися необхідно вирівняти число розрядів у всіх чисел, які порівнюємо, дописуючи зліва нулі. У наведеному прикладі отримаємо 0020 <= 1073. Таке вирівнювання автоматично відбувається при запису цілих чисел в ЕОМ. Послідовність чисел у будь-якій системі числення, записаних у фіксованій розрядній сітці (000, 001, 002, 003, 004, 005, …, 999).
  • Лексикографічне упорядкування для дат виду 06.09.99 (шосте вересня 1999 року) не збігається з природним упорядкуванням дат від ранніх до пізніх, наприклад 06.09.99 лексикографічно «більше» п'ятого числа будь-якого місяця другого року. Щоб зростання дат збігалося з лексикографічним упорядкуванням, цифри потрібно виставити в такому порядку рік, потім місяць, потім день: 99.09.06. Цей аспект врахований в форматі ISO 8601.

Див. також

Шаблон:Math-stub Шаблон:Теорія порядку Шаблон:Бібліоінформація