Уроки креационной науки

После изготовления изделие проверяется. Сначала контролируется изготовление частей и правильность их сборки (синтаксический уровень). Затем проверяется работоспособность каких-то подсистем (например, двигатель в самолете). Затем идет опробование всего изделия – испытательный полет самолета, к примеру. Идея возвращается к своему автору уже в воплощенном виде.

Не существует ни одного изделия, которое не несло бы в себе информацию, вложенную создателем этого изделия. КОЛИЧЕСТВЕННОЕ ИЗМЕРЕНИЕ ИНФОРМАЦИИ Из школьного курса вы знаете, что информацию, записанную на материальных носителях, можно измерить. Самый простейший из таких способов – число букв, или слов. Немного посложнее – биты и байты, о которых школьники уже имеют понятие.

Отметим, что количество информации имеет лишь относительное значение для источника и приемника. Более важно это количество для передающей системы. Компьютеру, который хранит текст этой книги, абсолютно безразличен смысл написанного, и бумага тоже терпит все, лишь бы она вмещала все слова. И телеграфистке, и машинистке, которые копируют совершенно неважный для них текст, важны их собственные трудозатраты: количество напечатанных букв или слов.

Потому, когда телеграмма написана, мы платим именно за количество слов, хотя на самом деле нас интересует "количество смысла". В известной легенде цвет корабельных парусов решил вопрос жизни и смерти героев. А ведь это был всего один бит информации! Каждый влюбленный также дорожит всего одним битом (да или нет), но это количество информации может определить множество поступков его жизни. Почему так?

Потому что за этой ничтожно малой в механическом измерении информацией стоит большой смысл и большая цель, понятные лишь источнику и приемнику, и не входящие в обменное информационное сообщение, а то и вовсе недоступные для передачи через материальный носитель. Итак, содержание информации далеко не всегда определяется ее измеряемым объемом.

Вообще объем информации можно измерять лишь на нижних уровнях: статистическом и отчасти на синтаксическом, но уже не на смысловом. Но и на статистическом уровне информацию можно выразить разным объемом. Наименьшая единица информации – бит, двоичный сигнал, устанавливающий разницу между да и нет, или точкой и тире. Одним таким сигналом невозможно выразить каждую букву алфавита.

Потому, например, азбука Морзе все буквы выражает несколькими знаками: каждую в своей комбинации точек и тире. В компьютерах же под каждую букву (да еще и из нескольких алфавитов) или цифру, или знак препинания отведено 8 битов, то есть восемь ячеек памяти, в каждой из которых может хранится ноль или единица. Комбинация нулей и единиц для каждого знака своя, но любая содержит ровно восемь знаков, каждый из которых может быть только нулем или единицею.

Всего таких комбинаций по восемь штук из двух значений бита можно составить 28 = 256, чего хватает с запасом на несколько алфавитов и разные служебные знаки и команды. Например, сочетание 00001111 – мы можем использовать для обозначения цифры 2, а для обозначения буквы Н, положим, 01010101. Нужно только всем договориться о единой системе такой кодировки, и каждый знак можно будет передавать восемью битами информации, которая именуется байтом. ИСЧИСЛЕНИЕ ИНФОРМАЦИИ И СИММЕТРИЯ Теперь, чтобы записать, к примеру, слово АБРОКАДАБРА нам потребуется 11 букв или 11 байт памяти нашего компьютера. Пока не станем задаваться вопросом: много ли смысла в такой затрате памяти. Возьмем и другое, не более значащее слово, выражающее, к примеру, чувство сильного страха: ААААААААААА. Сообщение состоит тоже из 11 букв, то есть для его записи можно использовать 11 байт информации. А можно ли его выразить короче? В отличие от первого сообщения – можно. Например, в три байта: 11А. Почему это оказалось возможно? Потому что в записи второго слова есть линейная симметрия, или повторяемость. С точки зрения порядка, или вероятности случайного отгадывания каждого слова перебором букв оба слова равнозначны или равносложны. Перебирая 11 букв случайным образом для отгадывания каждого из обоих слов, мы будем располагать одним шансом из 3211. Но с точки зрения неслучайного отгадывания второе слово предпочтительнее. Нужно только один раз попасть в клавишу А на клавиатуре и задержать на ней палец. С точки зрения количества информации оба слова неравны. Первое нельзя "сжать", а второе можно. Существуют особые программы сокращения записи в компьютерах, которые по особым правилам сжимают повторяющиеся буквы или пробелы. Кроме того, для сжатия записи текста, содержащего только 32 буквы, можно каждую из них кодировать не целым байтом, не ячейкой из восьми битов, а ячейкой из пяти таких битов. Различных комбинаций из пяти нулей и единиц можно составить как раз 25 = 32, так что каждую букву можно при такой нужде закодировать лишь пятью, а не восемью битами. Это позволяет сжимать запись. Но, совершенно очевидно, что подобное сжатие возможно лишь до какого-то предела, который определяется элементами повторяемости или симметрии записи. Лучше всего сжимаются в компьютере рисунки. Для передачи, положим, черно-белого рисунка, весь он разбивается на большое мозаичное поле, каждая мелкая клеточка которого, может быть черною или белою, в зависимости от того, попадает ли на нее черная или белая часть рисунка. Занумеровав последовательность всех клеток и запомнив, которые из них черные, а какие белые, можно зашифровать рисунок цифрами. Ясно, что для хорошей передачи требуется очень мелкая мозаика, но также ясно, что в любой такой мозаике будут повторяющиеся целые строчки из точек одного цвета. Чем мельче мы возьмем мозаику, тем большая требуется память для записи рисунка, но с другой стороны, тем больше возможностей для сокращения этой записи.