скачать книгу бесплатно
Таким образом, в процессе информационной коммуникации выделяются три основных компонента:
исходная информация – отражаемые сведения об источнике, т.е. совокупность тех значений характеристик источника, которые повлияли на изменение данных;
данные – представление переданных сведений, т.е. совокупность характеристик промежуточного материального носителя, изменившихся в результате фиксации передаваемых сведений;
воспринятая информация – актуальные сведения, полученные воспринимающей системой в результате совместной обработки сведений, зафиксированных в данных, со сведениями, знаниями, априорно доступными воспринимающей системе.
Как видим, информация в этом процессе предстает в двух видах, разделенных во времени: исходная и воспринятая информация. Эта особенность информации называется ее дуализмом. Третий компонент – данные выступает как канал передачи информации во времени.
Информация, т.е. сведения о распределении материи и энергии, об изменениях в процессах – суть знания человека об окружающем мире, в том числе о человеческой деятельности. Информация – это знание, которое существует не только для данного человека, но и для других людей.
Способом, обеспечивающим доступность знаний, информации разным людям, является представление и хранение информации в виде данных на материальном носителе. Таким образом, вся информация, употребляемая человечеством в его деятельности, воплощающая интеллектуальный и духовный потенциалы человечества, хранится в форме данных. Отсюда следует, что и третий компонент информационной коммуникации (данные) может рассматриваться как вид представления информации – хранимая информация (см. схему на рис.1.2.).
Рис. 1.2. Информационная коммуникация
Свойства информации. Любая информация обладает рядом свойств, которые в совокупности определяют степень ее соответствия потребностям пользователя (качество информации). В научной литературе описывается немало разнообразных свойств информации, так как каждая научная дисциплина рассматривает те свойства, которые ей наиболее важны.
Рассмотрим свойства информации с точки зрения основных этапов коммуникационного процесса.
– Свойства исходной информации.
В зависимости от способа восприятия исходная информация подразделяется на визуальную, аудиальную, тактильную, обонятельную, вкусовую; в соответствии с видами воспринимающих ее органов чувств -зрения, слуха, ощущения, запаха, вкуса.
– Свойства хранимой информации (данных).
Данные фиксируются в некоторой материальной запоминающей среде посредством изменения ее физических, химических или механических свойств.
По видам носителей данные подразделяются, во-первых, по материалу носителя. Издавна известны, такие носители как камень (наскальные рисунки, каменные плиты), глиняные таблички, пергамент, папирус, береста и другие. Затем появились следующие носители: бумага, пластмасса, фотоматериалы, магнитные и оптические материалы и другие.
Кроме того носители делятся на традиционные и машиночитаемые. Под традиционными понимаются: бумага, холст, пластмасса (грампластинка), магнитная лента (аудио и видеокассета), фотографические материалы (фотопленка, фото-пластина, фотоотпечаток, микро-носитель) и т. п.
К машиночитаемым носителям относятся: дискеты (гибкие магнитные диски), жёсткие магнитные и компактные (оптические, магнитооптические и иные) диски, флеш -карты и другие носители информации, предназначенные для использования в компьютерных устройствах, комплексах, системах и сетях.
По форме представления данных на материальном носителе данные подразделяются на:
– изобразительные (или графические): наскальные рисунки, картины, схемы, фотографии и пр.
– текстовые, изображающие речь с помощью символов (букв) в виде лексем естественного языка,
– числовые, в виде комбинаций цифр и математических знаков,
– звуковые, отображающие записанную с помощью звукозаписывающих устройств аудиальную информацию,
– музыкальные тексты – разновидность звуковой информации, записанной с использованием специальных символов (нот),
– видеоинформация – способ хранения «живых», динамичных картин окружающего мира в виде видеозаписи.
– Фиксация информации в виде данных
Взаимодействие различных объектов в реальности происходит постоянно, и поэтому постоянно реализуются процессы фиксации следов этих взаимодействий на материальных носителях. Эти процессы могут происходить непреднамеренно, целенаправленно или сознательно.
Непреднамеренный процесс фиксации информации. В реальном мире обычно процесс взаимодействия объектов «не имеет цели» нести информацию, «не знает», что он связан с отражением (оценкой разнообразия) и с информацией. Он просто происходит. Результаты изменения характеристик материального носителя «не знают», что они данные и отражают информацию. Они просто возникают в процессе взаимодействия. Однако может найтись некий получатель, который захочет извлечь информацию из результатов этого взаимодействия. Тогда эти результаты станут играть роль данных на втором этапе процесса информационной коммуникации.
Целенаправленная фиксация информации происходит в системах, в которых одни процессы используют результаты других процессов. Например, в системе «родители – дети» в одном организме происходит порождение молекул ДНК, содержащих генетическую информацию, которая предназначена для использования другими организмами. Или: результаты протекания некоторого наблюдаемого процесса регистрируются специальными устройствами для последующей обработки наблюдений. Обработка результатов опирается на некоторую модель процесса, которую учитывали разработчики системы обработки. При этом происходит объективная потеря информации, обусловленная характеристиками аппаратуры, ее точности и пр.
Процесс отражения результатов духовной или мыслительной деятельности человека предусматривает сознательное порождение одним человеком текстов, предназначенных для последующего их восприятия другим человеком. В этом случае возможно искажение смысла. Как сказано Ф. Тютчевым: «Мысль изреченная есть ложь». Это искажение определяется возможностями автора («регистрирующего устройства»): его мастерством «изречения» и умением переносить мысль в данные.
Как видим, в любом случае зафиксированная информация несколько отличается от исходной, передает свойства отображаемой реальности с искажением. И чем больше шагов преобразования происходит на пути от отображаемой реальности к данным, тем больше оказывается степень искажения. Но при этом процесс фиксации информации характеризуется довольно высокой степенью объективности – он зависит от условий фиксации и «технических характеристик» процесса фиксации, но не зависит от чьего-нибудь мнения или сознания. Даже если человек выдает заведомо лживое сообщение (дезинформацию), запись этого сообщения есть объективное отображение того, что произнесено (а определение истинности сказанного – это уже другой вопрос).
– Свойства воспринятой информации.
Результаты восприятия информации всегда субъективны, определяются возможностями получателя, его знаниями, прагматическими целями, с которыми он воспринимает информацию, и т. п. Одни и те же данные могут быть использованы различными людьми (и даже одним и тем же человеком в разные моменты времени) по-разному; информация, заложенная в молекуле ДНК, может по-разному использоваться здоровым и больным организмом; одни и те же данные в памяти компьютера по-разному используются разными программами и т. п. Восприятие непреднамеренно оставленных следов физических процессов заключается в том, что сначала воспринимающей системой создается некая модель источника – принимаются соглашения о правилах соответствия этих следов (данных), характеристикам источника, о том, как эти следы структурируются (каков их синтаксис) и как осмысливаются (какова их семантика); а потом уже происходит непосредственное восприятие и осмысление данных.
Отметим также, что передача исходной информации (создание данных) осуществляется один раз, а использование данных может осуществляться многократно и по-разному.
Свойства информации с точки зрения восприятия подразделяют на две группы: прагматические и атрибутивные.
Прагматические свойства информации – это те свойства, которые характеризуют степень полезности информации для пользователя в его практике. С прагматической точки зрения информация может быть:
– Объективная – существующая вне и независимо от человеческого сознания.
– Актуальная – информация, ценная в данный момент времени.
– Достоверная – информация, полученная без искажений.
– Понятная – информация, выраженная на языке, понятном тому, кому она предназначена.
– Полная – информация, достаточная для принятия правильного решения или понимания.
– Полезная – полезность информации определяется субъектом, получившим информацию в зависимости от объёма возможностей её использования.
Атрибутивные свойства – это те влияющие на восприятие свойства информации, которые отображают особенности информации, связанные с ее хранением в совокупностях данных и в тезаурусах пользователей. Эти свойства следующие:
– Кумулятивность информации – накопление информации; способность к более строгому, обобщенному и компактному восприятию накопленной информации в процессе создания новой информации
– Преемственность информации – способность освоения новой информации с учетом уже накопленной.
– Концентрация информации проявляется в том, что по мере накопления определенных единиц информации они имеют тенденцию к объединению в более информационно-ёмкие формы.
– Эмерджентность информации – проявление в результате совместного рассмотрения элементов информации таких смыслов, которые не наблюдаются ни в одном из элементов, если они рассматриваются отдельно. То есть система больше суммы своих элементов.
– Неассоциативность и некоммутативность информации – любая информация это не арифметическая сумма составляющих её элементов, эти элементы нельзя использовать в другой последовательности. Как говорится, сначала надо думать, а потом делать, но никак не наоборот.
– Старение информации – с течением времени хранимая информация начинает устаревать, утрачивать ценность для пользователя. Абсолютно устаревшая информация – это информация, которая с появлением новой информацией оказалась недостоверной. Относительно устаревшей информацияназывается тогда, когда она может быть дополнена новой информацией.
Структура данных. Как уже говорилось, данные представляют собой результаты отражения, как процессов реального мира, так и результатов осознанной деятельности человека. Происходит это в режиме как непосредственного, так и отложенного общения.
В режиме отложенного общения данные фиксируются на материальном носителе и через некоторое время воспринимаются получателем (пользователем). Выше отмечалось, что при этом воспринимающая система извлекает из сообщения полезную актуальную информацию и расширяет свой тезаурус. Казалось бы, после этого сведения, отраженные в данных, уже не содержат полезной информации, являются бесполезными. Однако, во-первых, эти же сведения могут быть использованы тем же пользователем в других целях, для решения других задач, а, во-вторых, они могут быть полезными другим пользователям. Поэтому возникает необходимость длительного сохранения данных на материальном носителе.
Таким образом, огромное количество информации хранится в виде данных на различных материальных носителях: в книгах, тетрадях, архивных документах, файлах интернета и пр. В этом море информации выделяются большие хранилища данных: библиотеки, архивы, базы данных, информационные фонды.
Для того, чтобы указать, где находится необходимая информация, необходимо назвать соответствующее хранилище. Но, кроме того, нужно указать конкретный элемент данных, содержащий нужную информацию, назвать необходимую «порцию» информации.
В процессе фиксации информации происходит занесение некоторой «порции информации» на какой-то материальный носитель в виде текста, представляющего собой «порцию данных». Будем далее «порцию информации» обозначать термином «сообщение».
При непосредственном общении «порция данных» сразу же поступает в «обработку», т.е. реализуется передача данных в режиме «адресант – адресат». При отложенном общении «порция хранимых данных» поступает к получателю в режиме поиска: «запрос – ответ». По инициативе получателя задается запрос, в соответствии с которым воспринимающая система выдает ответ. Для обеспечения этого процесса необходимо, чтобы воспринимающая система могла найти ту «порцию данных», где зафиксировано нужное сообщение.
Поэтому важнейшими вопросами построения процесса обработки информации (данных) являются вопросы о том, какова структура хранимых данных и как сопоставляются «порция информации» (сообщение) и соответствующая ей «порция данных» (текст).
Структура данных определяется, прежде всего, структурой материального носителя, на котором находятся данные. Материальный носитель представляется как совокупность некоторых «кусков», т.е. материальных объектов с определенными физическими свойствами. В качестве материального объекта может выступать лист бумаги, сброшюрованная пачка листов бумаги, магнитный или оптический диск, кусок холста и др.
Все пространство хранения данных – это совокупность материальных объектов, на которых зафиксированы те или другие данные. Таким образом, основным структурным элементом данных является совокупность данных, расположенных на одном материальном объекте. Такую совокупность обычно связывают с понятием «документ».
Не всякий материальный объект с зафиксированными на нем данными является документом. Например, только что найденный в Великом Новгороде кусочек бересты с текстом не является документом, и станет им тогда, когда будет зафиксировано, где и когда он был найден, а сам кусочек получит учетный номер.
Для того чтобы выбрать объект, идентифицировать, т.е. однозначно обозначить его, нужно знать его характеристики, отличающие его от других объектов. Если выбор осуществляет непосредственно человек, то он может ориентироваться как на «информационные» характеристики объекта (название, автор, год издания, текстовое описание и пр.), так и на характеристики, воспринимаемые чувственно (цвет, форма, размер, вид носителя и пр.). Например: «Дедушкина толстая синяя записная книжка». Если же поиск осуществляется с помощью вспомогательных средств (каталоги, компьютер), то объект можно идентифицировать только «информационно», с помощью таких характеристик как шифр, инвентарный номер, и т. п.
Документ – это идентифицируемый материальныйобъект, содержащий информацию.
Это определение имеет наиболее общий характер. В разных отраслях деятельности человек имеет дело с документами разного вида, к ним применяются различные дополнительные требования. Например, юридически значимые документы должны быть оформлены специальным образом, содержать подписи, печати и т. д. Документом является и паспорт человека, и завещание, и надгробная плита, и книга, и картина художника, и аудиозапись, и файл на магнитном носителе.
Определение документа отражает две разные ипостаси документа, в соответствии с которыми он может быть интересен потребителю: «что это за информационный объект» и «про что он». А именно: иногда интересно иметь сведения о документе как объекте, о его правовом статусе и других характеристиках, в том числе, может быть, и об информации, отражаемой в этом документе. В других случаях потребителя интересует собственно информация о чем-то, в том числе, может быть, сведения о документе (объекте), содержащем эту информацию.
Чаще всего, конечно, документ интересен с точки зрения его информации. Но чтобы найти нужный документ, необходимо найти тот материальный объект, на котором зафиксирована эта информация.
Документ является особым типом объектов. Объект – это нечто, существующее в реальной действительности. Объекты характеризуются какими-то свойствами: цвет, форма, размер, назначение и пр. Объекты отличаются друг от друга разными значениями их свойств. Для того, чтобы обозначить объект, следует назвать отличающие его значения некоторых свойств. Например: марка, год выпуска, цвет, номер регистрации автомобиля; фамилия, должность, табельный номер сотрудника. Значения некоторых свойств однозначно определяют объект (номер регистрации автомобиля или табельный номер сотрудника), значения других свойств позволяют найти несколько объектов (все красные автомобили или все инженеры).
Документы представляют собой особый тип объектов: «Документ – это объект, отличающийся от обычного объекта тем, что он содержит информацию». Поэтому для того, чтобы описать документ, необходимо, во-первых, описать некий материальный объект, а во-вторых, описать содержащуюся на нем информацию. И при поиске документов можно задавать как их свойства, характеризующие объект (год издания книги, название, автор), так и характеристики информации, содержащейся в документе. Например: найти произведения А.С.Пушкина, изданные в 1999 г, в которых говорится о Пугачеве и о заячьем тулупчике.
Операции с данными. Двоичный код. Единицы измерения информации
Операции с данными. В ходе информационного процесса данные преобразуются из одного вида в другой. Обработка данных включает в себя множество различных операций. В ходе развития человечества усложняются условия управления производством и обществом, увеличивается и объем обрабатываемых данных. Появляются и внедряются новые носители данных, средства их хранения и доставки. В структуре возможных операций с данными можно выделить следующие основные:
– Сбор данных – накопление информации с целью обеспечения достаточной полноты ее для принятия решений;
– Формализация данных – приведение данных, поступающих из различных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности;
– Фильтрация данных – отсеивание «лишних» данных, в которых нет необходимости для принятия решений;
– Сортировка данных – упорядочение данных по заданному признаку с целью удобства использования, повышает доступность информации;
– Архивация данных – организация хранения данных в удобной и легко доступной форме;
– Защита данных – комплекс мер, направленных на предотвращения утраты, воспроизведения и модификации данных;
– Транспортировка данных – прием и передача данных между удаленными участками информационного процесса, при этом источник данных принято называть сервером, а потребителя — клиентом;
– Преобразование данных – перевод данных их одной формы в другую или из одной структуры в другую.
Преобразование данных часто связано с изменением типа носителя, например книги можно хранить в обычной бумажной форме или в электронной. Необходимость в многократном преобразовании данных возникает также при транспортировке, особенно если она осуществляется средствами, не предназначенными для транспортировки данного вида данных. Например, для транспортировки цифровых потоков данных по каналам телефонных сетей необходимо преобразование цифровых данных в некое подобие звуковых сигналов. Этим занимаются специальные устройства – телефонные модемы.
Кодирование данных двоичным кодом. Для автоматизации работы с данными, относящимися к различным типам, очень важно унифицировать их форму представления – для этого обычно используется прием кодирования, то есть выражение данных одного типа через данные другого типа. Естественные человеческие языки – это не что иное, как системы кодирования понятий для выражения мыслей посредством речи. К языкам близко примыкают азбуки – системы кодирования компонентов языка графическими символами. Системы универсального кодирования существуют в отдельных отраслях науки и техники. Например, система записи математических выражений, телеграфная азбука, морская флажковая азбука, система Брайля для слепых и многое другое.
Своя система существует и в вычислительной технике – она называется двоичным кодированием и основана на представлении данных последовательностью всего двух знаков: 0 и 1. Эти знаки называются двоичными цифрами.
Двоичная структура информации весьма просто реализуется на электронных схемах с двумя устойчивыми состояниями элементов: есть сигнал – 1, нет сигнала – 0, и поэтому именно бит принят как единица измерения хранимой информации.
Одним битом могут быть выражены два понятия: 0 или 1 (да или нет, белое или черное, истина или ложь и т.д.). Если количество битов увеличить до двух, то уже можно выразить четыре различных понятия: 00 01 10 11
Тремя битами можно закодировать восемь различных значений:
000 001 010 011 100 101 110 111
Единицы измерения информации. За минимальную единицу информации принят один бит (англ. bit – BInary digiT— двоичная цифра). Это минимальное количество информации, подлежащее рассмотрению, его смысл – логическая «1» или «0».
Бит очень малая единица измерения информации, поэтому на практике используются составные, более крупные единицы, например – байт, являющийся последовательностью из восьми бит. Байт – сокращенное словосочетание от BinarY TErm, (терм – выражение).
Широко используются еще более крупные производные единицы информации. Старшие производные единицы представляют собой соответствующие степени основания числа 2, названия их формируются по общим принципам формирования названий единиц (приставки кило, мега, гига и т.д.), при этом проявляется несоответствие «десятичных приставок» и степени основания.
Таблица 1.1.
Единицы информации
Информатика, ее предмет и структура
Термин «информатика» предложен Карлом Штейнбухом в 1957. В 1962 этот термин был введён во французский язык Ф. Дрейфусом. Отдельной наукой информатика была признана в 1970-х; до того она развивалась в составе математики и электроники. Сейчас информатика обладает собственными методами и терминологией.
Как наука, информатика изучает общие закономерности, свойственные информационным процессам. При разработке новых носителей информации, каналов связи, приёмов кодирования, визуального отображения информации и т.п., конкретная природа информации не имеет значения. Здесь важны общие принципы организации и эффективность поиска данных, а не то, какие конкретно данные будут заложены в базу пользователями.
Эти общие закономерности есть предмет информатики как науки.
Инфоpматика – научная дисциплина с широким диапазоном применения. Её основные направления:
– pазpаботка вычислительных систем и пpогpаммного обеспечения;
– теоpия инфоpмации, изучающая процессы, связанные с передачей, приёмом, преобразованием и хранением информации;
– методы искусственного интеллекта, позволяющие создавать программы для решения задач, требующих определённых интеллектуальных усилий при выполнении их человеком (логический вывод, обучение, понимание речи, визуальное восприятие, игры и др.);
– системный анализ, заключающийся в анализе назначения проектируемой системы и в установлении требований, которым она должна отвечать; методы машинной графики, анимации, средства мультимедиа;
– средства телекоммуникации, в том числе, глобальные компьютерные сети, объединяющие всё человечество в единое информационное сообщество; разнообразные пpиложения, охватывающие производство, науку, образование, медицину, торговлю, сельское хозяйство и все другие виды хозяйственной и общественной деятельности.
Информатика – совокупность научных направлений, изучающих информацию, информационные процессы в природе, обществе, технике, формализацию и моделирование, методы познания, способы представления, накопления, обработки и передачи информации.
Способы получения, переработки, передачи, хранения и воспроизведения информации с помощью технических средств составляют сущность информационных технологий.
Теоретическую основу информатики образует группа фундаментальных наук, которую в равной степени можно отнести как к математике, так и к кибернетике: теория информации, теория алгоритмов, математическая логика, теория формальных языков и грамматик, комбинаторный анализ, теория вероятностей и математическая статистика и т. д.