banner banner banner
Информатика и ИТ. Нейросети.
Информатика и ИТ. Нейросети.
Оценить:
Рейтинг: 0

Полная версия:

Информатика и ИТ. Нейросети.

скачать книгу бесплатно


С 1981 г. в таблице ASCII для представления 1 символа используется 1 байт, т.е. таблица может описывать 2

=256 символических кодов.

Коды с десятичными номерами 0—127 образуют основную страницу таблицы. В основной странице располагаются управляющие команды для принтеров (0—31 – возврат каретки, перевод строки и т.д.), затем спецсимволы (#$%&*@ пр.), цифры и латинские буквы, прописные и строчные.

Коды с номерами 128—255 (табл. 3.1) отданы под знаки национальных алфавитов и символов псевдографики (псевдографика широко использовалась в 80-е годы). Вид символов, имеющих значение кода больше 127, зависит от выбранного шрифта.

С распространением компьютеров, программных продуктов и использования информационных ресурсов по миру выяснилось, что во многих странах Юго-Восточного региона 128 кодов под национальные символы не хватает, и в 1991 г. был принят стандарт ISO-10646-1 (иначе UNICODE-3). Для этого стандарта на кодирование символа отводится 3 байта.

В Юникоде первые 128 символов тоже совпадают с соответствующими символами ASCII. Далее размещены основные алфавиты современных языков. В целом, UNICODE-3 описывает алфавиты всех известных (в том числе и «мертвых» языков; в кодировку внесены все математические и иные научные, и символьные обозначения, и даже придуманные языки – письменность эльфов и Мордора.

В современных компьютерах используется укороченная, 16-битовая версия UNICODE. По этой системе каждый символ кодируется двухбайтовым числом, следовательно, таблица описывает 2

=65536 кодов, этой емкости вполне хватает для алфавитов современных широко используемых языков. Текстовые документы, созданные по такой таблице кодировки, имеют в два раза больший объем, по сравнению с кодировкой ASCII, но при современных технических средствах это не представляет особых проблем и затруднений.

Существуют и другие таблицы кодирования.

UTF (Unicode Transformation Format) – применяется в UNIX-подобных операционных системах, кодировка с переменным количеством байт/символ.

CP1251 – «Code Page 1251» – однобайтовая кодовая страница кодировки ОС Windows

Для представления русского варианта кириллицы были разработаны несколько кодовых таблиц, наиболее распространенной была КОИ-8 (Код Обмена Информацией, 8-ми битный).

Компьютерное представление графической информации

На сегодняшний день компьютерную графику по способу формирования и хранения изображений в памяти компьютера принято подразделять на растровую и векторную.

Растровое изображение формируется цветовыми точками. Растровые графические данные, в зависимости от способа сжатия, выбора глубины цветовой палитры, возможности хранения слоев и прочих возможностей при кодировании подразделяются по форматам стандартных способов записи файлов.

Векторное изображение формируется из набора объектов, описываемых с помощью математических формул.

Векторную графику, в свою очередь, по методу отображения можно разделить на большие категории:

– 2D-графику (плоскостную);

– 3D-графику (объемную);

– фрактальную графику (создание регулярных структур).

Изображения векторной графики также имеют собственные стандарты форматов хранения файлов.

По назначению компьютерную графику можно разделить на:

– Конструкторскую (инженерную) графику;

– Полиграфическую;

– Web-графику и т. д.

В таком делении учитываются требования области применения: для конструкторских работ важна точность отображения, но не слишком велики требования к цветовым характеристикам; для полиграфии – наоборот, точная цветопередача является основным требованием; в Web-графике существуют ограничения по объему файлов, к тому же, во всемирной паутине весьма ограничены цветовые палитры.

Цветовые модели. Разрешение

Для каждой точки растрового изображения (или для каждого объекта векторного изображения) должна сохраняться цветовая характеристика.

Если изображение монохромное (черно-белое) то хранить нужно только один признак цвета – есть цвет или нет, т.е. достаточно одного бита на каждый пиксель (объект) изображения.

Для описания градации одного цвета применяется обычное кодирование, в котором номер обозначает градацию. Чем больше значение, тем сильнее проявляется цвет. Таким образом, появляется возможность задавать оттенок цвета. Чтобы получить реальные полутона (для монохромного изображения), для хранения каждой цветовой точки нужно отводить большее количество разрядов. В этом случае черный цвет будет представлен нулевым значением, а белый – максимально возможным числом. Например, при восьмибитном кодировании получится 256 разных значений яркости (оттенки серого, Grayscale).

В более сложных случаях, когда речь идет о кодировании сложного цвета с большим количеством оттенков, рассматривают разложение цвета на несколько отдельных компонентов, которые, смешиваясь (т.е. действуя в одной точке), образуют заданный цвет.

Для цветных изображений нужно закодировать яркость и оттенок точки. Для получения наивысшей точности цветопередачи необходимо иметь по 256 значений для каждого из основных цветов (вместе это дает 23*8 – более 16 миллионов оттенков).

Рис. 3.3 Пространство цветов в модели RGB

Цветовое пространство характеризуют количеством битов, отводимых на сохранение цвета. Чаще всего используются режимы TrueColor (24 бита, в соотношении 8:8:8) и HighColor (16 бит, в соотношении 5:6:5).

Компоненты цвета и способ образования из них видимого оттенка образуют цветовую модель.

Теория цвета построена на особенностях зрения человека. Считается, что в глазу имеются сенсоры «колбочки», воспринимающие красный, зеленый и синий цвета, их отнесли к базовым (Red – красный; Green – зеленый; Blue – голубой). Остальные цвета получаются как смешение долей цвет. Белый – смешение максимального значения цветовых каналов, черный – отсутствие свечения по всем каналам. Эта модель цветового пространства названа аддитивной (суммирующей) и именуется RGB. Мониторы работают именно в этой системе, т.к. физически монитор излучает именно эти цвета.

Распространена и другая – субтрактивная (разделяющая) модель цветового пространства, получаемая вычитанием из белого базовых цветов. В итоге получены голубой, пурпурный и желтый цвета. Cyan – голубой; Magenta – фиолетовый; Yellow – желтый. При смешивании в равных максимальных долях они должны давать черный цвет. Поскольку на практике точного черного цвета при смешивании не получается, то в модель добавляется компенсирующий четвертый компонент – blacK, поэтому модель носит название CMYK. В этом пространстве работает большинство печатающих устройств.

Говоря о любом виде компьютерной графики нельзя не упомянуть о разрешении – понятии, которое применяется в очень разных смыслах:

Разрешение экрана – свойство видеоподсистемы, и настроек ОС, определяет размер изображения на экране; единицы измерения – PICSEL.

Разрешение электронного изображения – свойство файла, задается при создании (при сканировании, фотографировании и т.д.), определяет размер самого изображения; единицы изменения PPI – PICSEL PER INCH.

Разрешение печатного изображения – свойство принтера, количество точек, которые могут быть напечатаны на участке заданной длины, определяет качество изображения при заданном размере; единицы измерения DPI – DOTS PER INCH.

Чем больше разрешение – тем выше качество изображения, но и больше места требует сохраняемый графический файл. Для экранного отображения достаточно разрешения 70—75 ppi, для качественной распечатки на струйном/лазерном принтере потребуется 150—200 dpi, полиграфическим считается разрешение более 250 dpi.

Растровая графика

Растровые изображения формируются цветовыми точками, называемыми пикселями (PICSEL – PICtureS ELement). Из них создается двумерный массив (матрица).

Растровая графика – основное средство представления и обработки фотографических изображений, стилизованных художественных рисунков, с помощью именно этого способа представления информации строятся современные человеко-машинные интерфейсы. Но, несмотря на универсальность, этот способ представления информации имеет целый ряд недостатков. К ним относятся: зависимость качества изображения от его объема, трудность выделения и манипуляции отдельными элементами, существенное снижение качества изображения в результате геометрических преобразований (масштабирования, поворотов).

Устройствами, создающими растровое изображение, помимо собственно компьютера с растровым графическим редактором, являются:

– сканер;

– цифровая фото- и видео- аппаратура;

– программы – захватчики кадров теле- и видео- программ;

– программы создания растровой графики.

Сканеры и цифровая аппаратура используют светочувствительные элементы, при попадании на которые световой или лазерный луч передает характеристики точек. Эти характеристики в цифровом формате сохраняются на элементах памяти и, тем самым, достигается возможность передать изображение в компьютерную обработку.

Из-за разнообразия типов изображений и областей из использования существует огромное количество разнообразных графических форматов. Для того, чтобы программы понимали файлы разных форматов, существуют конвертеры – программы, переводящие файлы из формата в формат. Существует несколько наиболее употребительных форматов:

– .bmp – для хранения и передачи изображений в среде Windows;

– .jpg – для хранения изображений с применением сжатия (удаления избыточной информации);

– .gif – для хранения сжатых изображений с фиксированным количеством цветов, разрабатывался для применения в Интернете;

– .tif – предназначен для хранения изображений высокого (полиграфического) качества, имеется возможность перенесения на другие аппаратные платформы и т.д..

Векторная графика

Векторные изображения формируется из набора математически представленных геометрических объектов.

Рисунок хранится как набор координат, векторов и других чисел, характеризующих набор примитивов. Наиболее распространенными примитивами являются: отрезки, прямоугольники и их производные (со сглаженными углами), эллипсы и их части, кривые Безье (математические кривые третьего порядка, задаваемые 4 точками), а также составленные из них сложные контуры.

Линии – это кривые разных порядков, при этом прямая рассматривается как частный случай кривой; они обладают свойствами – толщиной, цветом, начертанием (сплошная, штриховая). Из минимальных объектов-линий создаются контуры. Каждый контур имеет 2 или более опорные точки-узлы. Если 1-ая точка совпадает с последней – конур замкнут, и приобретает свойство заполнения (цветом, рисунком-текстурой, градиентной заливкой).

Большим преимуществом векторного представления графики является значительно меньший объем файлов по сравнению с растровой – изображение описывается не битовой картой, а несколькими формулами, при этом объем файла не зависит от размеров изображения. Еще одно достоинство векторного представления – его объектность: объекты легко выделять, при всех трансформациях (уменьшение, увеличение, искажение) качество не ухудшается и не зависит от разрешения.

Недостатком этой формы представления относится большая сложность создания фотореалистичных изображений и высокие требования к ресурсам вычислительной системы, необходимым для пересчета координат объектов при трансформации.

Устройством ввода векторного изображения является дигитайзер (сколка). Механическое воздействие на панель этого устройства позволяет фиксировать координаты точек, а сила нажатия – определять толщину линии между точками.

Распространенными форматами хранения векторных изображений являются:

– .wmf – формат хранения векторных изображений в Windows;

– .ai,.cdf – собственные форматы векторных редакторов AdobeIllustrator и CorelDraw, совместимые друг с другом.

– .dwg – формат файлов конструкторского программного пакета AutoCad.

Компьютерное представление звука

Звук – это продольная механическая волна, распространяемая в воздухе или другой среде во всех направлениях от источника колебаний.

Всякий звук (игра музыкальных инструментов, голос человека) – это своеобразная смесь многих гармонических колебаний с определенным набором частот. Как и любая волна, звуковая волна характеризуется двумя основными параметрами – амплитудой и частотой.

Частота – это количество звуковых колебаний в секунду; измеряется в герцах (Гц). Чем выше частота, тем выше тон звука.

Амплитуда колебаний определяет громкость звука и зависит в первую очередь от мощности источника звука.

Абсолютную величину звукового давления измеряют в паскалях (Па). Порогом слышимости обладают звуки, имеющие амплитуду около 20мкПа (2*10

 Па). Уровень болевого порога слышимости около 200 Па, т.е минимальное и максимальное значения отличаются на 6—7 порядков. Из-за большого разброса величин абсолютными значениями пользоваться неудобно, и используют логарифмическую шкалу децибелов.

Десятичный логарифм отношения некоторой величины к ее эталонному значению (порогу слышимости) называется белом (Б), а его десятая часть – децибелом (дБ).

,

где L – уровень звука в дБ

Р

 – измеряемое звуковое давление

Р

 – звуковое давление порога слышимости

Звук можно представить в виде кривой, которая показывает зависимость звукового давления от времени. Замеряя напряжение через равные промежутки времени и сохраняя полученные численные значения можно дискретизировать (оцифровать звук). При этом сохраняются мгновенные значения звукового сигнала в определенные моменты времени (выборки). Чем чаще берутся выборки, тем точнее цифровая копия звука.

Частота следования отсчетов называется частотой дискретизации, а диапазон значений отсчета определяется разрядностью его двоичного представления.

При цифровом способе хранения звука не сохраняется весь профиль кривой звукового давления (и соответственно, сопоставленного ему напряжения). На рис.3.4 проиллюстрированы потери информации об истинном изменении времени и значениях амплитуды.

Для того чтобы воспроизвести закодированный таким образом звук, нужно выполнить обратное преобразование, и сгладить получившийся ступенчатый сигнал.

Рис. 3.4. Потери информации при дискредитации звука

Устройство, выполняющее оцифровку (кодирование аналогового сигнала), называется аналого-цифровым преобразователем (АЦП).

Для обратного преобразования служит цифро-аналоговый преобразователь (ЦАП).

Дискретизация сигнала с произвольной частотой не всегда дает возможность восстановить форму входного сигнала, а использование частоты в два раза большей, чем частота фиксируемого сигнала однозначно даст восстановление искомой формы.

Это утверждение является одной из важнейших теорем, используемых в теории информации, теорема В.А.Котельникова (в англоязычной литературе – теорема Найквиста-Шеннона):

Непрерывная функция Х (t) не имеющая в своем спектре составляющих с частотами, лежащими за пределами полосы f (-F

F

), полностью определяется последовательностью своих отсчетов в дискретные моменты времени X (t

), следующих с шагом t <1/2F

.

Таким образом, по дискретной последовательности отсчетов всегда можно восстановить исходную непрерывную функцию Х (t), если отсчеты брались с интервалом t <1/2F

. То есть любой непрерывный сигнал может быть преобразован в дискретную последовательность, а затем восстановлен по последовательности своих дискретных значений.

Человеческое ухо воспринимает чистые гармонические тоны в том случае, если их частоты не превышают 20 килогерц, т.е. 20 тысяч колебаний в секунду. Остальные тоны, частоты которых выше 20 килогерц, оказываются неслышимыми для человека – ультразвук. Этот факт ограниченности возможностей человеческого уха по частоте и предоставляет возможность установления разумного интервала для снятия значений звукового давления.

Точная формулировка теоремы Котельникова применима только к сигналам с неизменными частотными характеристиками и бесконечной длительностью, и поэтому для оцифровки реальных звуковых сигналов выбирают несколько большую частоту дискретизации (с запасом).

Предел восприятия частоты звука составляет 20 КГц, и частоты 40 КГц будет вполне достаточно для осуществления цифровой записи, лишенной искажений, но при этом некоторые шумы и искажения в записи все же будут присутствовать. В современной цифровой записи звука принят стандарт записи с частотой снятия значения звукового давления, или частотой дискретизации, равной 44100 герц. Компьютер позволяет записывать звук, как с большими, так и с меньшими частотами дискретизации.