Читать книгу Системы и методы биржевой торговли (Перри Кауфман) онлайн бесплатно на Bookz (4-ая страница книги)
bannerbanner
Системы и методы биржевой торговли
Системы и методы биржевой торговли
Оценить:

0

Полная версия:

Системы и методы биржевой торговли

Как использовать средние значения

В работе с числами нередко бывает необходимо использовать репрезентативные значения. Иногда можно достичь гораздо лучшего понимания, если превратить набор отдельных цен в общую характеристику – среднее значение некоего диапазона цен. Например, средняя розничная цена одного фунта кофе на Северо-Востоке более значима при расчете стоимости жизни, чем цена в любом отдельно взятом магазине. Однако не все данные можно комбинировать или усреднять без потери смысла. Среднее всех цен, взятых за один день, ничего не скажет ни о каком отдельном рынке, который является частью среднего значения. Усредняя цены несвязанных вещей, например пачки кукурузных хлопьев, нормо-часа в авторемонтной мастерской и немецкого индекса DAX, мы получим число весьма сомнительной ценности. Среднее группы чисел должно иметь какой-то полезный смысл.

Среднее может запутать и по-другому. Рассмотрим цены на кофе, выросшие в течение года с $0,40 до $2,00 за фунт. Средняя цена этого продукта составляет $1,20, однако она не учитывает время, в течение которого кофе продавался по разным ценам. В табл. 2.1 рост цены на кофе разделен на четыре равных интервала. Как видно, время, проведенное на каждом из этих уровней, обратно пропорционально росту цен. Иными словами, цены находились на более низких уровнях в течение более длительных, а на более высоких – в течение более коротких периодов, что совершенно нормально для поведения цены.

Если учесть время, проведенное на каждом уровне цены, становится видно, что средняя цена должна быть ниже $1,20. Правильную среднюю цену можно рассчитать, при условии, что известно количество дней в каждом интервале, используя средневзвешенное значение цены



и соответствующий интервал



Этот результат может изменяться в зависимости от количества используемых временных интервалов, однако он дает лучшее представление о правильной средней цене. Существуют две другие средние величины, для которых время является важным элементом, – это среднее геометрическое и среднее гармоническое.


Таблица 2.1. Взвешивание среднего значения

Среднее геометрическое

Среднее геометрическое представляет функцию роста, в которой изменение цены от 50 до 100 столь же важно, как и изменение от 100 до 200. Его следует использовать с процентными величинами, а не с сырыми ценами. Если существует n цен, a1, a2, a3… an, то геометрическим средним является n корень из произведения n цен

G = (a1×a2×a3×…×an)1/n

или в Excel:

product(a1, a2, a3,…, an)^(1/n)

Чтобы решить это математически, нужно преобразовать приведенное выше уравнение в любую из двух форм:



или



Эти два решения эквивалентны. Член ln является натуральным логарифмом. (Обратите внимание, что в Excel для расчета натурального логарифма используется функция LOG). Используя уровни цен из табл. 2.1, записываем



Игнорируя временные интервалы, подставляем в первое уравнение:



Следовательно:

ln(G) = 4,6462,

G = 104,19.

Если среднее арифметическое, взвешенное по времени, составляет 105,71, то среднее геометрическое дает 104,19.

Среднее геометрическое имеет преимущества применительно к экономике и ценам. Классический пример – сравнение десятикратного повышения цены со 100 до 1000 с падением до одной десятой со 100 до 10. Среднее арифметическое двух величин (10 и 1000) равно 505, а среднее геометрическое дает

G = (10×1000)1/2 = 100

и показывает относительное распределение цен как функцию сопоставимого роста. Благодаря этому свойству геометрическое среднее лучше подходит для усреднения коэффициентов, которые могут представляться как в виде дроби, так и процента.

Среднее квадратичное

Среднее квадратичное чаще всего используется для оценки погрешности. Оно рассчитывается следующим образом:



Среднее квадратичное представляет собой квадратный корень из среднего арифметического квадратов величин. Лучше всего оно известно как основа для расчета стандартного отклонения. Мы поговорим об этом далее в этой главе в разделе «Моменты распределения».

Среднее гармоническое

Среднее гармоническое – еще одно взвешенное по времени среднее, но оно не тяготеет к более высоким или более низким величинам, как среднее геометрическое. В качестве простого примера рассмотрим среднюю скорость автомобиля, проезжающего 4 мили со скоростью 20 миль в час, а затем 4 мили со скоростью 30 миль в час. Среднее арифметическое дало бы 25 миль в час, без учета того, что 12 минут машина ехала со скоростью 20 миль в час, а 8 минут – 30 миль в час. Средневзвешенное значение составило бы



Среднее гармоническое рассчитывается как



что можно также выразить как



Для двух-трех значений можно использовать более простую форму:



Это позволяет видеть некоторую закономерность в решении. При скоростях 20 и 30 миль в час решение представляется как



что аналогично средневзвешенному значению. Возьмем еще раз первоначальное множество чисел и рассчитаем для него среднее гармоническое:



Мы могли бы применить среднее гармоническое к колебаниям цен, где первое колебание равно 20 пунктам за 12 дней, а второе колебание составляет 30 пунктов за 8 дней.

Отношение между средними значениями

Показатели центральной тенденции из предыдущего раздела используются для описания формы и экстремумов движения цены. Их также можно описать с помощью распределения плотности, о чем мы поговорим в следующем разделе. Общее отношение между тремя основными средними значениями, когда распределение не идеально симметрично, следующее:


Распределение цен

Измерение распределения дает общее представление о том, чего ожидать. Мы не можем знать, какой будет цена S&P через год, но если текущая цена равна 2400, то мы можем утверждать с высокой уверенностью, что она будет находиться между 2100 и 2700, и с меньшей уверенностью, что она ограничится коридором между 2300 и 2500; нет практически никакого шанса угадать диапазон точно. Нижеследующие методы измерения распределения позволят вам определять вероятность (т. е. доверительный уровень) наступления события.

Во всех статистических примерах, включенных в эту книгу, мы будем использовать в качестве выборочных данных ограниченное количество цен и – в некоторых случаях – отдельные торговые прибыли и убытки. Мы будем измерять характеристики выборки, находить форму распределения, оценивать, как результаты малой выборки соотносятся с большой и насколько две выборки подобны друг другу. Все эти измерения показывают, что малые выборки менее надежны, но их можно использовать, если вы понимаете величину ошибки или различие в форме распределения по сравнению с ожидаемым распределением большой выборки.

Плотность распределения

Плотность распределения (называемая также гистограммой) может давать хорошую картину характеристик данных. Теоретически мы ожидаем, что цены на биржевые товары будут больше времени находиться на низких уровнях, повышаясь лишь ненадолго. Эта модель показана на рис. 2.2 (цены на пшеницу с 1978 по 2017 г.). Чаще всего цена находится там, где спрос и предложение сбалансированы, это называется равновесием. Когда предложение недостаточно или возникает неожиданный спрос, цена на короткое время повышается, пока или спрос не удовлетворится, или предложение не увеличится до уровня спроса. Несмотря на краткосрочность, скачок цен может быть значительным и дать «толстый хвост» вытянутого вправо распределения, как показано на рис. 2.3. Обычно слева есть небольшой хвост, когда в течение периодов высокого предложения цены иногда опускаются ниже себестоимости.


Рис. 2.2. Цены на пшеницу, 1978–2017 гг.


Чтобы рассчитать распределение плотности, разделим диапазон цен на 20 сегментов.

● Возьмем самое высокое и самое низкое значение за рассматриваемый период и разделим разность на 19, чтобы получить размер одного сегмента.

● Затем, начиная с самой низкой цены, прибавляем размер сегмента, чтобы получить второе значение, прибавляем размер сегмента ко второму значению, чтобы получить третье значение, и т. д.

● В конце концов мы получаем 20 сегментов от самой низкой до самой высокой цены.

Excel избавляет нас от необходимости вести дальнейшие расчеты вручную. Для этого вам нужно подключить надстройку Данные / Пакет анализа, включая Гистограмму. Чтобы выполнить анализ, следуйте плану.

1. Импортируйте цены закрытия интересующего вас рынка.

2. Создайте набор сегментов (карманов) на основе диапазона данных. В нашем случае это цены на пшеницу от 200 до 1300 (выраженные в центах). Создайте столбец, который начинается с нуля и возрастает до 1300 с шагом в 50.

3. Теперь пройдите в раздел Данные / Пакет анализа и откройте окно Гистограмма.

4. Входной интервал – это цены закрытия.

5. Интервал карманов – это созданный нами столбец значений от 0 до 1300.

6. Для вывода результатов укажите Новый рабочий лист.

7. Нажмите на OK.

Программа заполнит все сегменты (карманы) и графически представит результаты, как показано на рис. 2.3.


Рис. 2.3. Распределение плотности цен на пшеницу, демонстрирующее хвост справа


Распределение плотности показывает, что цена чаще всего попадала в диапазон между $4,00 и $4,50 за бушель. Справа хвост растянут до $12 за бушель, что соответствует толстому хвосту. При нормальном распределении цены не превышали бы $6. Отсутствие ценовых данных ниже $2,00 объясняется тем, что фермеры отказываются продавать ниже порога себестоимости себе в убыток. Цены на пшеницу также можно рассматривать с учетом инфляции или изменения курса доллара США, о чем мы поговорим в конце этой главы.

Распределение цен на другие физические товары, включая сельскохозяйственную продукцию, металлы и энергию, будет похоже на распределение цен для пшеницы. Они будут смещены влево (больше случаев более низких цен) и иметь длинный хвост из более высоких цен, растянутый вправо. Многие товары сезонные, что позволяет им каждый год «начинать с начала». Финансовые рынки совершенно другие по своей природе, и многие из них продолжают все время расти. Цены на валюту могут колебаться на 25 % и более, но могут двинуться в любую сторону, если экономика США или другой страны претерпевает структурные изменения.

При наблюдении за более короткими ценовыми периодами для отслеживания трендов или переходов можно использовать удлиненные модели. Подробнее об этом смотрите в главе 18, особенно в разделах «Важность формы распределения» и «Рыночный профиль Стидлмайера».

Медиана и мода

Для определения параметров распределения часто используются еще два измерения – медиана и мода. Медиана, или «середина», полезна для нахождения «центра» данных – если данные упорядочены, это то значение, которое находится в середине. Медиана зачастую является лучшим показателем, чем среднее, так как позволяет исключить влияние экстремумов, которые могут искажать среднее арифметическое. Недостатком ее является то, что для нахождения средней точки нужно упорядочить все данные, а также ее бесполезно использовать при небольшом количестве данных.

Мода – это наиболее часто встречающееся значение. На рис. 2.3 модой является самый высокий столбик плотности распределения в сегменте 400.

При нормальном распределении ценового ряда мода, среднее и медиана равны, однако чем больше нарушается симметрия данных, тем дальше расходятся эти параметры. Их взаимоотношение выглядит следующим образом:

Среднее → Медиана → Мода

Нормальное распределение обычно называют колоколообразной кривой, где значения располагаются поровну с обеих сторон от среднего. В большинстве случаев при работе с ценовыми данными и результатами торговли распределение смещается вправо (имеет положительную асимметрию с хвостом вправо) и сглаживается или обрезается слева (в направлении более низких цен или торговых убытков), как мы видим на рис. 2.3. Если бы вам потребовалось построить график распределения торговых прибылей и убытков для системы следования за трендом с фиксированным стоп-лоссом, вы получили бы прибыли, варьирующие от нуля до очень больших величин, а вот убытки были бы теоретически ограничены размером стоп-лосса. На самом деле, этот график выглядел бы очень похоже на диаграмму распределения цен на пшеницу. Асимметричные распределения будут важны, когда позднее в этой главе мы займемся измерением вероятности. В торговой среде «нормальных» распределений, которые статистики также иногда называют гауссовскими, не бывает.

Краткий обзор основных методов усреднения

Каждый метод усреднения обладает своим уникальным смыслом и полезностью. Ниже вкратце обобщаются их основные характеристики.

На среднее арифметическое одинаково влияет каждый элемент данных, но оно чувствительно к экстремумам больше, чем другие методы.

Среднее геометрическое наиболее важно при использовании данных, представляющих процентные величины, коэффициенты или темпы изменения. Его нельзя использовать с отрицательными числами.

Среднее гармоническое лучше всего применимо к временным изменениям и, наряду со средним геометрическим, используется в экономике для анализа цен. Оно рассчитывается труднее и потому менее популярно, чем любое другое среднее.

Мода – это самое распространенное значение, определяемое только плотностью распределения. Это точка наибольшей концентрации, она указывает типичное значение в разумно большой выборке.

Медиана представляет собой срединное значение. Она наиболее полезна, когда необходимо найти центр неполного множества. Она нечувствительна к экстремальным колебаниям, и ее просто найти, но для этого требуется упорядочение данных, что может замедлить вычисление.

Моменты распределения: среднее, дисперсия, асимметрия и эксцесс

Сомнение заставляет испытывать неудобство, но уверенность делает человека смешным.

Китайская пословица

Моменты распределения описывают форму распределения точек данных, т. е. их расположение вокруг среднего. Существует четыре таких момента: среднее, дисперсия, асимметрия и эксцесс.

1. Среднее – это центр, или среднее значение, вокруг которого расположены другие точки данных.

2. Дисперсия – это удаленность отдельных точек от среднего.

3. Асимметрия – это смещение распределения влево или вправо относительно среднего.

4. Эксцесс – островершинность распределения.

Поскольку о среднем мы уже говорили, начнем со второго момента. В последующих расчетах мы будем использовать букву

с черточкой для обозначения среднего значения для ряда n цен; прописную букву P – для обозначения совокупности всех цен, а строчную p – для обозначения отдельных цен. Такая система обозначений позволяет легко увидеть общее между моментами распределения. Итак, среднее рассчитывается как:


Дисперсия (второй момент) и стандартное отклонение

Дисперсия (Var) очень похожа на среднее отклонение (mean deviation – MD), которое не возводит разности в квадрат и является лучшей оценкой дисперсии. Она рассчитывается как:



Обратите внимание на то, что дисперсия равна квадрату стандартного отклонения, var = s2 = σ2, это один из наиболее распространенных статистических показателей. В Excel дисперсия записывается как функция дисп, а в TradeStation как variance(series, n).

Стандартное отклонение (s), обозначаемое чаще всего буквой σ (сигма), является особой формой измерения среднего отклонения от среднего, в которой используется среднеквадратичное отклонение



где разности между отдельными ценами и средней ценой возводятся в квадрат, чтобы повысить значимость экстремумов, а затем результат приводится в норму путем извлечения квадратного корня. Этот популярный показатель, часто используемый в настоящей книге, определяется в Excel с помощью функции СТАНДОТКЛОН, а в TradeStation – функции StdDev(price, n), где n – количество цен.

Стандартное отклонение является самым популярным измерителем дисперсии данных наряду с волатильностью, или риском. В идеально нормальном множестве данных одно стандартное отклонение от среднего представляет совокупность приблизительно 68 % данных, два стандартных отклонения от среднего включают 95,5 % всех данных, а три стандартных отклонения охватывают 99,7 %, т. е. почти все данные. И хотя гарантировать включение всех данных невозможно, в случае нормального распределения можно исходить из того, что 3,5 стандартных отклонения включают 100 % данных. На рис. 2.4 показаны эти группировки стандартного отклонения.


Рис. 2.4. Нормальное распределение и процентная область, охватываемая одним стандартным отклонением от среднего арифметического


Термин z-оценка, или стандартизированная оценка, показывает количество стандартных отклонений от среднего значения для конкретной точки данных. Например, если точка данных имеет z-оценку 2,0, это означает, что она находится в двух стандартных отклонениях от среднего.

Асимметрия (третий момент)

В большинстве случаев, однако, ценовые данные имеют ненормальное распределение. У физических биржевых товаров, таких как золото, зерновые, энергоносители и даже процентные ставки (выраженные как доходность), цены находятся больше времени на низких уровнях и намного меньше времени на максимумах. Возьмем, например, цену на золото. Она достигала максимума в $800 за унцию в январе 1980 г. и затем в $1895 в сентябре 2011 г. (см. рис. 2.5). После пика 1980 г. цена упала и оставалась в диапазоне $250–400 за унцию в течение большей части следующих 20 лет. Если взять данные за этот период, то средняя цена для него составляет $325, а одно стандартное отклонение равно $140. При нормальном распределении два стандартных отклонения дали бы нам попадание 95 % данных между $45 и $605, что далеко от реальности. Если использовать данные за весь период 1978–2017 гг., то получим среднюю цену в $607 и стандартное отклонение в $408. В этом случае два стандартных отклонения дали бы нам диапазон от –$391 до $1423, что также не соответствует действительности.

Распределение плотности (рис. 2.6) показывает два узла, один с ценами на уровне $400, и еще одну область с ценами на уровне $1300. В обоих случаях справа есть длинный хвост, что говорит о наличии асимметрии (рис. 2.7). Асимметрия отражает величину отклонения от симметричного распределения, заставляющего кривую выглядеть короче слева (в направлении более низких цен) и длиннее справа (в направлении более высоких цен). Удлиненную сторону называют хвостом, и если более длинный хвост находится справа, то говорят о положительной асимметрии. В случае отрицательной асимметрии хвост находится слева.

Асимметрия рассчитывается по формуле:



Рис. 2.5. Наличные цены на золото


Рис. 2.6. Распределение плотности цен на золото


Рис. 2.7. Асимметрия. Почти все распределения цен имеют положительную асимметрию с более длинным хвостом справа, где цены выше


Асимметрия с точки зрения среднего, медианы и моды

При абсолютно нормальном распределении среднее, медиана и мода совпадают. Когда цены демонстрируют положительную асимметрию, что типично для периода более высоких цен, среднее перемещается вправо дальше всего, мода – меньше всего, а медиана оказывается где-то посередине между ними. Хорошее представление об асимметрии дает разность между средним и модой. Разность скорректирована с учетом дисперсии в виде стандартного отклонения распределения:



В умеренно асимметричном распределении расстояние между средним и модой оказывается в три раза больше разности между средним и медианой. Эту взаимосвязь можно также записать следующим образом:



Асимметрия в распределениях на различных относительных уровнях цен

Поскольку минимальные уровни цен большинства биржевых товаров определяются себестоимостью производства, распределения цен демонстрируют явное сопротивление падению ниже этих порогов. Это способствует возникновению положительной асимметрии на рынках соответствующих товаров. Для краткосрочных периодов, когда цены находятся на необычно высоких уровнях вследствие дисбаланса спроса и предложения, а не структурных изменений, характерны волатильность и неустойчивость. Отрицательная асимметрия, возникшая из-за них, может иметь тяжелый верх и создавать область, где дальнейшее повышение цен кажется невозможным. Между очень высокими и очень низкими уровнями цен мы можем найти плотность распределения, которая выглядит нормальной. На рис. 2.8 показано изменение в распределении цен в течение, скажем, 20 дней, когда цены резко идут вверх. Среднее показывает центры распределения по мере того, как оно изменяется, сдвигаясь от положительной к отрицательной асимметрии. Этот пример показывает, что нормальное распределение не подходит для всех случаев анализа цен и что логарифмическое, экспоненциальное или степенное распределение подходит лучше всего для долгосрочного анализа.


Рис. 2.8. Изменение распределения на различных уровнях цен. A, B и C – последовательно увеличивающиеся средние значения трех краткосрочных распределений. Они показывают, как распределение изменяется, сдвигаясь от положительной к отрицательной асимметрии

Эксцесс (четвертый момент)

Четвертый момент, эксцесс, описывает заостренность или сглаженность распределения, как показано на рис. 2.9. Этот измеритель хорош для беспристрастной оценки того, формируют ли цены тренд или движутся в боковике. Если вы видите, что цены равномерно повышаются, распределение будет более плоским и охватит более широкий диапазон. Это называется отрицательным эксцессом. Если цены движутся в определенном диапазоне, образуется скопление вокруг среднего, и мы имеем положительный эксцесс. В профиле рынка Стидлмайера, описываемом в главе 18, используется концепция эксцесса с плотностью распределения, накапливаемой динамически за счет учета изменения цены в реальном времени.

bannerbanner