
Полная версия:
Системы и методы биржевой торговли
Используя те же нотации, что и в третьем моменте, эксцесс можно рассчитать как

Чаще всего используется модифицированный показатель эксцесса (excess kurtosis, обозначается KE), позволяющий видеть ненормальные распределения лучше. KE = K – 3, потому что нормальная величина эксцесса равна 3.

Рис. 2.9. Эксцесс. Положительный эксцесс образуется, когда пик распределения выше нормального, что типично для бокового рынка. Отрицательный эксцесс, выглядящий как более плоское распределение, формируется, когда рынок находится в тренде
Эксцесс также полезен при анализе результатов тестирования системы. Если система прибыльна, эксцесс дневной доходности должен быть несколько больше 3. Однако эксцесс выше 7–8 может указывать на чрезмерную подгонку системы. Высокий эксцесс означает, что имеется слишком много прибыльных сделок одинакового размера, что вряд ли возможно в реальной торговле. Высокое значение эксцесса должно сразу же вызывать подозрения.
Статистические функции в ExcelЭлектронные таблицы существенно упрощают нам жизнь. Больше не нужно просматривать таблицы, чтобы определить местоположение точки в распределении вероятностей или вручную вводить сложные формулы. В Excel есть следующие функции.
ДИСП (список) или ДИСП.В – это дисперсия списка значений со знаменателем n. ДИСП (список) или ДИСП.Г – это вычисление дисперсии для генеральной совокупности со знаменателем n – 1.
СТАНДОТКЛОН (список) или СТАНДОТКЛОН.В – стандартное отклонение для выборки, а СТАНДОТКЛОН.Г (список) – стандартное отклонение для генеральной совокупности. В первом случае знаменатель равен n – 1, во втором n.
СКОС (список) и СКОС.Г (список) – расчет асимметрии распределения относительно среднего со знаменателями n и n – 1 соответственно.
ЭКСЦЕСС (список) – расчет эксцесса.
НОРМРАСП (Х; среднее; стандартное_откл; интегральная) – расчет вероятности, связанной со значением стандартного отклонения в распределении. X – значение, для которого строится распределение (например, 1,5); среднее – среднее списка значений; стандартное_откл – стандартное отклонение для списка значений; интегральная (ИСТИНА) – кумулятивная функция распределения. Ответ 0,933 означает, что заданное значение находится на уровне 93,3 % (в крайней правой части) распределения.
СЛЧИС и СЛУЧМЕЖДУ (a, b) возвращает равномерные (равномерно распределенные) случайные числа. СЛЧИС возвращает значения от 0 до 1, а СЛУЧМЕЖДУ – равномерно распределенные значения между двумя входными числами a и b.
Чтобы найти другие статистические функции в Excel, нажмите кнопку fx (Вставка функции) на панели инструментов – откроется список функций и их описания. Все базовые функции включены во все платформы, но могут иметь другие обозначения.
Доходность фондового рынкаЕсли бы годовая доходность фондового рынка за последние 50 лет имела нормальное распределение (как показано на рис. 2.4), то среднее составило бы приблизительно 8 %, а одно стандартное отклонение 16 %. Это означает, что в любом году можно было бы ожидать доходность в 8 %, но при этом существовала бы 32 %-ная вероятность, что она была бы либо больше 24 % (16 % в правом хвосте, что определяется как среднее плюс одно стандартное отклонение), либо меньше –8 % (16 % в левом хвосте, что определяется как среднее минус одно стандартное отклонение). Чтобы узнать вероятность доходности в 20 % и выше, сначала нужно преобразовать формулу:

Если цель равна 20 %, получаем

Период времени, на протяжении которого можно достичь этой цели, совпадает с периодом данных, используемым для расчета стандартного отклонения, т. е. составляет 50 лет.
Выбор между плотностью распределения и стандартным отклонением
Плотность распределения важна, поскольку стандартное отклонение не работает в случае асимметричных распределений, наиболее характерных для большинства ценовых данных на длительных периодах времени. Мы уже видели это на примере цен на пшеницу и золото, где среднее минус два стандартных отклонения было намного ниже реалистичной минимальной цены. Плотность распределения дает более полезную картину. Если бы мы захотели, основываясь на плотности распределения, узнать цену на 10 %– и 90 %-ном уровнях вероятности, то нам нужно было бы рассортировать все данные от минимума до максимума. При наличии 300 точек данных 10 %-ный уровень находился бы в точке 30, а 90 %-ный уровень – в точке 271. Медианная цена располагалась бы в точке 151. Это показано на рис. 2.10 для цен на пшеницу.

Рис. 2.10. Отсечение 10 % от каждого конца плотности распределения. Из-за высокой плотности низких цен эта зона кажется узкой, в то время как менее плотные данные в области высоких цен зрительно занимают большее пространство
Измерение сходства
Многие читатели знакомы с концепцией корреляции – основной мерой сходства. Корреляция выводится из линейной регрессии, о чем мы подробно поговорим в главе 6 в разделе «Линейная корреляция».
t-статистика и степени свободыКогда в распределении используется меньше цен или сделок, можно ожидать, что форма кривой будет более блуждающей. Например, пик распределения может оказаться совсем немного выше, чем любой из хвостов. Чтобы измерить, насколько распределение выборки из меньшего множества близко к нормальному распределению, можно использовать t-статистику (ее также называют t-критерием Стьюдента). t-критерий рассчитывается в зависимости от степени свободы (df), которая равна n – 1, где n представляет собой размер выборки, т. е. количество цен, используемых в распределении.

Чем больше данных в выборке, тем надежнее результаты. Мы можем получить общее представление о форме распределения, взглянув на табл. 2.2, где указаны значения t, соответствующие верхним областям хвоста 0,10, 0,05, 0,025, 0,01 и 0,005. Таблица показывает, что по мере увеличения размера выборки n значение t приближается к величинам, характерным для нормальных значений стандартного отклонения в областях хвоста.
Необходимые значимые значения t можно найти с помощью Excel. Функция ТТЕСТ возвращает вероятность, связанную с тестом, а функция СТЬЮДРАСП возвращает левостороннее распределение хвоста. Другие функции, связанные с t-распределением, можно найти, набрав в строке поиска Excel запрос «T распределение». Значимые уровни здесь такие же, как и в других тестах, где 5 % обычно считается значимым, а 1 % (0,01) – высокозначимым.
Таблица 2.2. Значения t, соответствующие вероятности появления верхнего хвоста 0,025

Степени свободы зависят от правил и переменных в вашей стратегии. Когда вы тестируете торговую систему, бо́льшая степень свободы означает, что необходимо больше данных для валидации стратегии. Это могут быть ценовые данные или количество сделок. T-тест – самый распространенный способ узнать, достаточно ли вы сделали.
t-критерий для двух выборок
У вас может возникнуть необходимость сравнения двух периодов данных, чтобы решить, не произошло ли значительных изменений в поведении цены. Некоторые аналитики используют двухвыборочный t-критерий для устранения противоречивых данных, однако характеристики цен и экономические данные постоянно меняются в результате эволюционного процесса, и торговая система должна приспосабливаться к этим изменениям. Этот тест лучше всего применять к результатам торговли, когда нужно понять, насколько устойчиво работает стратегия.

где


var1 и var2 – дисперсия цен периодов 1 и 2;
n1 и n2 – количество цен в периодах 1 и 2,
а два сравниваемых периода являются взаимно исключающими.
Степени свободы df, необходимые для определения доверительных уровней, можно рассчитать, используя аппроксимацию Саттертвейта, где s – стандартное отклонение значений данных:

Используя t-критерий для определения стабильности прибылей и убытков, генерируемых торговой системой, замените элементы данных на чистую доходность каждой сделки, количество элементов данных количеством сделок и рассчитайте все остальные значения, используя торговую доходность, а не цены.
АвтокорреляцияСериальная корреляция, или автокорреляция, ищет постоянство в данных – что означает, что будущие данные можно предсказать на основе прошлых данных. Это может говорить о наличии трендов. Автокорреляцию можно легко найти, если поместить данные в столбец А электронной таблицы, а затем скопировать их в столбец B, сместив вниз на одну строку. Затем определяется корреляция столбцов A и B. Дополнительные корреляции можно рассчитать, смещая столбец B вниз на 2, 3 или 4 строки. Так можно обнаружить существование цикла.
Формальным способом нахождения автокорреляции является использование критерия Дарбина – Уотсона, позволяющего получить d-статистику. Этот подход измеряет изменение остатков (e), т. е. разность между N точек данных и их средним значением.

Величина d всегда находится между 0 и 4. Если d = 2, никакой автокорреляции нет. Если d существенно меньше 2, существует положительная автокорреляция, однако при d ниже 1 сходство остатков превышает разумный уровень. Чем больше d превышает 2, тем более отрицательной представляется автокорреляция.
Наличие положительной автокорреляции, или сериальной корреляции, означает, что существует хороший шанс на повторение рассматриваемых событий в будущем.
Нормализация риска и доходности
Чтобы сравнивать один метод торговли с другим, необходимо нормализовать как тесты, так и параметры, используемые для оценки. Если одна система имеет совокупную доходность 50 %, а другая 250 %, мы не можем определить, какая из них лучше, если не знаем продолжительности тестов и волатильности доходности или риска. Если 50 %-ная доходность была получена за один год, а 250 %-ная доходность более чем за 10 лет, то первая лучше. В то же время, если первая доходность ассоциируется с 10 %-ным риском в годовом исчислении, а вторая с 50 %-ным риском, то системы эквивалентны. Соотношение доходности и риска крайне важно для результативности, о чем мы поговорим в главе 21 «Тестирование систем». А пока важно лишь запомнить, что доходность и риск следует выражать в годовом исчислении или нормализовать иным образом, чтобы сравнения имели смысл.
Расчет доходностиВ простейшей форме однопериодная доходность r, или доходность за период владения, представляется как

Эта формула часто используется для расчета доходности для текущего года. Для фондового рынка, где цены меняются непрерывно, это можно записать как

где p0 – первоначальная цена, а p1 – цена после истечения одного периода. Эта формула не используется для фьючерсов, у которых данные с обратной корректировкой могут быть отрицательными. Для них есть формула:

В индустрии ценных бумаг часто предпочитают другой метод расчета с использованием натурального логарифма:

Оба метода имеют свои достоинства и недостатки. Чтобы различать эти два расчета, первый метод будем называть стандартным методом, а второй – логарифмическим методом. В этой книге по умолчанию используется первый метод, если не указано иное.
В примере, показанном в табл. 2.3 и охватывающем 22 дня, стандартная доходность находится в столбце D, а логарифмическая – в столбце E. Различия кажутся небольшими, но средние имеют значения 0,00350 и 0,00339. В этом месяце стандартная доходность оказывается больше на 3,3 %, но в следующем месяце ситуация может стать обратной. Чистая стоимость активов (net asset value – NAV), активно используемая в этой книге, представляет собой совокупную доходность за период и чаще всего начинается со значения NAV0 = 100.

Таблица 2.3. Расчет доходности и чистой стоимости активов на основе дневных прибылей и убытков

Сложные проценты – это самая могущественная сила во вселенной.
Альберт ЭйнштейнВ большинстве случаев лучше всего нормализовать доходность путем ее приведения к годовому исчислению. Это особенно полезно при сравнении результатов двух тестов, когда каждый охватывает свой период времени. При приведении к годовому исчислению важно знать, что:
● к правительственным инструментам применяется годовая база, равная 360 дням (на основе 90-дневных кварталов);
● для большинства других данных, которые могут изменяться ежедневно, характерна годовая база 365 дней, включая выходные дни;
● торговую доходность лучше рассчитывать на основе 252-дневной годовой базы, это типичная продолжительность торгового года в США, в Европе чуть меньше. В этой книге используется годовая база в 252 дня.
Доходность в годовом исчислении (annualized rate of return – AROR) на основе простого процента для инвестиции в течение n дней равна

где E0 – начальный капитал или остаток на счете, En – капитал в конце периода n, а 252/n – годовая база в виде десятичной дроби. Доходность в годовом исчислении на основе сложного процента равна

Обратите внимание, что AROR или R (капитал) является значением в годовом исчислении, а r – это дневная или однопериодная доходность. Кроме того, форма представления результатов в этих двух расчетах разная. В случае простой доходности увеличение на 25 % выглядит как 0,25, а в случае сложной доходности такой же прирост записывается как 1,25.
Если к однопериодной доходности применить логарифмический метод, то доходность в годовом исчислении будет равна сумме доходностей, деленной на количество лет:

Пример этого можно найти в строке AROR столбца F предыдущей таблицы. Обратите внимание на то, что при использовании логарифмического метода доходность в годовом исчислении оказывается намного ниже, чем при использовании деления и сложных процентов. В настоящей книге везде используется сложная доходность, которая подлежит раскрытию в США.
Вероятность доходности с использованием сложного процента
Вероятность достижения целевой доходности можно оценить с помощью стандартного отклонения и сложной ставки доходности. В следующем расчете[1] среднее арифметическое непрерывной доходности равно ln(1 + Rg), при этом предполагается, что доходность имеет нормальное распределение.

где z – нормализованная переменная (вероятность);
T – целевое значение, или целевая доходность;
B – начальная стоимость инвестиции;
Rg – среднее геометрическое периодической доходности;
n – количество периодов;
s – стандартное отклонение логарифмов количеств 1 плюс периодическая доходность.
Риск и волатильностьХотя думать о доходности всегда приятно, не следует забывать об оценке риска. В связи с этим следует упомянуть о двух экстремальных рисках. Первым из них является событийный риск, который может принимать форму непредсказуемого скачка цен. Худший его вариант – катастрофический риск, приносящий непоправимый ущерб или крах. Второй риск связан с чрезмерным использованием заемных средств, или левериджа в портфеле, что приводит к краху в случае череды неудачных сделок. Риски, связанные со скачками цен и левериджем, подробно описываются в последующих главах.
Измерение нормального риска имеет важнейшее значение для сравнения результативности двух систем. Оно применимо к любому ряду доходностей, включая доходность всего портфеля, для сравнения его с ориентиром, таким как доходность S&P 500 или какого-нибудь облигационного фонда. Самым распространенным методом оценки риска является стандартное отклонение (σ) доходности (r), о чем рассказывалось в этой главе ранее. Приведение риска к годовому исчислению позволяет применять его к годовой доходности:

Риск также называют волатильностью. Когда мы говорим о целевой волатильности портфеля, то имеем в виду процент риска, представленный одним стандартным отклонением доходности в годовом исчислении. Например, в предыдущей таблице в столбце D показаны дневные доходности. Стандартное отклонение этих доходностей показано в строке «Стд. откл.» и составляет 0,01512. Это означает, что существует 68 %-ная вероятность, что дневная доходность или убыточность будет меньше 1,862 % и больше 1,162 % (среднее ± 1 стандартное отклонение). Однако целевая волатильность всегда соотносится с годовым риском, и, чтобы преобразовать дневную доходность в годовую, мы просто умножим ее на

Бета (β) обычно используется в индустрии ценных бумаг для выражения взаимосвязи риска отдельного рынка с индексом или портфелем. Если бета равна нулю, никакой взаимосвязи нет. Если она положительна, она представляет относительную волатильность данного рынка по сравнению с индексом. А именно,
0 < β < 1 – волатильность отдельного рынка меньше, чем у индекса;
β = 1 – волатильность отдельного рынка такая же, как у индекса;
β > 1 – волатильность отдельного рынка больше, чем у индекса;
β < 0 – рынок и индекс движутся в противоположных направлениях.
Бета 1,25 означает, что волатильность данной акции на 25 % больше, чем у индекса, а также то, что, если индекс вырастет на 4 %, акция – на 5 %.
Чтобы найти бету, надо рассчитать линейную регрессию отдельного рынка по индексу. Она равна наклону отдельного рынка, деленному на наклон индекса. Дополнительная величина альфа является свободным членом решения. Результат можно получить, используя Excel, подробное описание см. в главе 6. Общая формула беты выглядит так:

где A – отдельный рынок, а B – портфель или индекс. Надежность беты выше, когда корреляция доходностей А и В высокая.
Риск убыткаПоскольку стандартное отклонение симметрично, появление любого ряда скачков в прибыли интерпретируется как увеличение риска. Некоторые аналитики полагают, что правильнее измерять риск, ограничиваясь только случаями просадки. Использование одних только убытков называют нижними частичными моментами, где нижние означает риск снижения доходности, а частичные означает, что используется только одна сторона распределения доходности. Легче всего увидеть это на примере полудисперсии, которая измеряет дисперсию, находящуюся ниже среднего или некоторого целевого значения,

Однако чаще всего для определения риска убытков используются дневные просадки, т. е. разница между пиковой величиной капитала и его текущим значением, когда второе оказывается меньше первого. Например, если в день t капитал системы вырос до $25 000, а затем был получен дневной убыток $500, за которым последовал еще один убыток $250, у нас будет два входных значения, 500/25 000 и 750/25 000, или 0,02 и 0,03. В этом расчете используются только те прибыли, которые ниже непосредственно предшествующих им пиков. Лучшая альтернатива – рассчитать стандартное отклонение этих дневных просадок, что также позволит вам определить вероятность такой просадки.
Использование одних лишь просадок для предсказания других просадок влечет за собой проблему, которая состоит в том, что такой расчет ограничивает количество рассматриваемых случаев и отбрасывает вероятность влияния прибыли выше нормальной на повышение общего уровня риска. В ситуациях, когда количество данных в тестах ограничено, использование совокупности прибылей и убытков дает более надежные результаты.
Полное описание методов измерения результатов можно найти в главе 21 «Тестирование систем», а также в разделах главы 23 «Измерение доходности и риска» и «Индекс язвы».
Индекс
Индексы предназначены для того, чтобы обобщать индивидуальные особенности. При этом данные часто сглаживаются, чтобы извлечь из них полезную информацию. В последние годы индексы завоевали огромную популярность. Если в начале 1980-х гг. на фьючерсных рынках торговались лишь Value Line и S&P 500, то теперь существуют фьючерсные контракты на фондовые индексы, представляющие рынки любой промышленно развитой страны. Создание фондов, таких как SPDR (прозванных «спайдерами», S&P 500 ETF SPY), Diamonds (DIA, на основе промышленных индексов Dow Jones) и Qs (QQQ, на основе NASDAQ 100), дало трейдерам эффективный инструмент для инвестирования в широкий рынок вместо отдельных акций. Отраслевые секторы, такие как фармацевтика, здравоохранение и технологии, поначалу были представлены только взаимными фондами, а теперь и ETF. Все эти индексные рынки имеют дополнительное преимущество, заключающееся в том, что на них нет ограничений в виде необходимости заимствовать акции для короткой продажи или правила «плюс тик» (если его восстановят), требующего совершения коротких продаж только на росте цены.
Индексные рынки позволяют как индивидуальным, так и институциональным участникам осуществлять ряд специализированных инвестиционных стратегий. Они могут покупать и продавать широкий рынок, могут переключаться с одного сектора на другой (ротация секторов) или продавать переоцененный сектор, покупая широкий рыночный индекс (статистический арбитраж). Институты находят очень желательным, с точки зрения и затрат, и налогов, временно хеджировать свои портфели активов, продавая фьючерсы на S&P 500 вместо того, чтобы ликвидировать позиции в акциях. Они могут также хеджироваться, используя опционы на фьючерсы S&P или SPY. Индекс упрощает процесс принятия решений в торговле.