| | 08.09.2021



Национальная лаборатория сильных штормов Чака Досвелла и Гарольда Брукса,

Норман, Оклахома

1. С чего начать

Как делать вероятностныепрогнозы? Что ж, было бы так же справедливо спросить, как делать категоричныепрогнозы? Начнем с разницы между ними. В метеорологическом прогнозировании категориальный прогноз имеет только две вероятности: ноль и единицу (или 0 и 100 процентов). Таким образом, даже то, что мы называем категориальным прогнозом, можно рассматривать в терминах двух различных вероятностей; такой прогноз можно назвать дихотомическим. С другой стороны, традиционная интерпретация вероятностного

Рис. 0. Схема, показывающая различные типы неопределенности, связанные с прогнозированием некоторой величины Q. «Категориальный» прогноз подразумевает 100% вероятность того, что Q принимает конкретное значение, тогда как другие иллюстрируют различные виды распределений вероятностей.

прогноз - это прогноз с более чем двумя категориями вероятности; такой прогноз можно назвать полихотомическим, чтобы отличить его от дихотомических прогнозов. Дихотомическое прогнозирование подразумевает постоянную уверенность: 100 процентов. Синоптик подразумевает, что он или она на 100 процентов уверен, что событие произойдет (или не произойдет) в прогнозируемой области в течение периода прогноза, что дневная высокая температура будет точно 82F, ветер будет постоянно и точно с на северо-восток со скоростью 8 миль в час и т. д. Это то, что вы действительно чувствуете при прогнозировании? Подумай об этом.

Предположим, в качестве аргумента, что вы прогнозируете некоторую величину Q в какой-то момент. Это может быть температура, осадки и т. Д. Существуют различные варианты, кроме стандартного подхода к угадыванию значения Q. Вероятностные прогнозы могут иметь самые разные структуры. Как показано на рис. 0, можно было бы спрогнозировать Q как распределение вероятностей. [С учетом ограничения, что площадь под распределением всегда суммируется до единицы (или 100 процентов), что несделано для схематического рисунка.] Распределение может быть узким, когда человек относительно уверен в определенной Q-величине, или широким, когда его уверенность относительно низка. Он может быть искажен таким образом, что значения на одной стороне центрального пика более вероятны, чем значения на другой стороне, или даже может быть бимодальным [как с сильным квазистационарным фронтом поблизости при прогнозировании температуры]. Возможно, можно будет делать вероятностные прогнозы прохождения определенных важных пороговых значений Q. Вероятностные прогнозы не обязательно должны выглядеть как PoP! При прогнозировании для области вполне вероятно, что вероятности прогноза могут варьироваться от места к месту, даже в пределах одного мегаполиса. Эта информация может быть очень полезной для прогнозирования клиентов, не так ли?

Если прогноздихотомический или полихотомический, как насчет событий,которые мы пытаемся спрогнозировать? В каком-то смысле многие прогнозируемые события дихотомичны: либо шел дождь, либо его не было, был град или его не было, снегопад накапливался или не накапливался до 4 дюймов, замерз или нет, и так далее. С другой стороны, исход события может быть полихотомическим: наблюдаемая высокая температура почти в любом месте на планете будет падать где-то в диапазоне от -100F до + 120F (с шагом в один градус F), измеряемое количество осадков может быть больше 0,01 дюйма (с шагом 0,01 дюйма), направление ветра может быть от любого направления по компасу (обычно с шагом примерно 5 градусов от 0 до 355 градусов) и т. д.

Если мы составляем таблицу прогнозов и наблюдаемых событий, такая таблица называется таблицей непредвиденных обстоятельств. В случае дихотомических прогнозов и дихотомических событий это простая таблица 2 x 2:

Наступлению события присваивается значение, равное единице, а отсутствию события присваивается значение, равное нулю; для этих дихотомических прогнозов они также принимают значения единицы и нуля.

Если у нас есть полихотомические прогнозы (как в PoP с, скажем, m категориями вероятности) и событие дихотомично (лил измеримый дождь или нет), тогда таблица будет mx 2. Если событие также полихотомическое ( с, скажем, k категориями) таблица имеет размер mx k. Суммы на полях содержат информацию о распределении прогнозов и наблюдений по их категориям. Должно быть относительно легко увидеть, как таблица обобщается на полихомотические прогнозы и / или события. В этой таблице содержится много информации о том, насколько хорошо выполняются прогнозы (т. Е. О проверке прогнозов). Посмотреть на верификацию отложим на потом.

2. Вероятность как правильный язык прогнозирования.

Подумайте, как выделаете прогноз. Внутренний разговор, который вы ведете с самим собой, глядя на карты погоды, практически всегда включает вероятностные концепции. Неуверенность в том, что произойдет, вполне естественно. [1] И неуверенность усугубляется. Вы обнаруживаете, что говорите что-то вроде: «Если этот фронт сдвинется сюда в такое-то время, и если влажность определенного значения окажется рядом с этим фронтом, то событие определенного характера более вероятно, чем если бы оно условия не возникают ". Это вызывает понятие условноговероятность. Условная вероятность определяется как вероятность одного события при условии, что произошло другое событие. Мы могли бы подумать о вероятности измеримого дождя (стандартное PoP), учитывая, что точка росы на поверхности достигает 55F или чего-то еще.

Обозначим вероятность буквой «p», чтобы вероятность события x была просто p (x). Если мы рассматриваем условную вероятность x, обусловленную событием y, обозначим это как p (x | y).

Есть много разных видов вероятности. Пример из учебника основан на некотором неотъемлемом свойстве системы, производящей событие; пример - подбрасывание монеты. Если пренебречь весьма маловероятным исходом падения монеты на край, это явно дихотомическое событие: монета приземляется либо головой вверх, либо хвостом вверх. Если принять объективную монету, вероятность выпадения орла или решки, очевидно, составляет 50 процентов. Каждый раз, когда мы подбрасываем монету, вероятность любого из этих результатов всегда составляет 50 процентов, независимо от того, сколько раз подбрасывалась монета. Если у нас есть цепочка из 10 решек, вероятность выпадения другой решки при следующем подбрасывании все еще составляет 50 процентов. Теперь частота любой данной последовательностиКоличество результатов может варьироваться в зависимости от конкретной последовательности, но если нас интересует только конкретный бросок, вероятность остается на уровне 50 процентов. Это подчеркивает тот факт, что существуют четко определенные законы для управления вероятностью, которые позволяют вычислить такие вещи, как вероятность конкретной последовательности результатов подбрасывания монеты. Эти законы вероятности можно найти практически в любом учебнике по предмету. Конечно, результаты могут быть полихотомическими; в случае подбрасывания правильного кубика вероятность того, что какая-либо конкретная грань кубика окажется сверху, явно равна 1/6 = 16,6666. процентов. И так далее. Эта классикапонятие вероятности возникает из рассматриваемой системы. Столь же очевидно, что это не относится к вероятностям метеорологического прогнозирования. Когда мы смотрим на реальные погодные системы и процессы, мы не имеем дела с геометрическими идеализациями.

Другая форма вероятности связана с понятием частотывозникновения событий. Чтобы проиллюстрировать это, мы можем вернуться к примеру с подбрасыванием монеты. Если подбрасывается настоящая монета, мы можем собирать данные о таких вещах, как частота выпадения орла и решки или частота определенных последовательностей орла и решки. Мы полагаем, что если мы подбросим честную монету достаточное количество раз, наблюдаемая частота должна стремиться к 50 процентам орла или решки, по крайней мере, в пределе, когда размер выборки становится большим. Кроме того, мы ожидаем, что последовательность, состоящая из 10 голов, будет гораздо менее вероятной, чем некоторая комбинация орлов и решек. Это та концепция, которую мы используем при прогнозировании вероятностей погоды? В общем, мы в это не верим. Хотя мы, конечно, используем аналоги в прогнозировании, каждая погодная система в основном отличается в большей или меньшей степени от любой другой погодной системы.Погода на каждом холодном фронте такая же, как на каждом другом холодном фронте? Скорее всего, не! Следовательно, если погодная система похожа на другую, с которой мы сталкивались в прошлом, мы можем подумать, что погода будет развиваться аналогичным образом, но только до определенной степени. Было бы крайне маловероятно, что в мельчайших деталях сложится точно такая же погода. Фактически, эта неопределенность способствовала развитию идей «хаоса» Эда Лоренца. Независимо от того, насколько похожи две погодные системы, в конечном итоге их эволюция расходится из-за небольших различий в их начальных состояниях до такой степени, что последующие события столь же непохожи, как если бы они начались с совершенно разных начальных условий. Эти идеи лежат в основе понятий «предсказуемость».тема, выходящая за рамки этого букваря.

Это подводит нас к еще одному типу вероятности, называемому субъективным.вероятность. Это может быть определено по-разному, но вид определения, который имеет наибольший смысл в контексте прогнозирования погоды, заключается в том, что субъективная вероятность конкретного погодного явления связана с неуверенностью синоптика в том, что это событие произойдет. Если оценка метеорологической ситуации очень сильно наводит на размышления о конкретном исходе, то прогноз вероятности этого события соответственно высок. Эта субъективная вероятность так же правомерна, как и вероятность, полученная из какого-либо другого процесса, например, только что описанные геометрические или частотные вероятности. Очевидно, что два разных прогнозиста могут прийти к совершенно разным субъективным вероятностям. Некоторые могут беспокоиться о том, верны ли их субъективно полученные вероятности.

3. Вероятностные прогнозы - правильные или неправильные?

Важным свойством вероятностных прогнозов является то, что отдельные прогнозы, использующие вероятность, не имеют такого четкого понимания «правильного» и «неправильного». То есть, если при прогнозе PoP в 10% идет дождь, этот прогноз верен или неверен? Интуитивно можно предположить, что дождь при 90-процентном PoP в некотором смысле «правильнее», чем дождь при 10-процентном прогнозе. Однако этот аспект вероятностного прогнозирования - лишь один из аспектов оценки эффективности прогнозов. Фактически, использование вероятностей исключает такую ​​простую оценку производительности, которую подразумевает понятие «правильно или неправильно». Это цена, которую платят за дополнительную гибкость и информативность использования вероятностных прогнозов. Таким образом, тот факт, что в любой прогнозируемый день,два прогнозиста приходят к разным субъективным вероятностям из одних и тех же данных не означает, что один прав, а другой нет! Это просто означает, что один более уверен в событии, чем другой. Все это позволяет количественно оценить различия между синоптиками.

Содержательная оценка производительности вероятностных прогнозов (т.е. верификация) основывается на имеющем ансамбльтаких прогнозов. Свойство иметь высокое количество точек присутствия в дни, когда идет дождь, и иметь низкие точки подключения в дни без дождя, является лишь одним аспектом полной оценки прогнозов. Другой важный аспект известен как надежность.: надежные прогнозы - это прогнозы, в которых наблюдаемая частота событий совпадает с вероятностями прогноза. Совершенно надежный прогнозист обнаружит, что дождь идет в 10% случаев, когда выдается 10-процентный прогноз PoP; дождь будет идти в 20% случаев, когда выдается прогноз PoP на 20%, и т. д. Такой набор прогнозов означает, что вполне приемлемо, чтобы дождь 10 раз из 100 прогнозов 10% PoP! Мы еще вернемся к проверке.

4. Теорема Байеса.

Теорема Байеса является важным инструментом в использовании условной вероятности и сформулирована следующим образом.

Теорема Байеса: если x1, x2,. , xm - m взаимоисключающих событий, одно из которых должно произойти в данном испытании, такое, что

и E - какое-то событие, для которого p (E) не равно нулю, то

Знаменатель - это просто p (E). Таким образом, это могло быть написано

который обеспечивает своего рода принцип симметрии для условных вероятностей; условная вероятность события xi для данного события E, умноженная на безусловную вероятность E, равна условной вероятности E при xi, умноженной на безусловную вероятность xi.

Если дихотомическое событие обозначено x, а отсутствие события обозначено, то

и отметим, что p (y) + p () = 1.0. Если y оказывается полихотомическим, так что существует m возможных значений y (и сумма вероятностей всех из них равна единице [2]), эту формулу можно расширить, чтобы сказать, что

который мы уже использовали в теореме Байеса.

А пока предположим, что мы имеем дело с дихотомическими событиями, поэтому мы можем использовать простую форму выше. Давайте рассмотрим, как это работает в случае наличия торнадо, обусловленного возникновением грозы. В обоих случаях события дихотомичны; торнадо либо случается, либо нет, гроза либо случается, либо нет. Для всех практических целей, чтобы иметь место торнадо, необходима гроза, что означает, что p (x |) = 0, что, в свою очередь, означает, что если нам даны отдельные вероятности безусловной вероятности грозы и условной вероятности Вероятность торнадо при наличии грозы, мы можем найти безусловную вероятность торнадо, просто составив произведение этих двух вероятностей.

5. Использование условных вероятностей

Мы все время бессознательно используем эту концепцию, чтобы прийти к нашим оценкам субъективной вероятности. Прогнозируемые нами события обусловлены целым рядом происходящих событий, ни одно из которых не является абсолютной достоверностью в подавляющем большинстве случаев. Следовательно, мы должны каким-то образом достичь уверенности в прогнозе, применяя теорему Байеса, возможно, бессознательно. Сознательное знание теоремы Байеса может оказаться полезным для тщательного получения количественных оценок вероятности. Вероятность тяжелогоГроза - это сначала гроза. Учитывая, что сейчас гроза, мы можем оценить, насколько мы уверены, что она будет сильной. Но вероятность грозы сама по себе обусловлена ​​другими факторами [3], а эти факторы, в свою очередь, обусловлены еще другими факторами. Каким-то образом наш разум способен объединить все эти факторы в субъективную оценку. При условии, что мы не нарушаем какие-либо известные законы вероятности (например, используя вероятность вне диапазона от нуля до единицы), эти в основном интуитивные оценки являются совершенно законными.

Конечно, мы хотели бы быть «правыми» в наших оценках вероятности, но мы уже видели, что это вводящая в заблуждение концепция при оценке того, насколько хорошо оценки работают. Нам действительно нужно собрать ансамбль прогнозов, прежде чем мы сможем сказать что-то ценное о наших субъективных оценках вероятности. При получении субъективных оценок нашей уверенности следует иметь в виду некоторые важные аспекты вероятностного прогнозирования. С определенной точки зрения [4] проверка наших прогнозов предполагает наличие информации о том, что произошло, когда мы опубликовали наши прогнозы. Другими словами, нам необходимо заполнить таблицу непредвиденных обстоятельств. Это может оказаться более сложной задачей, чем кажется на первый взгляд. Может существовать некоторая неуверенность в том, насколько точна наша проверочная информация;Для таких вещей, как сильные грозы и торнадо, есть много, много причин полагать, что наша текущая база данных, используемая для проверки, имеет серьезные недостатки во многих отношениях.

6. Прогнозы и определения событий.

В максимально возможной степени важно использовать в качестве проверочных данных те наблюдения, которые напрямую связаны с прогнозом. Другими словами, мы можем проверять прогнозы, только если можем наблюдать прогнозируемые события. Это может быть неприятной проблемой, и мы рассмотрим ее далее в ходе нашего обсуждения проверки. Например, проверка PoP требует измерения количества осадков; в частности, нужно только знать, было ли измерено, по крайней мере, 0,01 дюйма осадков. Но все не так просто; нужно также знать, как прогнозопределено. Когда публикуется прогноз PoP, применяется ли он только к отверстию диаметром 8 дюймов на официальном датчике дождя? Что на самом деле означает PoP в прогнозе? А какой период прогноза? Должно быть ясно, что вероятность данного события возрастает по мере увеличения произведения площади и времени, определяющей прогноз. Вероятность торнадо где-нибудь в Соединенных Штатах в течение всего года практически неотличима от 100 процентов. Однако вероятность наличия торнадо на данной квадратной миле в округе Хейл, штат Техас, между 17:00 CDT и 18:00 CDT 28 мая любого года довольно мала, определенно меньше одного. процентов. Следовательно, при оценке вероятности необходимо учитывать размер области и продолжительность периода прогноза.

Кроме того, мы упомянули округ Хейл, штат Техас, потому что в нем относительно высока вероятность торнадо в конце дня в конце мая. Если бы мы рассмотрели вероятность торнадо в пределах данной квадратной мили в округе Дюпейдж, штат Иллинойс, в период с 10:00 до 11:00 по центральному поясному времени в конце января любого года, эта вероятность была бы весьма незначительной. ниже, чем в примере с округом Хейл, возможно, на два порядка. Принимая решение о субъективной вероятности, зная климатологическую частотуявляется важной базой для построения сметы. Является ли конкретная метеорологическая ситуация в данный день такой, что уверенность в наличии события больше или меньше, чем у климатологии? Вполне возможно представить себе метеорологические ситуации, когда вероятность торнадо в пределах данной квадратной мили в округе Дюпейдж, штат Иллинойс, в период с 10:00 до 11:00 по центральному поясному времени в конце января на самом деле выше.чем торнадо в данной квадратной миле в округе Хейл, штат Техас, между 17:00 CDT и 18:00 CDT 28 мая. В какой-то степени погода ничего не знает о картах, часах и календарях. Таким образом, хотя знание климатологической повторяемости является важной частью установления уровней достоверности прогноза, климатология является только отправной точкой и не должна рассматриваться как обеспечивающая некую абсолютную границу субъективной оценки.

Полезно понимать, что вероятность прогноза, равная климатологической частоте, означает, что у вас нет информации, позволяющей делать прогноз, отличный от любой случайно выбранной ситуации. Климатологическая ценность - это прогноз «ничего не знающий»! Конечно, бывают случаи, когда вы просто не можетеразличить в ситуации что-либо, что позволило бы вам выбирать между климатологией и более высоким или более низким значением. В таком случае вполне приемлемо использовать соответствующее климатологическое значение (которое вполне может варьироваться в зависимости от местоположения, дня года и времени суток). Но вы должны понимать, что вы делаете и говорите о своей способности различать факторы, которые увеличивают или уменьшают вашу субъективную вероятность относительно климатологии.

Еще один важный фактор - время проецирования. При прочих равных условиях прогнозы, включающие более длительные прогнозы, имеют вероятность, близкую к климатологическим значениям, что является естественным следствием ограниченной предсказуемости. Прогноз на 48 часов сложнее, чем на 24 часа. Поскольку один прогнозирует достаточно далекое будущее, было бы разумно, чтобы субъективные вероятности сходились с климатологией на вашем субъективном пределе предсказуемости. Какова вероятность торнадо в пределах данной квадратной мили в округе Хейл в конкретную дату в конце мая следующего года с 17:00 до 18:00 по центральному тихоокеанскому времени? Почти наверняка лучший прогноз, который вы могли бы сделать, - это климатология.

В этом обсуждении важно помнить, что понятие пространственной и временной специфичности в значительной степени зависит от этих факторов. Мы ожидаем, что будем лучше оценивать вероятность для больших площадей, а не для малых, в течение длительного времени, а не короткого, и в целом для коротких прогнозов, а не для длинных прогнозов. Если у нас нет большой уверенности в нашей оценке метеорологии, мы не хотим иметь слишком высокую или низкую вероятность по сравнению с климатологией. Использование высоких вероятностей на обширной территории влечет за собой особое значение: события будут широко распространяться и относительно многочисленными в пределах этой области. Однако, если мы попытаемся быть слишком привязанными к пространству с этими высокими значениями, мы можем упустить фактическое местоположение событий; высокая вероятность может быть оправдана, но если мы не можем быть уверены в своей способности точно определитьтам, гдеэти высокие вероятности будут реализованы, тогда лучше распределить более низкие вероятности по широкой области.

Другое важное понятие вероятности состоит в том, что она определяется для некоторого конечного объема площади-времени, даже если площадь в некотором практическом смысле является просто точечным измерением (вспомните 8-дюймовый дождемер!). Однако можно представить себе точечный вероятностный прогноз как абстракцию. Какова связь между точечной и площадной оценками вероятности? Если установить в качестве условия, что __, то вероятность области можно рассматривать как площадное покрытие точечных событий в этой области. Если ливни составляют более 20 процентов прогнозируемой области, это эквивалентно средней вероятности 20 процентов для всех точек в области.

7. Очки, области и события

Предположим, у нас есть метеорологическое событие e, для которого мы прогнозируем. За период времени прогноза T у нас будет m таких событий, ei, i = 1,2,. , м. Если область прогноза обозначена A, то мы считаем вероятность одного или нескольких событий в A, pA, вероятностью области; то есть, что одно или несколько событий произойдут где-то внутри A. Как абстракция, A состоит из бесконечного числа точек с координатами (x, y). J-я точка задается (xj, yj). Если вероятность того, что одно или несколько событий произойдут в каждой точке, конечна, ясно, что pA не может быть простой суммой точечных вероятностей, поскольку эта сумма будет бесконечной (или может превышать единицу)!

Рассмотрим рис. 1. Предположим, что каждая «точка» области на самом деле представлена ​​конечным числом небольших подобластей Ak, k = 1,2,. , п. Эта небольшая подобласть представляет собой «размер зерна», с помощью которого мы выбираем для определения общей площади A, которая представляет собой простую сумму n подобластей. Зона покрытия

Рисунок 1. Схематическое изображение серии событий, когда они движутся через прогнозируемую область A в течение периода времени прогноза (от T0 до T6). Пути событий показаны по мере их формирования, увеличения размера к зрелости и распада, причем события показаны разным затемнением через равные промежутки времени, Tk, k = 0,1,. , 6. Также показана часть сетки подобластей Ai, которые определяют псевдоточки, как описано в тексте.

События в течение периода прогноза - это просто та часть области, на которой фактически происходит одно или несколько событий в течение периода прогноза, C. Математически, если n '- количество подобластей, в которых событие наблюдается в течение периода, тогда

где суммирование ведется только по затронутым подобластям, а символ «» обозначает пересечение. В любой момент каждое из текущих событий охватывает только часть общей площади, затронутой событиями в течение времени T.

Покрытие прогнозируемой зоны C f- это та часть площади, которая, по нашему прогнозу, будет затронута. Прежде всего, это неозначает, что мы должны предсказать, в какойиз подобластей произойдет одно или несколько событий. Он просто представляет нашу оценку того, каким будет частичное покрытие. Во-вторых, это явно условный прогноз, обусловленный тем, действительно ли хотя бы одно событие происходит в A во время T. Если никакое событие не материализуется, это покрытие прогноза не имеет никакого значения.

Средняя вероятность по области A определяется выражением

где pi - вероятности одного или нескольких событий в течение времени T в i-й подобласти Ai. Предполагается, что вероятность одинакова в пределах подобласти. Если по какой-то причине подобласти различаются по размеру, тогда каждое значение вероятности должно быть взвешено по площади, а сумма должна быть разделена на общую площадь. Должно быть очевидно, что области, связанные с подобластями («псевдоточки»), должны быть достаточно маленькими, чтобы к каждой можно было применить одно значение вероятности. Если эти вероятности псевдоточек определены на относительно плотном регулярном массиве (например, сетке «MDR»), то эти детали, как правило, позаботятся сами о себе.

Легко показать, что

где важно отметить, что покрытие - это прогнозируемаязона покрытия. Поскольку ожидаемое покрытие всегда меньше или равно единице, это означает, что средняявероятность псевдоточки всегда меньше или равна вероятности области. Но обратите внимание на это с апостериорнойточки зрения, наблюдаемоепокрытие площади. То есть средняя вероятность точки в пределах области A может быть интерпретирована с точки зрения покрытия области. Тем не менее, это не очень полезно для прогнозиста, поскольку для этого требуется знание зоны покрытия до того, как событие произойдет (если событие вообще произойдет)!

8. Составление вероятностных прогнозов.

Существует по крайней мере три различных типа вероятностных прогнозов, которые вам могут потребоваться сделать: 1) точечные вероятности, 2) вероятности площадей и 3) контуры вероятностей. Первые два - это просто числа вероятности. Прогнозы PoP, безусловно, наиболее известные вероятностные прогнозы, обычно связаны со средней вероятностью точки (что подразумевает связь с вероятностью области и охватом области, как упоминалось выше). Их проверка обычно включает в себя количество осадков на конкретном дождемере и включает концепции, разработанные выше.

Хотя это не является общеизвестным, прогноз SELS в основном также представляет собой среднюю точечную вероятность, официально связанную с прогнозируемым охватом зоны суровых погодных явлений. Если у кого-то есть категории риска «низкий, средний и высокий», они официально определяются с точки зрения прогнозируемой плотности суровых погодных явлений в районе или прогнозируемого покрытия зоны (C f). Это включает в себя как среднюю вероятность точки, так и вероятность области, как мы показали выше.

Многие синоптики видят изолинии вероятности, связанные с TDL-грозой и навигационными продуктами для сильной грозы. Они были получены с использованием методов регрессии скрининга по различным параметрам прогнозирования и применены к событиям, определенным в сетке MDR. Параметры предсказателя могут включать такие факторы, как климатология и наблюдения, а также параметры прогноза модели.

Существуют и другие прогнозы наведения TDL, включая точечные точки входа для определенных станций, контурные точки входа и другие. В то время как большинство прогнозистов хотя бы поверхностно знакомы с PoP (несмотря на множество заблуждений), похоже, что большинство из них практически не имеют опыта работы с контурами вероятности. Таким образом, мы хотим дать по крайней мере несколько советов и указателей, которые помогут избежать некоторых из наиболее вопиющих проблем. Большинство из них основаны на уже представленных материалах и поэтому являются очень простыми. Невозможно упростить прогнозирование, но мы надеемся, что это избавит от некоторых опасений, связанных с незнанием.

Предположительно, когда вы начинаете обдумывать задачу, вы каким-то образом формируете интуитивное ощущение вероятности какого-то события в течение вашего прогнозного периода. Предположим, ваши первые мысли по этому поводу выглядят примерно так, как на рис.2.

Рисунок 2. Схема, показывающая изолинии вероятности первоначального прогноза.

Однако тогда вы считаете, что прогнозируете довольно высокую вероятность события на довольно большой территории. Реалистично ли думать, что по крайней мере 80 процентов псевдоточек внутри вашего 80-процентного контура будут испытывать одно или несколько событий в течение прогнозируемого периода? [5] Возможно, нет. Хорошо, тогда вы решаете, что знаете достаточно, чтобы довольно хорошо определить местность. Тогда ваш прогноз может быть больше похож на рис.

Рисунок 3. Второй этап вероятностного прогнозирования.

Теперь ты действительно забеспокоился. Климатологическая повторяемость этого явления составляет около 5 процентов в указанном вами регионе. Вы полагаете, что метеорологическая ситуация требует значительного увеличения климатологической частоты, но уверены ли вы, что шансы столь же высоки при 18-кратной климатологической частоте? Обратите внимание, что 18 x 5 = 90, что будет вероятностью пика, которую вы первоначально оценили внутри вашего 80-процентного контура. Это может показаться вам довольно высоким. Возможно, вы решили, что самые высокие шансы на событие в точке в пределах домена примерно в 7 раз выше климатологии. И у вас могут возникнуть сомнения относительно того, насколько хорошо вы можете точно определить область? Возможно, было бы лучше сократить число вероятностей и увеличить площадь, чтобы отразить вашу географическую неопределенность.Третий этап вашей оценки может быть больше похож на рис. 4.

Рисунок 4. Третий этап вероятностного прогнозирования.

Если окажется, что вы прогнозируете событие, для которого TDL создает контурную диаграмму вероятности, вам повезло. при условии, что ваше определение прогноза и события совпадает с определением графика TDL. В этой замечательной ситуации диаграмма TDL дает вам объективную, квазинезависимую оценку вероятностей, которую вы можете использовать либо в качестве отправной точки, либо в качестве проверки своей оценки (в зависимости от того, смотрите ли вы на нее до или после собственный взгляд на ситуацию, ведущую к вашему первоначальному предположению о контурах). Для многих прогнозных продуктов вам не повезет; либо определение события, либо определение прогноза не будут такими же, как то, которое используется TDL для создания своей диаграммы. Однако вы все равно можете использовать это руководство TDL, если оно каким-то образом связано с вашим прогнозом,возможно, как оценка вероятности некоторого события, аналогичного вашему прогнозируемому событию, или, возможно, как некоторое связанное событие, которое может быть использовано для определения вашего прогноза вашего события.

9. Контуры условной вероятности

Теперь, когда вы построили контуры вероятности, вам нужно подумать о том, как использовать и интерпретировать контуры условной вероятности. Обратите внимание, что некоторые из продуктов сильной грозы TDL включают условные вероятности. Их не обязательно следует рассматривать в каком-то определенном порядке, но предположим, что вы создали что-то вроде рис. 5.

Рисунок 5. Схема, показывающая контуры условной вероятности (заштрихованы), p (x | y), и контуры безусловной вероятности обусловливающего события (закрашены), p (y).

На этом рисунке относительно высокие изолинии p (x | y) простираются до северо-запада США, где значения p (y) относительно низкие. Это означает, что обусловливающее событие относительно маловероятно, но если оно все же произойдет, шансы на событие x относительно высоки. Это дает полезную информацию, например, в ситуациях, когда x = сильная гроза, а y = гроза. Метеорологические факторы, связанные с условным событием y, могут сильно отличаться от тех, которые влияют на первичное событие x, учитывая обусловливающее событие. Возможна и обратная ситуация, когда p (y) высокое, а p (x | y) низкое. При желании можно произвести умножение и очертить соответствующие безусловные вероятности p (x). Это может оказаться полезным, а может и не оказаться полезным, в зависимости от прогноза.

10. Проверка

Эта тема может быть причиной изжоги. Мы собираемся рассматривать проверку вероятностных прогнозов и не рассматривать проверку дихотомических прогнозов (последний из которых, по нашему мнению, является менее чем удовлетворительным подходом для метеорологов).

Если предположить, что мы решили делать вероятностные прогнозы, то одним из первых вопросов, на которых нам придется остановиться, являются категориивероятности . Сколько категорий мы хотим использовать и какое обоснование должно быть использовано при принятии решения о том, как определять эти категории. Следует учитывать несколько моментов:

1. Какова климатологическая повторяемость рассматриваемого явления? Хотим ли мы примерно одинаковое количество категорий выше и ниже климатологической повторяемости?

2. Какова максимальная и минимальная практическая вероятность события? Очевидно, если бы кто-то точно знал, когда и где что-то произойдет, имело бы смысл прогнозировать только ноль и единицу для вероятностей. Этот дихотомический идеал практически невозможно достичь, поэтому мы в первую очередь используем вероятность, так что же практического с точки зрения того, насколько мы когда-либо можем быть уверены?

3. Хотим ли мы, чтобы частота прогнозов была примерно постоянной для всех категорий?

4. Учитывая, что количество категорий определяет "разрешение" нашего прогноза, какое разрешение, по нашему мнению, мы можем достичь? А какое разрешение практичное? Сможем ли мы создать карты вероятности достаточно быстро, чтобы уложиться в сроки?

5. Правильно ли наши категории передают пользователям нашу неуверенность? Это может быть серьезной проблемой для редких событий, таких как торнадо. Климатологическая частота может быть настолько низкой, что реальная вероятность кажется неискушенным пользователем весьма маловероятной, даже если вероятность во много раз выше, чем у климатологии. Есть ли способ выразить вероятности, чтобы избежать такой путаницы?

Вполне могут быть и другие проблемы. Предположим, что мы каким-то образом пришли к удовлетворительному набору вероятностных категорий, скажем, f1, f2,. fk. Далее, давайте предположим, что нам удалось сопоставить наши прогнозы с наблюдениями, так что у нас нет конфликта между определением прогноза и определением события. Для простоты мы будем рассматривать только возникновение и ненаступление наблюдаемого нами события; т.е. наблюдения дихотомичны. Таким образом, мы имеем таблицу непредвиденных обстоятельств kx 2:

В этой таблице содержится много информации! Фактически, Мерфи утверждает, что он содержит всюне зависящую от времени информацию [6], которую мы знаем о нашей проверке. Обычно оценка прогнозов выражается в виде ограниченного набора показателей или контрольных баллов. Этот ограниченный набор чисел обычно не начинает отражать общее содержание таблицы непредвиденных обстоятельств. Поэтому Аллан Мерфи (и другие, включая нас) продвигает ориентированную на дистрибутивы проверку, которая не сводит содержимое таблицы к небольшому набору мер. Мерфи описал сложность и размерность проблемы проверки, и важно отметить, что единичная мера - это в лучшем случае одномерное рассмотрение, тогда как реальная проблема может быть в значительной степени многомерной.

Это не форум для полного объяснения предложений Мерфи по проверке. Заинтересованный читатель должен ознакомиться с соответствующими подробностями в библиографии. Здесь мы хотим подчеркнуть, что любая проверка, сводящая проблему к одному показателю (или ограниченному набору мер), не является особенно полезной системой проверки. Чтобы провести аналогию со спортом, предположим, что у вас есть бейсбольная команда и по какой-то причине вы рассматриваете возможность обмена одного игрока, и опять же по какой-то причине вы должны выбирать только между двумя игроками, каждый из которых был в лиге 7 лет . У игрока R средний показатель за всю жизнь 0,337 и он делает 100 пробежек в год, потому что он часто находится на базе, но в среднем только 5 хоум-ранов в год и 65 пробежек с ватином. У игрока K средний показатель за всю жизнь 0,235 и 65 пробегов в год ,но в среднем он совершает 40 хоум-ранов в год и имеет 100 забегов, потому что он бьет с силой, когда он бьет. Какой из них наиболее ценен для команды? Любители бейсбола (многие из которых являются статистиками-любителями) любят придумывать различные меры «ценности игрока», но мы считаем, что это рискованное занятие. Каждый игрок вносит свой вклад в команду по-разному, и непросто определить общую ценность (даже игнорируя такие факторы, как командный дух и т. Д.), Используя только одну меру. Точно так же простой просмотр прогнозов с помощью одной меры может привести к неправильным представлениям о том, как работают прогнозы. По одним меркам у них может быть хорошо, а по другим - плохо.Какой из них наиболее ценен для команды? Любители бейсбола (многие из которых являются статистиками-любителями) любят придумывать различные меры «ценности игрока», но мы считаем, что это рискованное занятие. Каждый игрок вносит свой вклад в команду по-разному, и непросто определить общую ценность (даже игнорируя такие факторы, как командный дух и т. Д.), Используя всего лишь одну меру. Точно так же простой просмотр прогнозов с помощью единственной меры может привести к неправильным представлениям о том, как работают прогнозы. По одним меркам они могут преуспевать, а по другим - плохо.Какой из них наиболее ценен для команды? Любители бейсбола (многие из которых являются статистиками-любителями) любят придумывать различные меры «ценности игрока», но мы считаем, что это рискованное занятие. Каждый игрок вносит свой вклад в команду по-разному, и непросто определить общую ценность (даже игнорируя такие факторы, как командный дух и т. Д.), Используя только одну меру. Точно так же простой просмотр прогнозов с помощью единственной меры может привести к неправильным представлениям о том, как работают прогнозы. По одним меркам они могут преуспевать, а по другим - плохо.и непросто определить общую ценность (даже игнорируя непредвиденные факторы, такие как командный дух и т. д.), используя всего лишь одну меру. Точно так же простой просмотр прогнозов с помощью единственной меры может привести к неправильным представлениям о том, как работают прогнозы. По одним меркам у них может быть хорошо, а по другим - плохо.и непросто определить общую ценность (даже игнорируя непредвиденные факторы, такие как командный дух и т. д.), используя всего лишь одну меру. Точно так же простой просмотр прогнозов с помощью одной меры может привести к неправильным представлениям о том, как работают прогнозы. По одним меркам они могут преуспевать, а по другим - плохо.

Как уже отмечалось, наша стандартная точка зрения на прогнозирование заключается в том, что мы, как прогнозисты, часто хотим знать, что на самом деле произошло, учитывая прогноз. Эта точка зрения может быть выражена в терминах p (x | f), где теперь значения p (x | f) выводятся из записей в таблице непредвиденных обстоятельств как частоты. [Обратите внимание, что эти вероятности отличаются от наших категорий вероятностей,которые являются прогнозами.] Таким образом, например, p (x = yes (1) | f = fi) просто ni1 / n.1. После этого таблица может быть преобразована в

Эти предельные суммы соответствуют периодичности прогнозов в каждой категории прогнозов; в рассмотренном выше смысле (в разделе 2) их можно рассматривать как вероятностипрогноза, fi = p (fi).

Однако есть и другая интересная точка зрения; а именно p (f | x), вероятность прогноза с учетом событий. Это мнение умного пользователя, которому может быть полезно знать, что вы, вероятно, прогнозируете, когда произойдет событие, по сравнению с тем, что вы, вероятно, прогнозируете, когда событие не произойдет. Это можно интерпретировать как «калибровку» прогнозов пользователем, но это также точка зрения, представляющая интерес для прогнозиста. В этом случае таблица может быть преобразована в

Обратите внимание, что x = x1 подразумевает «да» или значение, равное единице, а x = x2 подразумевает «нет» или значение, равное нулю. Эти последние предельные суммы соответствуют частоте событий и отсутствия событий соответственно; как мы только что видели с точки зрения p (x | f), их можно рассматривать как вероятностинаблюдаемых событий, [phi] i = p (xi).

С таблицами непредвиденных обстоятельств можно сделать многое, особенно если мы хотим взглянуть на эти две разные точки зрения (которые соответствуют тому, что Мерфи называет «факторизациями»). Библиография - это место, где можно найти кровавые подробности; однако прогнозисты, которые беспокоятся о своих субъективных вероятностях, могут получить много информации из двух различных факторизаций информации таблицы непредвиденных обстоятельств. Если они рассмотрят предельное распределение своих прогнозов относительно наблюдений, они смогут увидеть, нуждаются ли их прогнозы в «калибровке». Вполне вероятно, что прогнозисты будут делать различные типы ошибок при оценке субъективных вероятностей, и информация в этих таблицах является лучшим источником для отдельного прогнозиста, чтобы оценить, как улучшить свои оценки субъективной вероятности.Знание совместного распределения прогнозов и событий - лучший механизм для корректировки своих субъективных вероятностей.

11. Замыкание цикла

Какими бы эффективными ни были прогнозы, все, что не является идеальным, оставляет место для улучшения. Достаточно полная проверка дает прогнозистам возможность вернуться назад и пересмотреть конкретные ошибки прогнозов. И успехи тоже могут нуждаться в пересмотре. По сути, основная ценность упражнений по проверке заключается в возможности улучшения прогнозов. Предоставление прогнозистам обратной связи об их работе важно, но на этом история определенно не должна заканчиваться. Если есть метеорологические данные, которые можно было бы использовать для составления более точных прогнозов, они, скорее всего, будут обнаружены путем тщательного пересмотра «провалов» прогнозов и, возможно, в меньшей степени, успешных прогнозов.Если эта важная метеорологическая оценка в конечном итоге не является результатом в первую очередь статистической проверки, то ценность статистической проверки существенно снижается. Время и ресурсы должны быть потрачены на проверку, но тогда цель должна состоять в том, чтобы выполнить тяжелую работу по «замыканию петли», углубившись в метеорологические причины успеха и неудачи в отдельные дни.

Мы сказали, что вы ожидаете дождя примерно в 10 процентах случаев, когда вы прогнозируете 10-процентную вероятность дождя. И, наоборот, вы ожидаете, что дождь не пойдет примерно в 10 процентах случаев, когда вы прогнозируете вероятность 90 процентов. Однако чем больше отклонение прогнозов от наблюдений, тем больше вам следует беспокоиться; Отличнопрогнозы действительно категоричны. Неопределенность лежит в основе использования вероятностей, но это не означает, что индивидуальные ошибки прогноза не вызывают никакого беспокойства. В конце концов, когда идет дождь с 10-процентной вероятностью, разница между прогнозом и наблюдением составляет 0,1-1,0 = -0,9; и когда не идет дождь при 90-процентном прогнозе, разница между прогнозом и наблюдением составляет 0,9-0,0 = +0,9. Это означает существенный вклад в RMSE, как бы вы его ни нарезали. Таким образом, было бы не в ваших интересах, скажем, намеренно выдавать 10-процентный прогноз, когда вы думали, что вероятность составляет 90 процентов, просто чтобы увеличить количество дождей в вашей 10-процентной категории, потому что частота дождя в вашей 10-процентная корзина в настоящее время была меньше 10 процентов! Будем надеяться, что такие большие ошибки случаются редко,и вполне возможно вернуться назад и выяснить, есть ли в метеорологии какая-либо информация, которая могла бы уменьшить большую ошибку, связанную с этим человеком.

Естественно, здесь возникает тема «хеджирования». Некоторые могут интерпретировать вероятностный прогноз как хеджирование, и это не является необоснованной позицией, по крайней мере, с некоторых точек зрения. Однако то, что мыозабочены «хеджированием» при проверке - это тенденция отклоняться от здравого смысла прогнозиста в ошибочных усилиях по улучшению показателей проверки. Только что приведенный пример - как раз такая глупая попытка; хотя это может улучшить оценку «надежности» (возможно), это также приведет к увеличению RMSE и других показателей, что в целом ухудшит результаты. В так называемой «строго правильной» системе проверки прогнозист получает свои наилучшие результаты проверки при составлении прогноза, равного его или ее наилучшей оценке. Многие синоптики считают, что в любую систему верификации можно «поиграть» для достижения оптимальных результатов. если так поступает прогнозист, то единственный реальный проигравший - прогнозист,потому что тогда выгоды для прогнозиста, связанные с проверкой, будут потеряны. Действительно, можно хеджировать прогнозы таким образом, даже при строго правильной системе оценок, но когда оценка строго правильная, легко показать, что прогнозист в целом работает хуже, чем если бы он придерживался своего наилучшего суждения.

Конечно, это предполагает, что прогнозист «откалибровал» прогнозы, регулярно получая обратную связь по результатам проверки. Совершенно необходимо, чтобы эта обратная связь была как можно более быстрой, учитывая ограничение, заключающееся в том, что для полезной оценки вероятностных прогнозов требуется достаточно большой набор прогнозов. Следовательно, установка системы проверки должна включать механизм для отображения результатов прогнозистам, как только они будут доступны. Было бы разумно, если бы отдельные люди могли видеть свои собственные таблицы, диаграммы и числа, а также возможность сравнивать свои результаты с результатами группы, но нет очевидной выгоды в том, чтобы сделать данные каждого человека доступными для группы.