Вероятностно статистические методы исследования. Числовые характеристики случайных величин

3. Суть вероятностно-статистических методов

Как подходы, идеи и результаты теории вероятностей и математической статистики используются при обработке данных – результатов наблюдений, измерений, испытаний, анализов, опытов с целью принятия практически важных решений?

Базой является вероятностная модель реального явления или процесса, т.е. математическая модель, в которой объективные соотношения выражены в терминах теории вероятностей. Вероятности используются прежде всего для описания неопределенностей, которые необходимо учитывать при принятии решений. Имеются в виду как нежелательные возможности (риски), так и привлекательные («счастливый случай»). Иногда случайность вносится в ситуацию сознательно, например, при жеребьевке, случайном отборе единиц для контроля, проведении лотерей или опросов потребителей.

Теория вероятностей позволяет по одним вероятностям рассчитать другие, интересующие исследователя. Например, по вероятности выпадения герба можно рассчитать вероятность того, что при 10 бросаниях монет выпадет не менее 3 гербов. Подобный расчет опирается на вероятностную модель, согласно которой бросания монет описываются схемой независимых испытаний, кроме того, выпадения герба и решетки равновозможны, а потому вероятность каждого из этих событий равна ½. Более сложной является модель, в которой вместо бросания монеты рассматривается проверка качества единицы продукции. Соответствующая вероятностная модель опирается на предположение о том, что контроль качества различных единиц продукции описывается схемой независимых испытаний. В отличие от модели с бросанием монет необходимо ввести новый параметр – вероятность р того, что единица продукции является дефектной. Модель будет полностью описана, если принять, что все единицы продукции имеют одинаковую вероятность оказаться дефектными. Если последнее предположение неверно, то число параметров модели возрастает. Например, можно принять, что каждая единица продукции имеет свою вероятность оказаться дефектной.

Обсудим модель контроля качества с общей для всех единиц продукции вероятностью дефектности р . Чтобы при анализе модели «дойти до числа», необходимо заменить р на некоторое конкретное значение. Для этого необходимо выйти из рамок вероятностной модели и обратиться к данным, полученным при контроле качества. Математическая статистика решает обратную задачу по отношению к теории вероятностей. Ее цель – на основе результатов наблюдений (измерений, анализов, испытаний, опытов) получить выводы о вероятностях, лежащих в основе вероятностной модели. Например, на основе частоты появления дефектных изделий при контроле можно сделать выводы о вероятности дефектности (см. обсуждение выше сиспользованием теоремы Бернулли). На основе неравенства Чебышева делались выводы о соответствии частоты появления дефектных изделий гипотезе о том, что вероятность дефектности принимает определенное значение.

Таким образом, применение математической статистики опирается на вероятностную модель явления или процесса. Используются два параллельных ряда понятий – относящиеся к теории (вероятностной модели) и относящиеся к практике (выборке результатов наблюдений). Например, теоретической вероятности соответствует частота, найденная по выборке. Математическому ожиданию (теоретический ряд) соответствует выборочное среднее арифметическое (практический ряд). Как правило, выборочные характеристики являются оценками теоретических. При этом величины, относящиеся к теоретическому ряду, «находятся в головах исследователей», относятся к миру идей (по древнегреческому философу Платону), недоступны для непосредственного измерения. Исследователи располагают лишь выборочными данными, с помощью которых они стараются установить интересующие их свойства теоретической вероятностной модели.

Зачем же нужна вероятностная модель? Дело в том, что только с ее помощью можно перенести свойства, установленные по результатам анализа конкретной выборки, на другие выборки, а также на всю так называемую генеральную совокупность. Термин «генеральная совокупность» используется, когда речь идет о большой, но конечной совокупности изучаемых единиц. Например, о совокупности всех жителей России или совокупности всех потребителей растворимого кофе в Москве. Цель маркетинговых или социологических опросов состоит в том, чтобы утверждения, полученные по выборке из сотен или тысяч человек, перенести на генеральные совокупности в несколько миллионов человек. При контроле качества в роли генеральной совокупности выступает партия продукции.

Чтобы перенести выводы с выборки на более обширную совокупность, необходимы те или иные предположения о связи выборочных характеристик с характеристиками этой более обширной совокупности. Эти предположения основаны на соответствующей вероятностной модели.

Конечно, можно обрабатывать выборочные данные, не используя ту или иную вероятностную модель. Например, можно рассчитывать выборочное среднее арифметическое, подсчитывать частоту выполнения тех или иных условий и т.п. Однако результаты расчетов будут относиться только к конкретной выборке, перенос полученных с их помощью выводов на какую-либо иную совокупность некорректен. Иногда подобную деятельность называют «анализ данных». По сравнению с вероятностно-статистическими методами анализ данных имеет ограниченную познавательную ценность.

Итак, использование вероятностных моделей на основе оценивания и проверки гипотез с помощью выборочных характеристик – вот суть вероятностно-статистических методов принятия решений.

Подчеркнем, что логика использования выборочных характеристик для принятия решений на основе теоретических моделей предполагает одновременное использование двух параллельных рядов понятий, один из которых соответствует вероятностным моделям, а второй – выборочным данным. К сожалению, в ряде литературных источников, обычно устаревших либо написанных в рецептурном духе, не делается различия между выборочными и теоретическими характеристиками, что приводит читателей к недоумениям и ошибкам при практическом использовании статистических методов.

Предыдущая

В научном познании функционирует сложная, динамическая, целостная, субординированная система многообразных методов, при- меняемых на разных этапах и уровнях познания. Так, в процессе научного исследования применяются различные общенаучные методы и средства познания как на эмпирическом, так и на теоретическом уровнях. В свою очередь общенаучные методы, как уже отмечалось, включают в себя систему эмпирических, общелогических и теоретических методов и средств познания реальной действительности.

1. Общелогические методы научного исследования

Общелогические методы применяются преимущественно на теоретическом уровне научного исследования, хотя некоторые из них могут применяться и на эмпирическом уровне. Какие же это методы и в чем их сущность?

Одним из них, широко применяемым в научном исследовании, является метод анализа (от греч. analysis - разложение, расчленение) - метод научного познания, представляющий собой мысленное расчленение исследуемого объекта на составные элементы с целью изучения его структуры, отдельных признаков, свойств, внутренних связей, отношений.

Анализ дает возможность исследователю проникать в сущность изучаемого явления путем расчленения его на составляющие элементы и выявлять главное, существенное. Анализ как логическая операция входит составной частью во всякое научное исследование и обычно образует его первую стадию, когда исследователь переходит от нерасчлененного описания изучаемого объекта к выявлению его строения, состава, а также его свойств, связей. Анализ присутствует уже на чувственной ступени познания, включается в процесс ощущения и восприятия. На теоретическом уровне познания начинает функционировать высшая форма анализа - мысленный, или абстрактно- логический анализ, который возникает вместе с навыками материально-практического расчленения предметов в процессе труда. Постепенно человек овладел способностью предварять материально-практический анализ в мысленный анализ.

Следует подчеркнуть, что, будучи необходимым приемом познания, анализ является лишь одним из моментов процесса научного исследования. Невозможно познать суть предмета, только расчленяя его на элементы, из которых он состоит. Например, химик, по словам Гегеля, помещает кусок мяса в свою реторту, подвергает его разнообразным операциям, а затем заявляет: я нашел, что мясо состоит из кислорода, углерода, водорода и т. д. Но эти вещества - элементы уже не суть мяса.

В каждой области знания есть как бы свой предел членения объекта, за которым мы переходим к иному характеру свойств и закономерностей. Когда путем анализа частности изучены, наступает следующая стадия познания - синтез.

Синтез (от греч. synthesis - соединение, сочетание, составление) - это метод научного познания, представляющий собой мысленное соединение составных сторон, элементов, свойств, связей исследуемого объекта, расчлененных в результате анализа, и изучение этого объекта как единого целого.

Синтез - это не произвольное, эклектическое соединение частей, элементов целого, а диалектическое целое с выделением сущности. Результатом синтеза является совершенно новое образование, свойства которого не есть только внешнее соединение этих компонентов, но также результат их внутренней взаимосвязи и взаимозависимости.

Анализ фиксирует в основном то специфическое, что отличает части друг от друга. Синтез же вскрывает то существенное общее, что связывает части в единое целое.

Исследователь мысленно расчленяет предмет на составные части для того, чтобы сначала обнаружить сами эти части, узнать, из чего состоит целое, а затем рассмотреть его как состоящий из этих частей, уже обследованных в отдельности. Анализ и синтез находятся в диалектическом единстве: наше мышление столь же аналитично, сколь и синтетично.

Анализ и синтез берут свое начало в практической деятельности. Постоянно расчленяя в своей практической деятельности различные предметы на их составные части, человек постепенно учился разделять предметы и мысленно. Практическая деятельность складывалась не только из расчленения предметов, но и из воссоединения частей в единое целое. На этой основе постепенно возникал мысленный анализ и синтез.

В зависимости от характера исследования объекта и глубины проникновения в его сущность применяются различные виды анализа и синтеза.

1. Прямой или эмпирический анализ и синтез - применяется, как правило, на стадии поверхностного ознакомления с объектом. Этот вид анализа и синтеза дает возможность познать явления изучаемого объекта.

2. Элементарно-теоретический анализ и синтез - широко используется как мощное орудие познания сущности исследуемого явления. Результатом применения такого анализа и синтеза является установление причинно-следственных связей, выявление различных закономерностей.

3. Структурно-генетический анализ и синтез - позволяет наиболее глубоко приникнуть в сущность изучаемого объекта. Этот вид анализа и синтеза требует вычленения в сложном явлении таких элементов, которые представляют самое главное, существенное и оказывают решающее влияние на все остальные стороны изучаемого объекта.

Методы анализа и синтеза в процессе научного исследования функционируют в неразрывной связи с методом абстрагирования.

Абстрагирование (от лат. abstractio - отвлечение) - это общелогический метод научного познания, представляющий собой мысленное отвлечение от несущественных свойств, связей, отношений изучаемых предметов с одновременным мысленным выделением существенных, интересующих исследователя сторон, свойств, связей этих предметов. Суть его состоит в том, что вещь, свойство или отношение мысленно выделяются и одновременно отвлекаются от других вещей, свойств, отношений и рассматривается как бы в "чистом виде".

Абстрагирование в умственной деятельности человека имеет универсальный характер, ибо каждый шаг мысли связан с этим процессом, или с использованием его результатов. Сущность данного метода состоит в том, что он позволяет мысленно отвлекаться от несущественных, второстепенных свойств, связей, отношений предметов и одновременно мысленно выделять, фиксировать интересующие исследования стороны, свойства, связи этих предметов.

Различают процесс абстрагирования и результат этого процесса, который называется абстракцией. Обычно под результатом абстрагирования понимается знание о некоторых сторонах изучаемых объектов. Процесс абстрагирования - это совокупность логических операций, ведущих к получению такого результата (абстракции). Примерами абстракций могут служить бесчисленные понятия, которыми оперирует человек не только в науке, но и в обыденной жизни.

Вопрос о том, что в объективной действительности выделяется абстрагирующей работой мышления и от чего мышление отвлекается, в каждом конкретном случае решается в зависимости от природы изучаемого объекта, а также от задач исследования. В ходе своего исторического развития наука восходит от одного уровня абстрактности к другому, более высокому. Развитие науки в данном аспекте - это, по выражению В. Гейзенберга, "развертывание абстрактных структур". Решающий шаг в сферу абстракции был сделан тогда, когда люди освоили счет (число), тем самым открыв путь, ведущий к математике и математическому естествознанию. В этой связи В. Гейзенберг отмечает: "Понятия, первоначально полученные путем абстрагирования от конкретного опыта, обретают собственную жизнь. Они оказываются более содержательными и продуктивными, чем можно было ожидать поначалу. В последующем развитии они обнаруживают собственные конструктивные возможности: они способствуют построению новых форм и понятий, позволяют установить связи между ними и могут быть в известных пределах применимы в наших попытках понять мир явлений" .

Краткий анализ позволяет утверждать, что абстрагирование- это одна из наиболее фундаментальных познавательных логических операций. Поэтому оно выступает важнейшим методом научного исследования. С методом абстрагирования тесно связан и метод обобщения.

Обобщение - логический процесс и результат мысленного перехода от единичного к общему, от менее общего к более общему.

Научное обобщение - это не просто мысленное выделение и синтезирование сходных признаков, а проникновение в сущность вещи: усмотрение единого в многообразном, общего в единичном, закономерного в случайном, а также объединение предметов по сходным свойствам или связям в однородные группы, классы.

В процессе обобщения совершается переход от единичных понятий к общим, от менее общих понятий - к более общим, от единичных суждений - к общим, от суждений меньшей общности - к суждением большей общности. Примерами такого обобщения могут быть: мысленный переход от понятия "механическая форма движения материи" к понятию "форма движения материи" и вообще "движение"; от понятия "ель" к понятию "хвойное растение" и вообще "растение"; от суждения "этот металл электропроводен" к суждению "все металлы электропроводны".

В научном исследовании наиболее часто применяют следующие виды обобщения: индуктивное, когда исследователь идет от отдельных (единичных) фактов, событий к их общему выражению в мыслях; логическое, когда исследователь идет от одной, менее общей, мысли к другой, более общей. Пределом обобщения являются философские категории, которые нельзя обобщить, поскольку они не имеют родового понятия.

Логический переход от более общей мысли к менее общей есть процесс ограничения. Иначе говоря, это логическая операция, обратная обобщению.

Необходимо подчеркнуть, что способность человека к абстрагированию и обобщению сложилась и развилась на основе общественной практики и взаимного общения людей. Она имеет большое значение как в познавательной деятельности людей, так и в общем прогрессе материальной и духовной культуры общества.

Индукция (от лат. i nductio - наведение) - метод научного познания, в котором общий вывод представляет собой знание о всем классе предметов, полученное в результате исследования отдельных элементов этого класса. В индукции мысль исследователя идет от частного, единичного через особенное к общему и всеобщему. Индукция, как логический прием исследования, связана с обобщением результатов наблюдений и экспериментов, с движением мысли от единичного к общему. Поскольку опыт всегда бесконечен и не полон, то индуктивные выводы всегда имеют проблематичный (вероятностный) характер. Индуктивные обобщения обычно рассматривают как опытные истины или эмпирические законы. Непосредственной основой индукции является повторяемость явлений реальной действительности и их признаков. Обнаруживая сходные черты у многих предметов определенного класса, приходим к выводу о том, что эти черты присущи всем предметам этого класса.

По характеру вывода различают следующие основные группы индуктивных умозаключений:

1. Полная индукция - такое умозаключение, в котором общий вывод о классе предметов делается на основании изучения всех предметов данного класса. Полная индукция дает достоверные выводы, в силу чего она широко используется в качестве доказательства в научном исследовании.

2. Неполная индукция - такое умозаключение, в котором общий вывод получают из посылок, не охватывающих всех предметов данного класса. Различают два вида неполной индукции: популярную, или индукцию через простое перечисление. Она представляет собой умозаключение, в котором общий вывод о классе предметов делается на том основании, что среди наблюдаемых фактов не встретилось ни одного, противоречащего обобщению; научную, т. е. умозаключение, в котором общий вывод о всех предметах класса делается на основании знания о необходимых признаках или причинных связях у части предметов данного класса. Научная индукция может давать не только вероятностные, но и достоверные выводы. Научной индукции присущи свои методы познания. Дело в том, что установить причинную связь явлений очень сложно. Однако в ряде случаев эту связь можно установить с помощью логических приемов, называемых методами установления причинно-следственной связи, или методами научной индукции. Таких методов пять:

1. Метод единственного сходства: если два или более случаев исследуемого явления имеют общим лишь одно обстоятельство, а все, остальные обстоятельства различны, то это единственное сходное обстоятельство и есть причина данного явления:

Следовательно -+ А есть причина а.

Иначе говоря, если предшествующие обстоятельства АВС вызывают явления авс, а обстоятельства ADE - явления aдe, то делается заключение, что А - причина а (или что явление А и а причинно связаны).

2. Метод единственного различия: если случаи, при которых явление наступает или не наступает, различаются только в одном:- предшествующем обстоятельстве, а все другие обстоятельства тождественные, то это одно обстоятельство и есть причина данного явления:

Другими словами, если предшествующие обстоятельства АВС вызывают явление авс, а обстоятельства ВС (явление А устраняется в ходе эксперимента) вызывают явление вс, то делается заключение, что А есть причина а. Основанием такого заключения служит исчезновение а при устранении А.

3. Объединенный метод сходства и различия представляет собой комбинацию первых двух методов.

4. Метод сопутствующих изменений: если возникновение или изменение одного явления всякий раз необходимо вызывает определенное изменение другого явления, то оба эти явления находятся в причинной связи друг с другом:

Изменение А изменение а

Неизменение В, С

Следовательно А есть причина а.

Иначе говоря, если при изменении предшествующего явления А изменяется и наблюдаемое явление а, а остальные предшествующие явления остаются неизменными, то можно заключить, что А является причиной а.

5. Метод остатков: если известно, что причиной исследуемого явления не служат необходимые для него обстоятельства, кроме одного, то это одно обстоятельство и есть, вероятно, причина данного явления. Используя метод остатков, французский астроном Неверье предсказал существование планеты Нептун, которую вскоре и открыл немецкий астроном Галле.

Рассмотренные методы научной индукции по установлению причинных связей чаще всего применяются не изолировано, а во взаимосвязи, дополняя друг друга. Их ценность зависит главным образом от той степени вероятности заключения, которую дает тот или иной метод. Считается, что наиболее сильным методом является метод различия, а наиболее слабым - метод сходства. Остальные три метода занимают промежуточное положение. Это различие в ценности методов основывается главным образом на том, что метод сходства связан в основном с наблюдением, а метод различия - с экспериментом.

Даже краткая характеристика метода индукции позволяет удостовериться в его достоинстве и важности. Значимость этого метода состоит прежде всего в тесной связи с фактами, экспериментом, с практикой. В этой связи Ф. Бэкон писал: "Если мы имеем в виду проникнуть в природу вещей, то мы всюду обращаемся к индукции. Ибо мы полагаем, что индукция есть настоящая форма доказательства, оберегающая чувства от всякого рода заблуждений, близко следящая за природой, граничащая и почти сливающаяся с практикой" .

В современной логике индукция рассматривается как теория вероятностного вывода. Делаются попытки формализации индуктивного метода на основе идей теории вероятностей, что поможет более четко уяснить логические проблемы данного метода, а также определить его эвристическую ценность.

Дедукция (от лат. deductio - выведение) - мыслительный процесс, в котором знание об элементе класса выводятся из знания общих свойств всего класса. Иными словами, мысль исследователя в дедукции идет от общего к частному (единичному). Например: "Все планеты Солнечной системы движутся вокруг Солнца"; "Земля- планета"; следовательно: "Земля движется вокруг Солнца". В этом примере мысль движется от общего (первая посылка) к частному (вывод). Таким образом, дедуктивное умозаключение позволяет лучше познать единичное, так как с его помощью мы получаем новое знание (выводное) о том, что данный предмет обладает признаком, присущим всему классу.

Объективной основой дедукции является то, что каждый предмет сочетает в себе единство общего и единичного. Эта связь - неразрывная, диалектическая, что и позволяет познавать единичное на базе знания общего. Причем если посылки дедуктивного умозаключения истинные и правильно связаны между собой, то вывод - заключение непременно будет истинным. Данной особенностью дедукция выгодно отличается от других методов познания. Дело в том, что общие принципы и законы не дают исследователю в процессе дедуктивного познания сбиться с пути, они помогают правильно понять отдельные явления реальной действительности. Однако было бы неверно на этом основании переоценивать научную значимость дедуктивного метода. Ведь для того, чтобы вступила в свои права формальная сила умозаключения, нужны исходные знания, общие посылки, которыми пользуются в процессе дедукции, а приобретение их в науке представляет собой задачу большой сложности.

Важное познавательное значение дедукции проявляется тогда, когда в качестве общей посылки выступает не просто индуктивное обобщение, а какое-то гипотетическое предположение, например новая научная идея. В этом случае дедукция является отправной точкой зарождения новой теоретической системы. Созданное таким путем теоретическое знание предопределяет построение новых индуктивных обобщений.

Все это создает реальные предпосылки для неуклонного возрастания роли дедукции в научном исследовании. Наука все чаще сталкивается с такими объектами, которые недоступны чувственному восприятию (например микромир, Вселенная, прошлое человечества и т. д.). При познании такого рода объектов значительно чаще приходится обращаться к силе мысли, нежели к силе наблюдения и эксперимента. Дедукция незаменима во всех областях знания, где теоретические положения формулируются для описания формальных, а не реальных систем, например, в математике. Поскольку формализация в современной науке применяется все больше и шире, то и роль дедукции в научном познании соответственно возрастает.

Однако роль дедукции в научном исследовании нельзя абсолютизировать, а тем более - противопоставлять индукции и другим методам научного познания. Недопустимы крайности как метафизического, так и рационалистического характера. Напротив, дедукция и индукция теснейшим образом взаимосвязаны и дополняют друг друга. Индуктивное исследование предполагает использование общих теорий, законов, принципов, т. е. включает в себя момент дедукции, а дедукция невозможна без общих положений, получаемых индуктивным путем. Иными словами, индукция и дедукция связаны между собой столь же необходимым образом, как и анализ и синтез. Надо стараться применять каждую из них на своем месте, а этого можно добиться лишь в том случае, если не упускать из виду их связь между собой, их взаимное дополнение друг друга. "Великие открытия, - отмечает Л. де Бройль, - скачки научной мысли вперед создаются индукцией, рисковым, но истинно творческим методом... Конечно, не нужно делать вывод о том, что строгость дедуктивного рассуждения не имеет никакой ценности. На самом деле лишь она мешает воображению впадать в заблуждение, лишь она позволяет после установления индукцией новых исходных пунктов вывести следствия и сопоставить выводы с фактами. Лишь одна дедукция может обеспечить проверку гипотез и служить ценным противоядием против не в меру разыгравшейся фантазии" . При таком диалектическом подходе каждый из упомянутых и других методов научного познания сможет в полной мере проявить все свои достоинства.

Аналогия. Изучая свойства, признаки, связи предметов и явлений реальной действительности, мы не можем познать их сразу, целиком, во всем объеме, а изучаем их постепенно, раскрывая шаг за шагом все новые и новые свойства. Изучив некоторые из свойств предмета, мы можем обнаружить, что они совпадают со свойствами другого, уже хорошо изученного предмета. Установив такое сходство и обнаружив множество совпадающих признаков, можно предположить, что и другие свойства этих предметов также совпадают. Ход такого рассуждения составляет основы аналогии.

Аналогия - это такой метод научного исследования, с помощью которого от сходства объектов данного класса в одних признаках делают вывод об их сходстве в других признаках. Суть аналогии можно выразить с помощью формулы:

А имеет признаки aecd

В имеет признаки авс

Следовательно, В, по-видимому, имеет признак d.

Иначе говоря, в аналогии мысль исследователя идет от знания известной общности к знанию такой же общности, или, другими словами, - от частного к частному.

Относительно конкретных объектов выводы, получаемые по аналогии, носят, как правило, лишь правдоподобный характер: они являются одним из источников научных гипотез, индуктивных рассуждений и играют важную роль в научных открытиях. Например, химический состав Солнца сходен с химическим составом Земли по многим признакам. Поэтому когда на Солнце обнаружили не известный еще на Земле элемент гелий, то по аналогии сделали вывод, что подобный элемент должен быть и на Земле. Правильность этого вывода была установлена и подтверждена позже. Подобным же образом Л. де Бройль, предположив определенное сходство между частицами вещества и полем, пришел к выводу о волновой природе частиц вещества.

Для повышения вероятности выводов по аналогии необходимо стремиться к тому, чтобы:

    были выявлены не только внешние свойства сопоставляемых объектов, а главным образом внутренние;

    эти объекты были подобны в важнейших и существенных признаках, а не в случайных и второстепенных;

    круг совпадающих признаков был как можно шире;

    учитывались не только сходство, но и различия - чтобы последние не перенести на другой объект.

Метод аналогии дает наиболее ценные результаты тогда, когда устанавливается органическая взаимосвязь не только между сходными признаками, но и с тем признаком, который переносится на исследуемый объект.

Истинность выводов по аналогии можно сравнить с истинностью выводов по методу неполной индукции. В обоих случаях можно получить достоверные выводы, но только тогда, когда каждый из этих методов применяется не изолированно от других методов научного познания, а в неразрывной диалектической связи с ними.

Метод аналогии, понимаемый предельно широко, как перенос информации об одних объектах на другие, составляет гносеологическую основу моделирования.

Моделирование - метод научного познания, с помощью которого изучение объекта (оригинала) осуществляется путем создания его копии (модели), замещающей оригинал, которая затем познается с определенных сторон, интересующих исследователя.

Сущность метода моделирования заключается в воспроизведении свойств объекта познания на специально созданном аналоге, модели. Что такое модель?

Модель (от лат. modulus - мера, образ, норма) - это условный образ какого-либо объекта (оригинала), определенный способ выражения свойств, связей предметов и явлений реальной действительности на основе аналогии, установления между ними сходства и на этой основе воспроизведение их на материальном или идеальном объекте- подобии. Другими словами, модель есть аналог, "заместитель" объекта-оригинала, который в познании и практике служит для приобретения и расширения знания (информации) об оригинале в целях конструирования оригинала, преобразования или управления им.

Между моделью и оригиналом должно существовать известное сходство (отношение подобия): физических характеристик, функций, поведения изучаемого объекта, его структуры и т. д. Именно это сходство и позволяет переносить информацию, полученную в результате исследования модели, на оригинал.

Поскольку моделирование имеет большое сходство с методом аналогии, то логическая структура умозаключения по аналогии является как бы организующим фактором, объединяющим все моменты моделирования в единый, целенаправленный процесс. Можно даже сказать, что в известном смысле моделирование есть разновидность аналогии. Метод аналогии как бы служит логическим основанием для выводов, которые делаются при моделировании. Например, на основании принадлежности модели А признаков abcd и принадлежности оригиналу А свойств авс делается вывод о том, что обнаруженное в модели А свойство d также принадлежит оригиналу А.

Использование моделирования диктуется необходимостью раскрыть такие стороны объектов, которые либо невозможно постигнуть путем непосредственного изучения, либо невыгодно изучать из чисто экономических соображений. Человек, например, не может непосредственно наблюдать процесс естественного образования алмазов, зарождения и развития жизни на Земле, целый ряд явлений микро- и мегамира. Поэтому приходится прибегать к искусственному воспроизведению подобных явлений в форме, удобной для наблюдения и изучения. В ряде же случаев бывает гораздо выгоднее и экономичнее вместо непосредственного экспериментирования с объектом построить и изучить его модель.

Моделирование широко применяется для расчета траекторий баллистических ракет, при изучении режима работы машин и даже целых предприятий, а также в управлении предприятиями, в распределении материальных ресурсов, в исследовании жизненных процессов в организме, в обществе.

Применяемые в обыденном и научном познании модели, делятся на два больших класса: вещественные, или материальные, и логические (мысленные), или идеальные. Первые являются природными объектами, подчиняющимися в своем функционировании естественным законам. Они в более или менее наглядной форме материально воспроизводят предмет исследования. Логические модели представляют собой идеальные образования, зафиксированные в соответствующей знаковой форме и функционирующие по законам логики и математики. Важное значение знаковых моделей состоит в том, что они с помощью символов дают возможность раскрыть такие связи и отношения действительности, которые другими средствами обнаружить практически невозможно.

На современном этапе научно-технического прогресса большое распространение в науке и в различных областях практики получило компьютерное моделирование. Компьютер, работающий по специальной программе, способен моделировать самые различные процессы, например, колебание рыночных цен, рост народонаселения, взлет и выход на орбиту искусственного спутника Земли, химические реакции и т. д. Исследование каждого такого процесса осуществляется посредством соответствующей компьютерной модели.

Системный метод . Современный этап научного познания характеризуется все возрастающим значением теоретического мышления и теоретических наук. Важное место среди наук занимает теория систем, анализирующая системные методы исследования. В системном методе познания находит наиболее адекватное выражение диалектика развития предметов и явлений реальной действительности.

Системный метод - это совокупность общенаучных методологических принципов и способов исследования, в основе которых лежит ориентация на раскрытие целостности объекта как системы.

Основу системного метода составляет система и структура, которые можно определить следующим образом.

Система (от греч. systema - целое, составленное из частей; соединение) - это общенаучное положение, выражающее совокупность элементов, взаимосвязанных как между собой, так и со средой и образующих определенную целостность, единство изучаемого объекта. Типы систем весьма многообразны: материальные и духовные, неорганические и живые, механические и органические, биологические и социальные, статичные и динамичные и т. д. Причем любая система представляет собой совокупность разнообразных элементов, составляющих ее определенную структуру. Что такое структура?

Структура (от лат. structura - строение, расположение, порядок) - это относительно устойчивый способ (закон) связи элементов объекта, который обеспечивает целостность той или иной сложной системы.

Специфика системного подхода определяется тем, что он ориентирует исследование на раскрытие целостности объекта и обеспечивающих ее механизмов, на выявление многообразных типов связей сложного объекта и сведение их в единую теоретическую картину.

Основным принципом общей теории систем является принцип системной целостности, означающий рассмотрение природы, в том числе и общества, как большой и сложной системы, распадающейся на подсистемы, выступающие при определенных условиях в качестве относительно самостоятельных систем.

Все разнообразие концепций и подходов в общей теории систем можно при известной степени абстрагирования разделить на два больших класса теорий: эмпирико-интуитивные и абстрактно-дедуктивные.

1. В эмпирико-интуитивных концепциях в качестве первичного объекта исследования рассматриваются конкретные, реально существующие объекты. В процессе восхождения от конкретно-единичного к общему формулируются понятия системы и системные принципы исследования разного уровня. Этот метод имеет внешнее сходство с переходом от единичного к общему в эмпирическом познании, но за внешним сходством скрывается определенное различие. Оно состоит в том, что если эмпирический метод исходит из признания первичности элементов, то системный подход исходит из признания первичности систем. В системном подходе в качестве начала исследования принимаются системы как целостное образование, состоящее из множества элементов вместе с их связями и отношениями, подчиняющимися определенным законам; эмпирический метод ограничивается формулированием законов, выражающих взаимоотношения между элементами данного объекта или данного уровня явлений. И хотя в этих законах имеется момент общности, данная общность, однако, относится к узкому классу большей частью одноименных объектов.

2. В абстрактно-дедуктивных концепциях в качестве исходного начала исследования принимаются абстрактные объекты - системы, характеризующиеся предельно общими свойствами и отношениями. Дальнейшее нисхождение от предельно общих систем ко все более конкретным сопровождается одновременно формулированием таких системных принципов, которые применяются к конкретно определенным классам систем.

Эмпирико-интуитивный и абстрактно-дедуктивный подходы одинаково правомерны, они не противопоставляются друг другу, а наоборот - их совместное использование открывает чрезвычайно большие познавательные возможности.

Системный метод позволяет научно интерпретировать принципы организованности систем. Объективно существующий мир выступает как мир определенных систем. Такая система характеризуется не только наличием взаимосвязанных компонентов и элементов, но и определенной их упорядоченностью, организованностью на основе определенной совокупности законов. Поэтому системы являются не хаотическими, а определенным образом упорядоченными и организованными.

В процессе исследования можно, конечно, "восходить" от элементов к целостным системам, как и наоборот - от целостных систем к элементам. Но при всех обстоятельствах исследование не может быть обособлено от системных связей и отношений. Игнорирование таких связей неизбежно ведет к односторонним или ошибочным выводам. Не случайно, что в истории познания прямолинейный и односторонний механицизм в объяснении биологических и социальных явлений сползал на позиции признания первотолчка и духовной субстанции.

Исходя из сказанного можно выделить следующие основные требования системного метода:

Выявление зависимости каждого элемента от его места и функций в системе с учетом того, что свойства целого не сводимы к сумме свойств его элементов;

Анализ того, насколько поведение системы обусловлено как особенностями ее отдельных элементов, так и свойствами ее структуры;

Исследование механизма взаимозависимости, взаимодействия системы и среды;

Изучение характера иерархичности, присущего данной системе;

Обеспечение множественности описаний с целью многоаспектного охвата системы;

Рассмотрение динамизма системы, представление ее как развивающейся целостности.

Важным понятием системного подхода является понятие "самоорганизаиия". Оно характеризует процесс создания, воспроизведения или совершенствования организации сложной, открытой, динамичной, саморазвивающейся системы, связи между элементами которой имеют не жесткий, а вероятностный характер. Свойства самоорганизации присущи объектам самой различной природы: живой клетке, организму, биологической популяции, человеческим коллективам.

Класс систем, способных к самоорганизации, - это открытые и нелинейные системы. Открытость системы означает наличие в ней источников и стоков, обмена веществом и энергией с окружающей средой. Однако не всякая открытая система самоорганизуется, строит структуры, ибо все зависит от соотношения двух начал - от основы, созидающей структуру, и от основы, рассеивающей, размывающей это начало.

В современной науке самоорганизующиеся системы являются специальным предметом исследования синергетики - общенаучной теории самоорганизации, ориентированной на поиск законов эволюции открытых неравновесных систем любой базовой основы - природной, социальной, когнитивной (познавательной).

В настоящее время системный метод приобретает все более возрастающее методологическое значение в решении естественнонаучных, общественно-исторических, психологических и других проблем. Он широко используется практически всеми науками, что обусловлено насущными гносеологическими и практическими потребностями развития науки на современном этапе.

Вероятностные (статистические) методы - это такие методы, с помощью которых изучается действие множества случайных факторов, характеризующихся устойчивой частотой, что позволяет обнаружить необходимость, "пробивающуюся" сквозь совокупное действие множества случайностей.

Вероятностные методы формируются на основе теории вероятностей, которую зачастую называют наукой о случайном, а в представлении многих ученых вероятность и случайность практически нерасторжимы. Категории необходимости и случайности отнюдь не устарели, напротив - их роль в современной науке неизмеримо возросла. Как показала история познания, "мы лишь теперь начинаем по достоинству оценивать значение всего круга проблем, связанных с необходимостью и случайностью" .

Для понимания существа вероятностных методов необходимо рассмотреть их базовые понятия: "динамические закономерности", "статистические закономерности" и "вероятность". Означенные два вида закономерностей различаются по характеру вытекающих из них предсказаний.

В законах динамического типа предсказания имеют однозначный характер. Динамические законы характеризуют поведение относительно изолированных объектов, состоящих из небольшого числа элементов, в которых можно абстрагироваться от целого ряда случайных факторов, что и создает возможность более точно предсказать, например, в классической механике.

В статистических законах предсказания носят не достоверный, а лишь вероятностный характер. Подобный характер предсказаний обусловлен действием множества случайных факторов, имеющих место в статистических явлениях или массовых событиях, например, большое число молекул в газе, число особей в популяциях, число людей в больших коллективах и т. д.

Статистическая закономерность возникает как результат взаимодействия большого числа элементов, составляющих объект - систему, и поэтому характеризует не столько поведение отдельного элемента, сколько объекта в целом. Необходимость, проявляющаяся в статистических законах, возникает вследствие взаимной компенсации и уравновешивания множества случайных факторов. "Хотя статистические закономерности и могут привести к утверждениям, степень вероятности которых столь высока, что она граничит с достоверностью, тем не менее принципиально всегда возможны исключения" .

Статистические законы, хотя и не дают однозначных и достоверных предсказаний, тем не менее являются единственно возможными при исследовании массовых явлений случайного характера. За совокупным действием различных факторов случайного характера, которые практически невозможно охватить, статистические законы обнаруживают нечто устойчивое, необходимое, повторяющееся. Они служат подтверждением диалектики перехода случайного в необходимое. Динамические законы оказываются предельным случаем статистических, когда вероятность становится практически достоверностью.

Вероятность - понятие, характеризующее количественную меру (степень) возможности появления некоторого случайного события при определенных условиях, которые могут многократно повторяться. Одна из основных задач теории вероятностей состоит в выяснении закономерностей, возникающих при взаимодействии большого числа случайных факторов.

Вероятностно-статистические методы широко применяются при изучении массовых явлений, особенно в таких научных дисциплинах, как математическая статистика, статистическая физика, квантовая механика, кибернетика, синергетика.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Введение

1. Распределение "хи-квадрат"

Заключение

Приложение

Введение

Как подходы, идеи и результаты теории вероятностей используются в нашей жизни? математический квадрат теория

Базой является вероятностная модель реального явления или процесса, т.е. математическая модель, в которой объективные соотношения выражены в терминах теории вероятностей. Вероятности используются, прежде всего, для описания неопределенностей, которые необходимо учитывать при принятии решений. Имеются в виду, как нежелательные возможности (риски), так и привлекательные ("счастливый случай"). Иногда случайность вносится в ситуацию сознательно, например, при жеребьевке, случайном отборе единиц для контроля, проведении лотерей или опросов потребителей.

Теория вероятностей позволяет по одним вероятностям рассчитать другие, интересующие исследователя.

Вероятностная модель явления или процесса является фундаментом математической статистики. Используются два параллельных ряда понятий - относящиеся к теории (вероятностной модели) и относящиеся к практике (выборке результатов наблюдений). Например, теоретической вероятности соответствует частота, найденная по выборке. Математическому ожиданию (теоретический ряд) соответствует выборочное среднее арифметическое (практический ряд). Как правило, выборочные характеристики являются оценками теоретических. При этом величины, относящиеся к теоретическому ряду, "находятся в головах исследователей", относятся к миру идей (по древнегреческому философу Платону), недоступны для непосредственного измерения. Исследователи располагают лишь выборочными данными, с помощью которых они стараются установить интересующие их свойства теоретической вероятностной модели.

Зачем же нужна вероятностная модель? Дело в том, что только с ее помощью можно перенести свойства, установленные по результатам анализа конкретной выборки, на другие выборки, а также на всю так называемую генеральную совокупность. Термин "генеральная совокупность" используется, когда речь идет о большой, но конечной совокупности изучаемых единиц. Например, о совокупности всех жителей России или совокупности всех потребителей растворимого кофе в Москве. Цель маркетинговых или социологических опросов состоит в том, чтобы утверждения, полученные по выборке из сотен или тысяч человек, перенести на генеральные совокупности в несколько миллионов человек. При контроле качества в роли генеральной совокупности выступает партия продукции.

Чтобы перенести выводы с выборки на более обширную совокупность, необходимы те или иные предположения о связи выборочных характеристик с характеристиками этой более обширной совокупности. Эти предположения основаны на соответствующей вероятностной модели.

Конечно, можно обрабатывать выборочные данные, не используя ту или иную вероятностную модель. Например, можно рассчитывать выборочное среднее арифметическое, подсчитывать частоту выполнения тех или иных условий и т.п. Однако результаты расчетов будут относиться только к конкретной выборке, перенос полученных с их помощью выводов на какую-либо иную совокупность некорректен. Иногда подобную деятельность называют "анализ данных". По сравнению с вероятностно-статистическими методами анализ данных имеет ограниченную познавательную ценность.

Итак, использование вероятностных моделей на основе оценивания и проверки гипотез с помощью выборочных характеристик - вот суть вероятностно-статистических методов принятия решений.

1. Распределение "хи-квадрат"

С помощью нормального распределения определяются три распределения, которые в настоящее время часто используются при статистической обработке данных. Это распределения Пирсона ("хи - квадрат"), Стьюдента и Фишера.

Мы остановимся на распределении ("хи - квадрат"). Впервые это распределение было исследовано астрономом Ф.Хельмертом в 1876 году. В связи с гауссовской теорией ошибок он исследовал суммы квадратов n независимых стандартно нормально распределенных случайных величин. Позднее Карл Пирсон (Karl Pearson) дал имя данной функции распределения "хи - квадрат". И сейчас распределение носит его имя.

Благодаря тесной связи с нормальным распределением, ч2-распределение играет важную роль в теории вероятностей и математической статистике. ч2-распределение, и многие другие распределения, которые определяются посредством ч2-распределения (например - распределение Стьюдента), описывают выборочные распределения различных функций от нормально распределенных результатов наблюдений и используются для построения доверительных интервалов и статистических критериев.

Распределение Пирсона (хи - квадрат) - распределение случайной величиныгде X1, X2,…, Xn - нормальные независимые случайные величины, причем математическое ожидание каждой из них равно нулю, а среднее квадратическое отклонение - единице.

Сумма квадратов

распределена по закону ("хи - квадрат").

При этом число слагаемых, т.е. n, называется "числом степеней свободы" распределения хи - квадрат. C увеличением числа степеней свободы распределение медленно приближается к нормальному.

Плотность этого распределения

Итак, распределение ч2 зависит от одного параметра n - числа степеней свободы.

Функция распределения ч2 имеет вид:

если ч2?0. (2.7.)

На Рисунке 1 изображен график плотности вероятности и функции ч2 - распределения для разных степеней свободы.

Рисунок 1 Зависимость плотности вероятности ц (x) в распределении ч2 (хи - квадрат) при разном числе степеней свободы

Моменты распределения "хи-квадрат":

Распределение "хи-квадрат" используют при оценивании дисперсии (с помощью доверительного интервала), при проверке гипотез согласия, однородности, независимости, прежде всего для качественных (категоризованных) переменных, принимающих конечное число значений, и во многих других задачах статистического анализа данных.

2. "Хи-квадрат" в задачах статистического анализа данных

Статистические методы анализа данных применяются практически во всех областях деятельности человека. Их используют всегда, когда необходимо получить и обосновать какие-либо суждения о группе (объектов или субъектов) с некоторой внутренней неоднородностью.

Современный этап развития статистических методов можно отсчитывать с 1900 г., когда англичанин К. Пирсон основал журнал "Biometrika". Первая треть ХХ в. прошла под знаком параметрической статистики. Изучались методы, основанные на анализе данных из параметрических семейств распределений, описываемых кривыми семейства Пирсона. Наиболее популярным было нормальное распределение. Для проверки гипотез использовались критерии Пирсона, Стьюдента, Фишера. Были предложены метод максимального правдоподобия, дисперсионный анализ, сформулированы основные идеи планирования эксперимента.

Распределение "хи-квадрат" является одним из наиболее широко используемых в статистике для проверки статистических гипотез. На основе распределения "хи-квадрат" построен один из наиболее мощных критериев согласия - критерий "хи-квадрата" Пирсона.

Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения.

Критерий ч2 ("хи-квадрат") используется для проверки гипотезы различных распределений. В этом заключается его достоинство.

Расчетная формула критерия равна

где m и m" - соответственно эмпирические и теоретические частоты

рассматриваемого распределения;

n - число степеней свободы.

Для проверки нам необходимо сравнивать эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты.

При полном совпадении эмпирических частот с частотами, вычисленными или ожидаемыми S (Э - Т) = 0 и критерий ч2 тоже будет равен нулю. Если же S (Э - Т) не равно нулю это укажет на несоответствие вычисленных частот эмпирическим частотам ряда. В таких случаях необходимо оценить значимость критерия ч2, который теоретически может изменяться от нуля до бесконечности. Это производится путем сравнения фактически полученной величины ч2ф с его критическим значением (ч2st).Нулевая гипотеза, т. е. предположение, что расхождение между эмпирическими и теоретическими или ожидаемыми частотами носит случайный характер, опровергается, если ч2ф больше или равно ч2st для принятого уровня значимости (a) и числа степеней свободы (n).

Распределение вероятных значений случайной величины ч2 непрерывно и ассиметрично. Оно зависит от числа степеней свободы (n) и приближается к нормальному распределению по мере увеличения числа наблюдений. Поэтому применение критерия ч2 к оценке дискретных распределений сопряжено с некоторыми погрешностями, которые сказываются на его величине, особенно на малочисленных выборках. Для получения более точных оценок выборка, распределяемая в вариационный ряд, должна иметь не менее 50 вариантов. Правильное применение критерия ч2 требует также, чтобы частоты вариантов в крайних классах не были бы меньше 5; если их меньше 5, то они объединяются с частотами соседних классов, чтобы в сумме составляли величину большую или равную 5. Соответственно объединению частот уменьшается и число классов (N). Число степеней свободы устанавливается по вторичному числу классов с учетом числа ограничений свободы вариации.

Так как точность определения критерия ч2 в значительной степени зависит от точности расчета теоретических частот (Т), для получения разности между эмпирическими и вычисленными частотами следует использовать неокругленные теоретические частоты.

В качестве примера возьмем исследование, опубликованное на сайте, который посвящен применению статистических методов в гуманитарных науках.

Критерий "Хи-квадрат" позволяет сравнивать распределения частот вне зависимости от того, распределены они нормально или нет.

Под частотой понимается количество появлений какого-либо события. Обычно, с частотой появления события имеют дело, когда переменные измерены в шкале наименований и другой их характеристики, кроме частоты подобрать невозможно или проблематично. Другими словами, когда переменная имеет качественные характеристики. Так же многие исследователи склонны переводить баллы теста в уровни (высокий, средний, низкий) и строить таблицы распределений баллов, чтобы узнать количество человек по этим уровням. Чтобы доказать, что в одном из уровней (в одной из категорий) количество человек действительно больше (меньше) так же используется коэффициент Хи-квадрат.

Разберем самый простой пример.

Среди младших подростков был проведён тест для выявления самооценки. Баллы теста были переведены в три уровня: высокий, средний, низкий. Частоты распределились следующим образом:

Высокий (В) 27 чел.

Средний (С) 12 чел.

Низкий (Н) 11 чел.

Очевидно, что детей с высокой самооценкой большинство, однако это нужно доказать статистически. Для этого используем критерий Хи-квадрат.

Наша задача проверить, отличаются ли полученные эмпирические данные от теоретически равновероятных. Для этого необходимо найти теоретические частоты. В нашем случае, теоретические частоты - это равновероятные частоты, которые находятся путём сложения всех частот и деления на количество категорий.

В нашем случае:

(В + С + Н)/3 = (27+12+11)/3 = 16,6

Формула для расчета критерия хи-квадрат:

ч2 = ?(Э - Т)І / Т

Строим таблицу:

Эмпирич. (Э)

Теоретич. (Т)

(Э - Т)І / Т

Находим сумму последнего столбца:

Теперь нужно найти критическое значение критерия по таблице критических значений (Таблица 1 в приложении). Для этого нам понадобится число степеней свободы (n).

n = (R - 1) * (C - 1)

где R - количество строк в таблице, C - количество столбцов.

В нашем случае только один столбец (имеются в виду исходные эмпирические частоты) и три строки (категории), поэтому формула изменяется - исключаем столбцы.

n = (R - 1) = 3-1 = 2

Для вероятности ошибки p?0,05 и n = 2 критическое значение ч2 = 5,99.

Полученное эмпирическое значение больше критического - различия частот достоверны (ч2= 9,64; p?0,05).

Как видим, расчет критерия очень прост и не занимает много времени. Практическая ценность критерия хи-квадрат огромна. Этот метод оказывается наиболее ценным при анализе ответов на вопросы анкет.

Разберем более сложный пример.

К примеру, психолог хочет узнать, действительно ли то, что учителя более предвзято относятся к мальчикам, чем к девочкам. Т.е. более склонны хвалить девочек. Для этого психологом были проанализированы характеристики учеников, написанные учителями, на предмет частоты встречаемости трех слов: "активный", "старательный", "дисциплинированный", синонимы слов так же подсчитывались.

Данные о частоте встречаемости слов были занесены в таблицу:

Для обработки полученных данных используем критерий хи-квадрат.

Для этого построим таблицу распределения эмпирических частот, т.е. тех частот, которые мы наблюдаем:

Теоретически, мы ожидаем, что частоты распределятся равновероятно, т.е. частота распределится пропорционально между мальчиками и девочками. Построим таблицу теоретических частот. Для этого умножим сумму по строке на сумму по столбцу и разделим получившееся число на общую сумму (s).

Итоговая таблица для вычислений будет выглядеть так:

Эмпирич. (Э)

Теоретич. (Т)

(Э - Т)І / Т

Мальчики

"Активный"

"Старательный"

"Дисциплинированный"

"Активный"

"Старательный"

"Дисциплинированный"

Сумма: 4,21

ч2 = ?(Э - Т)І / Т

где R - количество строк в таблице.

В нашем случае хи-квадрат = 4,21; n = 2.

По таблице критических значений критерия находим: при n = 2 и уровне ошибки 0,05 критическое значение ч2 = 5,99.

Полученное значение меньше критического, а значит принимается нулевая гипотеза.

Вывод: учителя не придают значение полу ребенка при написании ему характеристики.

Заключение

Студенты почти всех специальностей изучают в конце курса высшей математики раздел "теория вероятностей и математическая статистика", реально они знакомятся лишь с некоторыми основными понятиями и результатами, которых явно не достаточно для практической работы. С некоторыми математическими методами исследования студенты встречаются в специальных курсах (например, таких, как "Прогнозирование и технико-экономическое планирование", "Технико-экономический анализ", "Контроль качества продукции", "Маркетинг", "Контроллинг", "Математические методы прогнозирования", "Статистика" и др. - в случае студентов экономических специальностей), однако изложение в большинстве случаев носит весьма сокращенный и рецептурный характер. В результате знаний у специалистов по прикладной статистике недостаточно.

Поэтому большое значение имеет курс "Прикладная статистика" в технических вузах, а в экономических вузах - курса "Эконометрика", поскольку эконометрика - это, как известно, статистический анализ конкретных экономических данных.

Теория вероятности и математическая статистика дают фундаментальные знания для прикладной статистики и эконометрики.

Они необходимы специалистам для практической работы.

Я рассмотрела непрерывную вероятностную модель и постаралась на примерах показать ее используемость.

И в конце своей работы я пришла к выводу, что грамотная реализация основных процедур математико-статического анализа данных, статическая проверка гипотез невозможна без знания модели "хи-квадрат", а также умения пользоваться ее таблицей.

Список используемой литературы

1. Орлов А.И. Прикладная статистика. М.: Издательство "Экзамен", 2004.

2. Гмурман В.Е. Теория вероятностей и математическая статистика. М.: Высшая школа, 1999. - 479с.

3. Айвозян С.А. Теория вероятностей и прикладная статистика, т.1. М.: Юнити, 2001. - 656с.

4. Хамитов Г.П., Ведерникова Т.И. Вероятности и статистика. Иркутск: БГУЭП, 2006 - 272с.

5. Ежова Л.Н. Эконометрика. Иркутск: БГУЭП, 2002. - 314с.

6. Мостеллер Ф. Пятьдесят занимательных вероятностных задач с решениями. М.: Наука, 1975. - 111с.

7. Мостеллер Ф. Вероятность. М.: Мир, 1969. - 428с.

8. Яглом А.М. Вероятность и информация. М.: Наука, 1973. - 511с.

9. Чистяков В.П. Курс теории вероятностей. М.: Наука, 1982. - 256с.

10. Кремер Н.Ш. Теория вероятностей и математическая статистика. М.: ЮНИТИ, 2000. - 543с.

11. Математическая энциклопедия, т.1. М.: Советская энциклопедия, 1976. - 655с.

12. http://psystat.at.ua/ - Статистика в психологии и педагогике. Статья Критерий Хи-квадрат.

Приложение

Критические точки распределения ч2

Таблица 1

Размещено на Allbest.ru

...

Подобные документы

    Вероятностная модель и аксиоматика А.Н. Колмогорова. Случайные величины и векторы, классическая предельная проблема теории вероятностей. Первичная обработка статистических данных. Точечные оценки числовых характеристик. Статистическая проверка гипотез.

    методичка , добавлен 02.03.2010

    Правила выполнения и оформления контрольных работ для заочного отделения. Задания и примеры решения задач по математической статистике и теории вероятности. Таблицы справочных данных распределений, плотность стандартного нормального распределения.

    методичка , добавлен 29.11.2009

    Основные методы формализованного описания и анализа случайных явлений, обработки и анализа результатов физических и численных экспериментов теории вероятности. Основные понятия и аксиомы теории вероятности. Базовые понятия математической статистики.

    курс лекций , добавлен 08.04.2011

    Определение закона распределения вероятностей результатов измерения в математической статистике. Проверка соответствия эмпирического распределения теоретическому. Определение доверительного интервала, в котором лежит значение измеряемой величины.

    курсовая работа , добавлен 11.02.2012

    Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Проверка статистических гипотез и выполнение центральной предельной теоремы для заданных последовательностей независимых случайных величин.

    курсовая работа , добавлен 13.11.2012

    Основные этапы обработки данных натуральных наблюдений методом математической статистики. Оценка полученных результатов, их использование при принятии управленческих решений в области охраны природы и природопользования. Проверка статистических гипотез.

    практическая работа , добавлен 24.05.2013

    Сущность закона распределения и его практическое применение для решения статистических задач. Определение дисперсии случайной величины, математического ожидания и среднеквадратического отклонения. Особенности однофакторного дисперсионного анализа.

    контрольная работа , добавлен 07.12.2013

    Вероятность и ее общее определение. Теоремы сложения и умножения вероятностей. Дискретные случайные величины и их числовые характеристики. Закон больших чисел. Статистическое распределение выборки. Элементы корреляционного и регрессионного анализа.

    курс лекций , добавлен 13.06.2015

    Программа курса, основные понятия и формулы теории вероятностей, их обоснование и значение. Место и роль математической статистики в дисциплине. Примеры и разъяснения по решению самых распространенных задач по различным темам данных учебных дисциплин.

    методичка , добавлен 15.01.2010

    Теория вероятностей и математическая статистика являются науками о методах количественного анализа массовых случайных явлений. Множество значений случайной величины называется выборкой, а элементы множества – выборочными значениями случайной величины.

Часть 1. Фундамент прикладной статистики

1.2.3. Суть вероятностно-статистических методов принятия решений

Как подходы, идеи и результаты теории вероятностей и математической статистики используются при принятии решений?

Базой является вероятностная модель реального явления или процесса, т.е. математическая модель, в которой объективные соотношения выражены в терминах теории вероятностей. Вероятности используются прежде всего для описания неопределенностей, которые необходимо учитывать при принятии решений. Имеются в виду как нежелательные возможности (риски), так и привлекательные («счастливый случай»). Иногда случайность вносится в ситуацию сознательно, например, при жеребьевке, случайном отборе единиц для контроля, проведении лотерей или опросов потребителей.

Теория вероятностей позволяет по одним вероятностям рассчитать другие, интересующие исследователя. Например, по вероятности выпадения герба можно рассчитать вероятность того, что при 10 бросаниях монет выпадет не менее 3 гербов. Подобный расчет опирается на вероятностную модель, согласно которой бросания монет описываются схемой независимых испытаний, кроме того, выпадения герба и решетки равновозможны, а потому вероятность каждого из этих событий равна ½. Более сложной является модель, в которой вместо бросания монеты рассматривается проверка качества единицы продукции. Соответствующая вероятностная модель опирается на предположение о том, что контроль качества различных единиц продукции описывается схемой независимых испытаний. В отличие от модели с бросанием монет необходимо ввести новый параметр – вероятность р того, что единица продукции является дефектной. Модель будет полностью описана, если принять, что все единицы продукции имеют одинаковую вероятность оказаться дефектными. Если последнее предположение неверно, то число параметров модели возрастает. Например, можно принять, что каждая единица продукции имеет свою вероятность оказаться дефектной.

Обсудим модель контроля качества с общей для всех единиц продукции вероятностью дефектности р . Чтобы при анализе модели «дойти до числа», необходимо заменить р на некоторое конкретное значение. Для этого необходимо выйти из рамок вероятностной модели и обратиться к данным, полученным при контроле качества. Математическая статистика решает обратную задачу по отношению к теории вероятностей. Ее цель – на основе результатов наблюдений (измерений, анализов, испытаний, опытов) получить выводы о вероятностях, лежащих в основе вероятностной модели. Например, на основе частоты появления дефектных изделий при контроле можно сделать выводы о вероятности дефектности (см. теорему Бернулли выше). На основе неравенства Чебышева делались выводы о соответствии частоты появления дефектных изделий гипотезе о том, что вероятность дефектности принимает определенное значение.

Таким образом, применение математической статистики опирается на вероятностную модель явления или процесса. Используются два параллельных ряда понятий – относящиеся к теории (вероятностной модели) и относящиеся к практике (выборке результатов наблюдений). Например, теоретической вероятности соответствует частота, найденная по выборке. Математическому ожиданию (теоретический ряд) соответствует выборочное среднее арифметическое (практический ряд). Как правило, выборочные характеристики являются оценками теоретических. При этом величины, относящиеся к теоретическому ряду, «находятся в головах исследователей», относятся к миру идей (по древнегреческому философу Платону), недоступны для непосредственного измерения. Исследователи располагают лишь выборочными данными, с помощью которых они стараются установить интересующие их свойства теоретической вероятностной модели.

Зачем же нужна вероятностная модель? Дело в том, что только с ее помощью можно перенести свойства, установленные по результатам анализа конкретной выборки, на другие выборки, а также на всю так называемую генеральную совокупность. Термин «генеральная совокупность» используется, когда речь идет о большой, но конечной совокупности изучаемых единиц. Например, о совокупности всех жителей России или совокупности всех потребителей растворимого кофе в Москве. Цель маркетинговых или социологических опросов состоит в том, чтобы утверждения, полученные по выборке из сотен или тысяч человек, перенести на генеральные совокупности в несколько миллионов человек. При контроле качества в роли генеральной совокупности выступает партия продукции.

Чтобы перенести выводы с выборки на более обширную совокупность, необходимы те или иные предположения о связи выборочных характеристик с характеристиками этой более обширной совокупности. Эти предположения основаны на соответствующей вероятностной модели.

Конечно, можно обрабатывать выборочные данные, не используя ту или иную вероятностную модель. Например, можно рассчитывать выборочное среднее арифметическое, подсчитывать частоту выполнения тех или иных условий и т.п. Однако результаты расчетов будут относиться только к конкретной выборке, перенос полученных с их помощью выводов на какую-либо иную совокупность некорректен. Иногда подобную деятельность называют «анализ данных». По сравнению с вероятностно-статистическими методами анализ данных имеет ограниченную познавательную ценность.

Итак, использование вероятностных моделей на основе оценивания и проверки гипотез с помощью выборочных характеристик – вот суть вероятностно-статистических методов принятия решений.

Подчеркнем, что логика использования выборочных характеристик для принятия решений на основе теоретических моделей предполагает одновременное использование двух параллельных рядов понятий, один из которых соответствует вероятностным моделям, а второй – выборочным данным. К сожалению, в ряде литературных источников, обычно устаревших либо написанных в рецептурном духе, не делается различия между выборочными и теоретическими характеристиками, что приводит читателей к недоумениям и ошибкам при практическом использовании статистических методов.

Предыдущая

Статистические методы

Статисти́ческие ме́тоды - методы анализа статистических данных. Выделяют методы прикладной статистики , которые могут применяться во всех областях научных исследований и любых отраслях народного хозяйства, и другие статистические методы, применимость которых ограничена той или иной сферой. Имеются в виду такие методы, как статистический приемочный контроль, статистическое регулирование технологических процессов, надежность и испытания, планирование экспериментов.

Классификация статистических методов

Статистические методы анализа данных применяются практически во всех областях деятельности человека. Их используют всегда, когда необходимо получить и обосновать какие-либо суждения о группе (объектов или субъектов) с некоторой внутренней неоднородностью.

Целесообразно выделить три вида научной и прикладной деятельности в области статистических методов анализа данных (по степени специфичности методов, сопряженной с погруженностью в конкретные проблемы):

а) разработка и исследование методов общего назначения, без учета специфики области применения;

б) разработка и исследование статистических моделей реальных явлений и процессов в соответствии с потребностями той или иной области деятельности;

в) применение статистических методов и моделей для статистического анализа конкретных данных.

Прикладная статистика

Описание вида данных и механизма их порождения - начало любого статистического исследования. Для описания данных применяют как детерминированные, так и вероятностные методы. С помощью детерминированных методов можно проанализировать только те данные, которые имеются в распоряжении исследователя. Например, с их помощью получены таблицы, рассчитанные органами официальной государственной статистики на основе представленных предприятиями и организациями статистических отчетов. Перенести полученные результаты на более широкую совокупность, использовать их для предсказания и управления можно лишь на основе вероятностно-статистического моделирования. Поэтому в математическую статистику часто включают лишь методы, опирающиеся на теорию вероятностей.

Мы не считаем возможным противопоставлять детерминированные и вероятностно-статистические методы. Мы рассматриваем их как последовательные этапы статистического анализа. На первом этапе необходимо проанализировать имеющие данные, представить их в удобном для восприятия виде с помощью таблиц и диаграмм. Затем статистические данные целесообразно проанализировать на основе тех или иных вероятностно-статистических моделей. Отметим, что возможность более глубокого проникновения в суть реального явления или процесса обеспечивается разработкой адекватной математической модели.

В простейшей ситуации статистические данные - это значения некоторого признака, свойственного изучаемым объектам. Значения могут быть количественными или представлять собой указание на категорию, к которой можно отнести объект. Во втором случае говорят о качественном признаке.

При измерении по нескольким количественным или качественным признакам в качестве статистических данных об объекте получаем вектор. Его можно рассматривать как новый вид данных. В таком случае выборка состоит из набора векторов. Есть часть координат - числа, а часть - качественные (категоризованные) данные, то говорим о векторе разнотипных данных.

Одним элементом выборки, то есть одним измерением, может быть и функция в целом. Например, описывающая динамику показателя, то есть его изменение во времени, - электрокардиограмма больного или амплитуда биений вала двигателя. Или временной ряд, описывающий динамику показателей определенной фирмы. Тогда выборка состоит из набора функций.

Элементами выборки могут быть и иные математические объекты. Например, бинарные отношения. Так, при опросах экспертов часто используют упорядочения (ранжировки) объектов экспертизы - образцов продукции, инвестиционных проектов, вариантов управленческих решений. В зависимости от регламента экспертного исследования элементами выборки могут быть различные виды бинарных отношений (упорядочения, разбиения, толерантности), множества, нечеткие множества и т. д.

Итак, математическая природа элементов выборки в различных задачах прикладной статистики может быть самой разной. Однако можно выделить два класса статистических данных - числовые и нечисловые. Соответственно прикладная статистика разбивается на две части - числовую статистику и нечисловую статистику.

Числовые статистические данные - это числа, вектора, функции. Их можно складывать, умножать на коэффициенты. Поэтому в числовой статистике большое значение имеют разнообразные суммы. Математический аппарат анализа сумм случайных элементов выборки - это (классические) законы больших чисел и центральные предельные теоремы.

Нечисловые статистические данные - это категоризованные данные, вектора разнотипных признаков, бинарные отношения, множества, нечеткие множества и др. Их нельзя складывать и умножать на коэффициенты. Поэтому не имеет смысла говорить о суммах нечисловых статистических данных. Они являются элементами нечисловых математических пространств (множеств). Математический аппарат анализа нечисловых статистических данных основан на использовании расстояний между элементами (а также мер близости, показателей различия) в таких пространствах. С помощью расстояний определяются эмпирические и теоретические средние, доказываются законы больших чисел, строятся непараметрические оценки плотности распределения вероятностей, решаются задачи диагностики и кластерного анализа, и т. д. (см. ).

В прикладных исследованиях используют статистические данные различных видов. Это связано, в частности, со способами их получения. Например, если испытания некоторых технических устройств продолжаются до определенного момента времени, то получаем т. н. цензурированные данные, состоящие из набора чисел - продолжительности работы ряда устройств до отказа, и информации о том, что остальные устройства продолжали работать в момент окончания испытания. Цензурированные данные часто используются при оценке и контроле надежности технических устройств.

Обычно отдельно рассматривают статистические методы анализа данных первых трех типов. Это ограничение вызвано тем отмеченным выше обстоятельством, что математический аппарат для анализа данных нечисловой природы - существенно иной, чем для данных в виде чисел, векторов и функций.

Вероятностно-статистическое моделирование

При применении статистических методов в конкретных областях знаний и отраслях народного хозяйства получаем научно-практические дисциплины типа «статистические методы в промышленности», «статистические методы в медицине» и др. С этой точки зрения эконометрика - это «статистические методы в экономике». Эти дисциплины группы б) обычно опираются на вероятностно-статистические модели, построенные в соответствии с особенностями области применения. Весьма поучительно сопоставить вероятностно-статистические модели, применяемые в различных областях, обнаружить их близость и вместе с тем констатировать некоторые различия. Так, видна близость постановок задач и применяемых для их решения статистических методов в таких областях, как научные медицинские исследования, конкретные социологические исследования и маркетинговые исследования, или, короче, в медицине , социологии и маркетинге . Они часто объединяются вместе под названием «выборочные исследования».

Отличие выборочных исследований от экспертных проявляется, прежде всего, в числе обследованных объектов или субъектов - в выборочных исследованиях речь обычно идет о сотнях, а в экспертных - о десятках. Зато технологии экспертных исследований гораздо изощреннее. Еще более выражена специфика в демографических или логистических моделях, при обработке нарративной (текстовой, летописной) информации или при изучении взаимовлияния факторов.

Вопросы надежности и безопасности технических устройств и технологий, теории массового обслуживания подробно рассмотрены, в большом количестве научных работ.

Статистический анализ конкретных данных

Применение статистических методов и моделей для статистического анализа конкретных данных тесно привязано к проблемам соответствующей области. Результаты третьего из выделенных видов научной и прикладной деятельности находятся на стыке дисциплин. Их можно рассматривать как примеры практического применения статистических методов. Но не меньше оснований относить их к соответствующей области деятельности человека.

Например, результаты опроса потребителей растворимого кофе естественно отнести к маркетингу (что и делают, читая лекции по маркетинговым исследованиям). Исследование динамики роста цен с помощью индексов инфляции, рассчитанных по независимо собранной информации, представляет интерес прежде всего с точки зрения экономики и управления народным хозяйством (как на макроуровне, так и на уровне отдельных организаций).

Перспективы развития

Теория статистических методов нацелена на решение реальных задач. Поэтому в ней постоянно возникают новые постановки математических задач анализа статистических данных, развиваются и обосновываются новые методы. Обоснование часто проводится математическими средствами, то есть путем доказательства теорем. Большую роль играет методологическая составляющая - как именно ставить задачи, какие предположения принять с целью дальнейшего математического изучения. Велика роль современных информационных технологий, в частности, компьютерного эксперимента.

Актуальной является задача анализа истории статистических методов с целью выявления тенденций развития и применения их для прогнозирования.

Литература

2. Нейлор Т. Машинные имитационные эксперименты с моделями экономических систем. - М.: Мир, 1975. - 500 с.

3. Крамер Г. Математические методы статистики. - М.: Мир, 1948 (1-е изд.), 1975 (2-е изд.). - 648 с.

4. Большев Л. Н., Смирнов Н. В. Таблицы математической статистики. - М.: Наука, 1965 (1-е изд.), 1968 (2-е изд.), 1983 (3-е изд.).

5. Смирнов Н. В., Дунин-Барковский И. В. Курс теории вероятностей и математической статистики для технических приложений. Изд. 3-е, стереотипное. - М.: Наука, 1969. - 512 с.

6. Норман Дрейпер, Гарри Смит Прикладной регрессионный анализ. Множественная регрессия = Applied Regression Analysis. - 3-е изд. - М.: «Диалектика» , 2007. - С. 912. - ISBN 0-471-17082-8

Смотри также

Wikimedia Foundation . 2010 .

  • Yat-Kha
  • Амальгама (значения)

Смотреть что такое "Статистические методы" в других словарях:

    СТАТИСТИЧЕСКИЕ МЕТОДЫ - СТАТИСТИЧЕСКИЕ МЕТОДЫ научные методы описания и изучения массовых явлений, допускающих количественное (численное) выражение. Слово “статистика” (от игал. stato государство) имеет общий корень со словом “государство”. Первоначально оно… … Философская энциклопедия

    СТАТИСТИЧЕСКИЕ МЕТОДЫ – - научные методы описания и изучения массовых явлений, допускающих количественное (численное) выражение. Слово «статистика» (от итал. stato – государство) имеет общий корень со словом «государство». Первоначально оно относилось к науке управления и … Философская энциклопедия

    Статистические методы - (в экологии и биоценологии) методы вариационной статистики, позволяющие исследовать целое (напр., фитоценоз, популяцию, продуктивность) по его частным совокупностям (напр., по данным, полученным на учетных площадках) и оценить степень точности… … Экологический словарь

    статистические методы - (в психологии) (от лат. status состояние) нек рые методы прикладной математической статистики, используемые в психологии в основном для обработки экспериментальных результатов. Основная цель применения С. м. повышение обоснованности выводов в… … Большая психологическая энциклопедия

    Статистические методы - 20.2. Статистические методы Конкретные статистические методы, используемые для организации, регулирования и проверки деятельности, включают, но не ограничиваются следующими: а) планированием экспериментов и факторный анализ; b) анализ дисперсии и … Словарь-справочник терминов нормативно-технической документации

    СТАТИСТИЧЕСКИЕ МЕТОДЫ - методы исследования количеств. стороны массовых обществ. явлений и процессов. С. м. дают возможность в цифровом выражении характеризовать происходящие изменения в обществ. процессах, изучать разл. формы социально экономич. закономерностей, смену… … Сельско-хозяйственный энциклопедический словарь

    СТАТИСТИЧЕСКИЕ МЕТОДЫ - некоторые методы прикладной математической статистики, используемые для обработки экспериментальных результатов. Ряд статистических методов был разработан специально для проверки качества психологических тестов, для применения в профессиональном… … Профессиональное образование. Словарь

    СТАТИСТИЧЕСКИЕ МЕТОДЫ - (в инженерной психологии) (от лат. status состояние) некоторые методы прикладной статистики, используемые в инженерной психологии для обработки экспериментальных результатов. Основная цель применения С. м. повышение обоснованности выводов в… … Энциклопедический словарь по психологии и педагогике

Поделиться