Релевантна вибірка. Генеральна сукупність та вибірковий метод. Стратегії побудови груп

Емпіричні вважаються одним з основних засобів вивчення суспільних відносин та процесів. Вони забезпечують отримання надійної, повної та репрезентативної інформації.

Специфіка прийомів

Емпіричні забезпечують здобуття фактофіксуючого знання. Вони сприяють встановленню та узагальненню обставин за рахунок опосередкованої чи прямої реєстрації подій, властивих досліджуваним відносинам, об'єктам, явищам. Емпіричні прийоми відрізняються від теоретичних тим, що предметом аналізу виступають:

  1. Поведінка індивідів та його груп.
  2. Продукти діяльності.
  3. Вербальні дії індивідів, їх судження, погляди, поняття.

Вибіркові дослідження

Емпіричне вивчення завжди орієнтоване отримання об'єктивних і точних відомостей, кількісних даних. У зв'язку з цим при його виконанні необхідно забезпечити репрезентативність інформації. Відповідно, особливе значення має правильна вибіркова сукупність. Цеозначає, що відбір необхідно здійснювати те щоб отримані дані вузької групи відбивали тенденції, які у загальної масі респондентів. Наприклад, при опитуванні 200-300 осіб отримані дані можна екстраполювати на всі міське населення. Показники вибіркової сукупності дозволяють по-іншому підійти до вивчення суспільно-економічних процесів у регіоні, у країні загалом.

Термінологія

Для кращого розуміння питань щодо вибіркових досліджень необхідно роз'яснити деякі визначення. Одиницею спостереження називають безпосереднє джерело інформації. Їм може бути окремий індивід, група, документ, організація тощо. Генеральна сукупність – цекомплекс одиниць спостереження. Вони всі повинні стосуватися проблеми, яка вивчається. Безпосередньому аналізу підлягає. Вивчення здійснюється відповідно до розроблених прийомів збору відомостей. Для визначення цієї частки всього масиву респондентів використовують поняття "вибіркова сукупність". Її властивість відбивати ключові параметри загальної маси людей називається репрезентативністю. У ряді випадків збіги відсутні. Тоді говорять про помилку репрезентативності.

Забезпечення репрезентативності

Детально питання, пов'язані з ним, розглядаються у рамках статистики. Проблеми відрізняються складністю, оскільки, з одного боку, йдеться про забезпечення кількісної репрезентації, яку дає Генеральна сукупність. Цеозначає, зокрема, що групи опитаних мають бути представлені в оптимальному числі. Кількість має бути достатньою для нормального представництва. З іншого боку, мають на увазі і якісна репрезентація. Вона передбачає певний суб'єктний склад, яким формується вибіркова сукупність. Цеозначає, що, наприклад, про репрезентативність не може йтися, якщо опитуються виключно чоловіки або жінки, люди похилого віку або молодь. Вивчення має здійснюватися у межах всіх представлених груп.

Характеристика вибірки

Цей термін у двох аспектах. Насамперед вона визначається як комплекс елементів від загального масиву людей, думка яких вивчається, - це вибіркова сукупність. Цетакож процес створення певної категорії респондентів за необхідного забезпечення репрезентативності. На практиці виділяється кілька типів та видів відбору. Розглянемо їх.

Типи

Їх існує три:

  1. Стихійна вибіркова сукупність. Ценабір респондентів, які відібрані за принципом добровільності. Разом з цим забезпечується доступність входження одиниць від загальної маси людей до конкретної групи вивчення. Стихійний відбір практично застосовується досить часто. Наприклад, при опитуваннях у пресі, поштою. Однак цей прийом має суттєвий недолік. У ньому неможливо якісно уявити весь обсяг генеральної вибірки. Цей прийом застосовується з урахуванням економічності. У деяких опитуваннях цей варіант є єдиним можливим.
  2. Стихійна вибіркова сукупність. Цеодин з основних прийомів, що застосовуються щодо. Як ключовий принцип такого відбору виступає забезпечення можливості кожної одиниці спостереження потрапити із загальної маси індивідів у вузьку групу. Для цього використовуються різні прийоми. Наприклад, може бути лотерейний, механічний відбір, таблиця випадкових чисел.
  3. Стратифікована (квотна) вибірка. У її основі лежить формування якісної моделі загальної маси респондентів. Після цього здійснюється відбір одиниць у вибіркову сукупність. Наприклад, він виконується за віковою чи статевою ознакою, за верствами населення тощо.

Види

Існують такі вибірки:

Додатково

Вибірки можуть бути також залежними та незалежними. У першому випадку процедура експерименту та результати, які будуть під час нього отримані для однієї групи респондентів, мають певний вплив на іншу. Відповідно, незалежні вибірки не передбачають наявність такого впливу. Тут, однак, слід звернути увагу на один важливий момент. Одна група піддослідних, щодо якої психологічне обстеженняпроводилося двічі (навіть якщо вона була спрямована на вивчення різних якостей, особливостей, ознак), за умовчанням вважатиметься залежною.

Імовірнісні відбори

Розглянемо деякі типи вибірок:

  1. Випадкова. Вона передбачає однорідність загальної сукупності, одну можливість доступності всіх компонентів, і навіть наявність повного переліку елементів. Як правило, у процесі відбору використовується таблиця з довільними числами.
  2. Механічна. Цей різновид випадкової вибірки передбачає впорядкування за певною ознакою. Наприклад, за номером телефону, в алфавітному порядку, за датою народження тощо. Перший компонент вибирається у випадковому порядку. Далі здійснюється відбір кожного елемента з кроком n. Розмір загальної сукупності буде N=k*n.
  3. Стратифікована. Ця вибірка використовується за неоднорідності загальної сукупності. Остання розбивається на страти (групи). У кожному їх відбір проводиться механічним чи випадковим методом.
  4. Серійне. Відбір груп здійснюється випадково. Усередині них об'єкти вивчаються суцільником.

Неймовірні відбори

Вони передбачають вибірку за принципом випадковості, а, по суб'єктивним ознаками: типовості, доступності, рівного представництва тощо. До цієї категорії відносять відбори:

Нюанс

Для забезпечення репрезентативності необхідний точний та повний перелік одиниць сукупності. Об'єктами спостереження, зазвичай, виступає одна людина. Відбір із переліку краще здійснювати, нумеруючи одиниці та застосовуючи таблицю з випадковими числами. Але досить часто використовується і квазівипадковий метод. Він передбачає відбір із переліку кожного n елемента.

фактори, що впливають

Обсягом сукупності називають кількість її одиниць. На думку фахівців, він не обов'язково має бути більшим. Безсумнівно, що більше число респондентів, то точніше результат. Однак разом із цим великий обсяг не завжди гарантує успіх. Наприклад, це трапляється, коли загальний масив респондентів неоднорідний. Однорідною вважатиметься така сукупність, де контрольований параметр, наприклад, рівень грамотності, розподіляється рівномірно, тобто, порожнечі чи згущення відсутні. У такому випадку достатньо опитати кілька людей. За результатами обстеження можна буде зробити висновок, що більшість людей має нормальний рівеньграмотності. З цього випливає, що на репрезентативність інформації впливають не кількісні ознаки, а якісні характеристики сукупності – рівень її однорідності, зокрема.

Помилки

Вони є відхилення середніх параметрів вибіркової сукупності від значень загальної маси респондентів. Насправді помилки визначаються з допомогою зіставлення. При обстеженні дорослих зазвичай застосовуються відомості переписів, статистичного обліку, і навіть результати минулих опитувань. Контрольними параметрами зазвичай виступають зіставлення середніх значень сукупностей (загальної та вибіркової), визначення відповідно до цього помилки і зменшення цього відхилення називається контролюванням репрезентативності.

Висновки

Вибіркове дослідження - спосіб збору даних про встановлення та поведінку людей через опитування спеціально підібраних груп респондентів. Цей прийом вважається надійним та економічним, хоча й потребує певної техніки. Як основа виступає вибіркова сукупність. Вона постає як певна частка загальної маси людей. Відбір провадиться з використанням спеціальних прийомів і спрямований на отримання інформації про всю сукупність. Остання, у свою чергу, представлена ​​всіма можливими громадськими об'єктами або їхньою групою, яка вивчатиметься. Найчастіше генеральна сукупність настільки велика, що проведення опитування кожного її представника буде досить дорогим та обтяжливим процесом. Тому використовується зменшена її модель. У вибіркову сукупність включаються всі, хто отримує анкети, хто називається респондентами, хто, власне, виступає як об'єкт вивчення. Простіше кажучи, її складає безліч людей, яких опитують.

Висновок

Цілі обстеження визначаються за конкретними категоріями, що входять до генеральної сукупності. Що ж до конкретної частки від загальної маси людей, її становлять суб'єкти, включені до групи з допомогою математичних розрахунків. Для відбору одиниць потрібний опис об'єкта вихідної сукупності. Після визначення кількості піддослідних визначається прийом чи спосіб формування груп. Результати обстеження дозволять описати ознаку щодо всіх представників загальної маси людей. Як показує практика, переважно проводяться вибіркові, а не суцільні дослідження.

Елементи, що охоплюються експериментом (спостереженням, опитуванням).

Характеристики вибірки:

  • Якісна характеристика вибірки - що саме ми вибираємо та які способи побудови вибірки ми для цього використовуємо.
  • Кількісна характеристика вибірки - скільки випадків вибираємо, тобто обсяг вибірки.

Необхідність вибірки:

  • Об'єкт дослідження дуже великий. Наприклад, споживачі продукції глобальної компанії – величезна кількість територіально розкиданих ринків.
  • Існує потреба у зборі первинної інформації.

Енциклопедичний YouTube

    1 / 5

    ✪ Вибір: розрахунок обсягу. Достовірність та потужність дослідження. Біостатистика.

    ✪ 02 – Мат. Статистика. Вибірка. Вибірковий простір. Приклади

    ✪ Основи SQL для початківців | Вибір значень з бази даних

    ✪ SQL для початківців (DML): Вибір з таблиці (MySql), Урок 4!

    ✪ Виробництво панелей SIP. Частина 2. Розкрій та фігурне різання. Вибір пазів. Все за розумом

    Субтитри

Обсяг вибірки

Обсяг вибірки - Число випадків, включених у вибіркову сукупність.

Вибірки можна умовно розділити на великі та малі, оскільки математичної статистикивикористовуються різні підходи залежно від обсягу вибірки. Вважається, що вибірки обсягу більше 30 можна зарахувати до великих.

Залежні та незалежні вибірки

При порівнянні двох (і більше) вибірок важливим параметром є їхня залежність. Якщо можна встановити гомоморфну ​​пару (тобто коли одному випадку з вибірки X відповідає один і тільки один випадок з вибірки Y і навпаки) для кожного випадку у двох вибірках (і ця підстава взаємозв'язку є важливою для вимірюваної на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок:

  • пари близнюків,
  • два виміри будь-якої ознаки до і після експериментального впливу,
  • чоловіки та дружини
  • і т.п.

Якщо такий взаємозв'язок між вибірками відсутня, то ці вибірки вважаються незалежними, наприклад:

  • чоловіки та жінки ,
  • психологи та математики.

Відповідно, залежні вибірки мають однаковий обсяг, а обсяг незалежних може відрізнятися.

Порівняння вибірок проводиться за допомогою різних статистичних критеріїв:

  • Критерій Пірсона (χ 2 )
  • Критерій Стюдента ( t )
  • Критерій Вілкоксону ( T )
  • Критерій Манна - Уітні ( U )
  • Критерій знаків ( G )
  • та ін.

Репрезентативність

Вибірка може розглядатися як репрезентативна або нерепрезентативна. Вибірка буде репрезентативною під час обстеження великої групи людей, якщо всередині цієї групи є представники різних підгруп, тільки так можна зробити правильні висновки.

Приклад нерепрезентативної вибірки

  1. Дослідження з експериментальною та контрольною групами, які ставляться у різні умови.
    • Дослідження з експериментальною та контрольною групами із залученням стратегії попарного відбору
  2. Дослідження з використанням лише однієї групи – експериментальної.
  3. Дослідження з використанням змішаного (факторного) плану – всі групи ставляться у різні умови.

Типи вибірок

Вибірки поділяються на два типи:

  • імовірнісні
  • неймовірні

Імовірнісні вибірки

  1. Проста ймовірнісна вибірка:
    • Проста повторна вибірка. Використання такої вибірки ґрунтується на припущенні, що кожен респондент з часткою ймовірності може потрапити у вибірку. За підсумками списку генеральної сукупності складаються картки з номерами респондентів. Вони поміщаються в колоду, перемішуються і їх навмання виймається картка, записується номер, потім повертається назад. Далі процедура повторюється стільки разів, який обсяг вибірки нам необхідний. Мінус: повторення одиниць відбору.

Процедура побудови простої випадкової вибірки включає наступні кроки:

1) необхідно отримати повний списокчленів генеральної сукупності та пронумерувати цей список. Такий список, нагадаємо, називається основою вибірки;

2) визначити передбачуваний обсяг вибірки, тобто очікуване число опитаних;

3) витягти з таблиці випадкових чисел стільки чисел, скільки нам потрібно вибіркових одиниць. Якщо у вибірці має бути 100 людина, з таблиці беруть 100 випадкових чисел. Ці випадкові цифри можуть генеруватися комп'ютерною програмою.

4) вибрати зі списку-основи ті спостереження, номери яких відповідають виписаним випадковим числам

  • Проста випадкова вибірка має очевидні переваги. Цей метод дуже простий для розуміння. Результати дослідження можна поширювати на сукупність, що вивчається. Більшість підходів до отримання статистичних висновків передбачають збирання інформації за допомогою простої випадкової вибірки. Однак метод простої випадкової вибірки має як мінімум чотири суттєві обмеження:

1) нерідко складно створити основу вибіркового спостереження, яка б провести просту випадкову вибірку.

2) результатом застосування простої випадкової вибірки може стати велика сукупність, або сукупність, розподілена на великій географічній території, що значно збільшує час і вартість збору даних.

3) результати застосування простої випадкової вибірки часто характеризуються низькою точністю та більшою стандартною помилкою, ніж результати застосування інших імовірнісних методів.

4) у результаті застосування SRS може сформуватися нерепрезентативна вибірка. Хоча вибірки, отримані простим випадковим відбором, в середньому адекватно представляють генеральну сукупність, деякі з них вкрай некоректно представляють сукупність, що вивчається. Імовірність цього особливо велика за невеликого обсягу вибірки.

  • Проста неповторна вибірка. Процедура побудови вибірки така сама, тільки картки з номерами респондентів не повертаються назад у колоду.
  1. Систематична імовірнісна вибірка. Є спрощеним варіантом простої імовірнісної вибірки. За підсумками списку генеральної сукупності через певний інтервал (К) відбираються респонденти. Розмір До визначається випадково. Найбільш достовірний результат досягається при однорідній генеральній сукупності, інакше можливі збіг величини кроку та якихось внутрішніх циклічних закономірностей вибірки (змішування вибірки). Мінуси: такі ж, як і в простій імовірнісній вибірці.
  2. Серійна (гніздова) вибірка. Одиниці відбору є статистичні серії (сім'я, школа, бригада тощо). Відібрані елементи зазнають суцільного обстеження. Відбір статистичних одиниць може бути організований на кшталт випадкової чи систематичної вибірки. Мінус: Можливість більшої однорідності, ніж у генеральній сукупності.
  3. Районована вибірка. У разі неоднорідної генеральної сукупності, перш ніж використовувати ймовірнісну вибірку з будь-якою технікою відбору, рекомендується розділити генеральну сукупність на однорідні частини, така вибірка називається районованою. Групами районування можуть бути як природні освіти (наприклад, райони міста), і будь-який ознака, закладений основою дослідження. Ознака, на основі якої здійснюється поділ, називається ознакою розшарування та районування.
  4. «Зручна» вибірка. Процедура «зручної» вибірки полягає у встановленні контактів із «зручними» одиницями вибірки – з групою студентів, спортивною командою, з друзями та сусідами. Якщо необхідно отримати інформацію щодо реакції людей на нову концепцію, така вибірка цілком обґрунтована. «Зручну» вибірку часто використовують із попереднього тестування анкет.

Неймовірні вибірки

Відбір у такій вибірці здійснюється за принципами випадковості, а, по суб'єктивним критеріям - доступності, типовості, рівного представництва тощо.

  1. Квотна вибірка - вибірка будується як модель, яка відтворює структуру генеральної сукупності у вигляді квот (пропорцій) ознак, що вивчаються. Число елементів вибірки з різним поєднанням ознак, що вивчаються, визначається з таким розрахунком, щоб воно відповідало їх частці (пропорції) в генеральній сукупності. Так, наприклад, якщо генеральна сукупність у нас представлена ​​5000 чоловік, з них 2000 жінок та 3000 чоловіків, тоді у квотній вибірці у нас будуть 20 жінок та 30 чоловіків, або 200 жінок та 300 чоловіків. Квотовані вибірки найчастіше ґрунтуються на демографічних умовах: стать, вік, регіон, дохід, освіта та інші. Мінуси: зазвичай такі вибірки нерепрезентативні, тому що не можна врахувати відразу кілька соціальних параметрів. Плюси: доступний матеріал.
  2. Спосіб снігового кома. Вибірка будується в такий спосіб. У кожного респондента, починаючи з першого, просяться контакти його друзів, колег, знайомих, які б підходили під умови відбору і могли б взяти участь у дослідженні. Отже, крім першого кроку, вибірка формується з участю самих об'єктів дослідження. Метод часто застосовується, коли необхідно знайти та опитати важкодоступні групи респондентів (наприклад, респондентів, які мають високий дохід, респондентів, що належать до однієї професійної групи, респондентів, які мають схожі хобі/захоплення тощо).
  3. Стихійна вибірка – вибірка так званого «першого зустрічного». Часто використовується в теле- та радіоопитуваннях. Розмір та склад стихійних вибірок заздалегідь не відомий, і визначається лише одним параметром – активністю респондентів. Мінуси: неможливо встановити якусь генеральну сукупність представляють опитані, і як наслідок - неможливість визначити репрезентативність.
  4. Маршрутне опитування – часто використовується, якщо одиницею вивчення є сім'я. На карті населеного пункту, в якому проводитиметься опитування, нумеруються всі вулиці. З допомогою таблиці (генератора) випадкових чисел відбираються великі числа. Кожна велика кількість розглядається як що складається з 3-х компонентів: номер вулиці (2-3 перших числа), номер будинку, номер квартири. Наприклад, число 14832: 14 – це номер вулиці на карті, 8 – номер будинку, 32 – номер квартири.
  5. Районована вибірка із відбором типових об'єктів. Якщо після районування з кожної групи відбирається типовий об'єкт, тобто об'єкт, який переважно досліджуваних у дослідженні характеристик наближається до середніх показників, така вибірка називається районованої з відбором типових об'єктів.
  6. Модальна вибірка.
  7. Експертна вибірка.
  8. Гетерогенна вибірка.

Стратегії побудови груп

Відбір груп для їх участі в психологічний експериментздійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої та зовнішньої валідності.

Рандомізація

Рандомізація, або випадковий відбірвикористовується для створення простих випадкових вибірок. Використання такої вибірки ґрунтується на припущенні, що кожен член популяції з рівною ймовірністю може потрапити у вибірку. Наприклад, щоб зробити випадкову вибірку зі 100 студентів вузу, можна скласти папірці з іменами всіх студентів вузу в капелюх, а потім дістати з нього 100 папірців - це буде випадковим відбором (Гудвін Дж., с. 147).

Попарний відбір

Попарний відбір- стратегія побудови груп вибірки, у якому групи піддослідних складаються з суб'єктів, еквівалентних за значними експерименту побічним параметрам. Ця стратегія ефективна для експериментів з використанням експериментальних та контрольних груп з кращим варіантом - залученням близнюкових пар (моно- та дизиготних).

Стратометричний відбір

Стратометричний відбір- рандомізація із виділенням страт (чи кластерів). При даному способі формування вибірки генеральна сукупність ділиться на групи (страти), що мають певні характеристики (стаття, вік, політичні переваги, освіта, рівень доходів та ін), і відбираються піддослідні з відповідними характеристиками.

Наближене моделювання

Наближене моделювання- Складання обмежених вибірок та узагальнення висновків про цю вибірку на ширшу популяцію. Наприклад, за участю у дослідженні студентів 2-го курсу університету дані цього дослідження поширюються на «людей віком від 17 до 21 року». Допустимість подібних узагальнень вкрай обмежена.

Наближене моделювання - формування моделі, яка чітко обумовленого класу систем (процесів) визначає його поведінка (чи необхідні явища) з прийнятною точністю.

Поняття «репрезентативність» стосовно соціологічних опитувань - опитувань громадської думки - має майже магічну дію на людей. Сам термін «репрезентація» має, крім наукового, ще й явно політичне значення.

В чому причина? Вся справа в тому, що передбачається, що вибірка (група людей, відібрана для опитування) може представляти всю генеральну сукупність. Генеральною сукупністю у разі загальноросійських опитувань є населення країни. Тепер уявімо, що мова йдепро політичне рішення - підтримку законопроекту чи голосування під час виборів. За допомогою вибіркового опитування ми отримуємо відмінний механізм політичної репрезентації – механізм, у якому невелика група людей може представляти думку чи позицію населення країни. Тому репрезентативності дослідження приділяється таке важливе місце.

Поняття репрезентативності використовується, зрозуміло, у політичних дослідженнях. Термін застосовується практично завжди, коли йдеться про великі дослідження, чи то у сфері маркетингу, економічної поведінки чи освіти.

Методологія репрезентативних опитувань

Як, опитавши 1500 осіб, можна робити висновки про всіх росіян, яких понад 140 мільйонів (і навіть виборців понад 110 мільйонів)? Технологія, яка стоїть за репрезентативними опитуваннями, ґрунтується на статистичних законах. Найближчою підставою є закон великих чисел, або теорема Бернуллі.

Спрощено його зміст можна передати так. Припустимо, ми маємо деяку ознаку, наприклад кількість опадів за день в Єкатеринбурзі протягом ХХ століття. Якщо ми випишемо всі його значення разом із їх частотою (це називається розподілом), а потім випадково візьмемо досить велику кількість випадків (тобто не всі дні у ХХ столітті, але досить багато), то ми побачимо, що розподіл у нашій вибірці буде дуже схожим на розподіл за все ХХ століття. Таким чином, якщо ми відбираємо із сукупності деякі одиниці, вони справді можуть представляти всю сукупність, і насправді немає необхідності збирати дані з усіх випадків.

Однак є ключова умова: це правильно, тільки якщо проводити відбір суворо випадковим чином. Єдиною проблемою може бути відхилення від випадковості. Так, якщо ми візьмемо лише дані щодо опадів за Останніми роками(Наприклад, тому що ці дані простіше знайти) або опитаємо 1500 своїх знайомих (бо з ними простіше зв'язатися), а не випадкових людей, то вибірка, звичайно, не буде репрезентативною.

Уявіть, що з 143,5 мільйонів росіян ви випадково відбираєте необхідні вам 1500 чоловік. Тоді, наприклад, частка менеджерів середньої ланки серед них приблизно дорівнює частці менеджерів середньої ланки в генеральній сукупності, що і показує, що ваша вибірка може представляти всю сукупність. Чи може так вийти, що ці два показники сильно відрізнятимуться? Наприклад, серед росіян він становить 14%, а у вибірці він становитиме лише 1%? Теоретично це можливо, проте ймовірність цього настільки мала, що її можна знехтувати (приблизно як зустріти дракона на вулиці).

Більш того, найприємніше в цій ймовірності навіть не те, що вона мала, а те, що для випадкових процесів цю ймовірність можна обчислити. Ми можемо сказати, з якою ймовірністю наше вибіркове значення відхилиться від значення в генеральній сукупності на 13% (як у прикладі вище), а з якою, скажімо, на 2,5%. Зазвичай, втім, роблять навпаки: спочатку визначають ймовірність, з якої ми хочемо, щоб наше значення не відхилялося від значення в генеральній сукупності (найчастіше його фіксують на рівні 95%), а потім уже дивляться, яка величина відхилення при тому чи іншому розмірі вибірки. Це відхилення називається довірчим інтервалом, іноді його називають помилкою вибірки чи статистичної похибкою – його часто наводять поруч із результатами опитування.

Отже, ймовірність відхилення, величина відхилення (довірчий інтервал) та розмір вибірки пов'язані між собою. Виходячи з цього, формула для розрахунку розміру вибірки виглядає так:

де n – розмір вибірки, Δ – довірчий інтервал, z – значення функції нормального розподілудля цієї ймовірності відхилення (для ймовірності 5% це значення становить 1,96).

Це спрощена формула, в реальних опитуваннях використовуються дещо більше складні формули. Ця формула також може давати збій, якщо значення показника сильно відрізняється від 50% (тому, наприклад, ця формула не підійде для того, щоб оцінити частку хворих на рідкісне захворювання в країні).

Ось що буде, якщо підставити в цю формулу деякі значення:

Іншими словами, якщо ми взяли випадкову вибірку росіян розміром у 1600 осіб і оцінили якийсь показник, наприклад, готовність голосувати за певного політика, то з ймовірністю 95% наша оцінка не відрізнятиметься від готовності проголосувати за нього серед усіх росіян більш ніж на 2, 45%.

Розмір вибірки

Отже, чим більший розмір вибірки, тим більша ймовірність того, що ми будемо ближчими до частки в генеральній сукупності. Здавалося б, це означає, що нам потрібно намагатися наблизити вибірку до 143,5 млн. Насправді, як можна бачити з таблиці, природа випадкових процесів така, що з певного моменту можливість потрапити в інтервал починає підвищуватися дуже повільно (і цей момент настає доволі швидко). Після того як ми відбираємо 1500 одиниць, як би ми сильно не збільшували обсяг вибірки, ймовірність, що наше значення за вибіркою потрапить у значення за генеральною сукупністю, зростатиме дуже і дуже повільно.

Фактично різниці між 1500 та 10 000 опитаних майже немає. Десь до 1500 ми вже можемо говорити, що наші оцінки відрізнятимуться від частки в генеральній сукупності на 2–3%. Якщо ми збільшуємо вибірку далі, ця можлива помилка буде зменшуватися, але дуже незначно. Інакше кажучи, вибірка в 100 000 краще, ніж вибірка в 2500, але різниця настільки мала, що немає сенсу, а разі соціальних обстежень і економічно не обгрунтована. Зазвичай збільшення вибірки коштує дорого, і тому її немає сенсу роздмухувати заради того, щоб виграти один відсотковий пункт у розмірі довірчого інтервалу.

Важливо, що у формулі взагалі фігурує розмір генеральної сукупності. Справа в тому, що коли генеральна сукупність велика (понад 20 000), він практично не впливає на розмір вибірки. Таким чином, нам не потрібно знати, скільки людей живе в Росії, щоби побудувати репрезентативну вибірку. Зрозуміло, що вибирати 1500 із 2000, швидше за все, не має сенсу – простіше обстежити 2000 та отримати точну оцінку. Але, роблячи у разі потреби вибірку, ми маємо можливість узагальнювати її результати для генеральної сукупності. І з цієї ж причини розмір вибірки не відрізнятиметься для великих та маленьких країн.

Репрезентативність та точність

Щоб зрозуміти зміст поняття «репрезентативність», розглянемо вибірку в 15 осіб. Як не дивно, якщо ви зробили її випадково, вона також репрезентативна. Більше того, ви можете зробити вибірку на одну одиницю. Уявіть ящик з кулями, звідки ви випадково берете одну кулю. Якщо це випадково обрана куля, то вона теж буде репрезентувати всі кулі, що є в цій скриньці. Просто він буде репрезентувати їх неточно. Чому? Тому що є дуже велика можливість помилитися. Наступного разу ми можемо витягнути іншу кулю і отримати інше уявлення про кулі в ящику. Репрезентувати неточно означає мати велику кількість оцінок.

Так само і 15 осіб репрезентують будь-яку генеральну сукупність, але вони репрезентують її неточно, тому що похибка, довірчий інтервал дуже великі. Нам доведеться додавати +/- 33%, щоб отримати 95% ймовірності того, що ми потрапимо в інтервал. Якщо ми готові це допустити, то беремо 15 осіб, з'ясовуємо, що 7 з них – це менеджери середньої ланки, а далі отримуємо оцінку, що 7/15 від сукупності, тобто 47% +/- 33% – це і є оцінка частки менеджерів у генеральній сукупності, і це абсолютно коректний висновок. Просто він не має жодної цінності. Це ми могли сказати без обстеження. Тому, плануючи вибірку, має сенс досягати такого обсягу, який буде доцільним з погляду співвідношення витрат та ефективності.

Все сказане покликане донести одну просту думку, яку часто не усвідомлюють: обсяг вибірки не пов'язаний з її репрезентативністю.

Маленька вибірка неточна, але вона все одно може бути репрезентативною. Обсяги вибірок, які використовуються сьогодні в масових опитуваннях в Росії, майже завжди мають досить високу точність.

Погрожує репрезентативності вибірки не її обсяг, а зміщення, тобто відхилення від принципу випадковості.

Порушення принципу випадковості

Якщо ми починаємо вибирати одиниці невипадковим чином, вибірка стає нерепрезентативною. Наприклад, якщо щось заважає нам відбирати їх випадково. Уявімо, що ми хочемо відібрати кулі з нашого ящика випадковим чином, але тут виявляється, що частина куль кусається. Механізм, при якому ми братимемо лише ті кульки, які даються нам у руки, - це механізм, що порушує випадковість і тому порушує репрезентативність. В цьому випадку, скільки б ми кульок не взяли з ящика (навіть якщо ми візьмемо всі кульки, які не кусаються), у нас буде нерепрезентативна вибірка, тому що ми не врахуємо жодного з тих, що кусаються - вони просто пройдуть нашу вибірку .

Найбільша проблема з кулями, що кусаються, полягає в тому, що вони можуть відрізнятися від тих, які йдуть до нас в руки, і відрізнятися якраз за тією ознакою, яка нас цікавить. Така ситуація називається систематичною помилкою вибірки.

Потрібно відрізняти ситуацію неточної репрезентації, яку ми описали вище, від ситуації нерепрезентативності. Це різні проблеми, і вони мають різні способи вирішення. Не можна вирішити одну з них шляхом вирішення іншої. Якщо вибірці не вистачає репрезентативності, марно її збільшувати. Більше того, великі вибірки у соціальних обстеженнях мають властивість накопичувати помилки, тому за допомогою сильного збільшення вибірки проблему репрезентації можна лише посилити.

Чому репрезентативність неможлива

У примітках до таблиць з результатами опитувань часто можна побачити, що «обсяг вибірки становить 1600 осіб, вибірка репрезентативна за статтю та віком». Зі сказаного вище очевидно, що це два різних параметрів: вказівка ​​на репрезентативність не пов'язана з обсягом вибірки Насправді тут мають на увазі те, що виконувались певні процедури, щоб забезпечити відповідність між вибіркою та генеральною сукупністю. Наприклад, щоб забезпечити репрезентативність за статтю, у вибірку набирають чоловіків і жінок у таких самих співвідношеннях, які існують серед росіян за даними перепису. Але репрезентативність за статтю не означає репрезентативності, наприклад, з політичних поглядів.

Чому доводиться вирівнювати вибірку за статтю та іншими соціально-демографічними категоріями? Тому що справжню репрезентативність може забезпечити лише випадкова вибірка, а реалізувати її практично неможливо з маси причин. Як тільки ви спробуєте це зробити, ви зіткнетеся з безліччю проблем - байдуже, яким методом ви захочете скористатися. Частина респондентів взагалі виявиться недоступною для вашого методу (скажімо, для особистих інтерв'ю великою проблемою є будинки з домофонами та охороною), ще частина буде відсутня, не відповідатиме або волітиме займатися своїми справами. Є люди, які мають мовні проблеми, і вони не можуть з нами говорити. Є люди, які не розуміють, навіщо це потрібно, і вони не хочуть говорити з нами. Все це - серйозні порушення випадковості, які унеможливлюють її реалізацію.

Ті, хто зводить проблему репрезентації у масових опитуваннях до статистики, забувають про те, що люди – це дуже специфічні кульки. Є кульки, які тікають та ховаються. Є кульки, які кусаються. Вони не пасивні об'єкти, вони дають здачу. Вони кажуть: "Я не хочу брати участь у твоєму опитуванні", тим самим порушують випадковість. Тому в строгому значенні слова репрезентативність у масових опитуваннях, звісно, ​​неможлива у жодному вигляді.

Вироблено механізм, за допомогою якого зазвичай забезпечується видимість репрезентативності: ми вирівнюємо вибірку за деякими категоріями і робимо вигляд, що за рештою можливих категорій вона теж вирівняна. Насправді, у нас немає жодних підстав це стверджувати. Але проблема в тому, що немає і ніякої можливості це перевірити - знову ж таки через те, що деякі кульки кусаються. Щоб перевірити наявність систематичної помилки, перевіряльнику довелося б сходити до тих, кого ми не опитали, і опитати їх. Але вони, як ми пам'ятаємо, не хочуть, щоб їх опитували. Опитати тих, хто не відповідає категорично, неможливо. Тому всі працюють на припущенні, що якщо ми вирівняли вибірку за двома-трьома параметрами, вона репрезентує всю сукупність, хоча у цього припущення і немає жодних серйозних підстав.

Репрезентативна вибірка – технологія, запозичена соціологами зі статистики. Тому вона неминуче містить у собі елементи математико-статистичної картини світу. Мабуть, найсильніше припущення у тому, що саме собою вибіркове опитування політично і соціологічно нейтральний: що й неучасть у опитуванні несе у собі політичного сенсу і пов'язані з іншими соціологічно важливими параметрами. Але сьогодні опитування стали одним із головних політичних інститутів і перетворилися на ключового посередника між великими корпораціями та споживачами. У цих умовах вірити в їхню політичну стерильність уже неможливо. Однак ми, як і раніше, мало знаємо про те, як опитування розуміються на сучасних суспільствахі що вони насправді репрезентують.

Вибірка в 1С 8.2 і 8.3 спеціалізований спосіб перебору записів таблиць інформаційної бази. Розглянемо докладно, що таке вибірка та як її використовувати.

Що таке вибірка у 1С?

Вибірка- спосіб перебору інформації в 1С, який полягає у послідовній установці курсору на наступному записі. Вибірку в 1С можна отримати з результату запиту та менеджера об'єктів, наприклад, документів або довідників.

Приклад отримання та перебору з менеджера об'єкта:

Вибірка = Довідники. банки. Вибрати() ;

Поки що Вибірка. Наступний() Цикл КінецьЦикл ;

Приклад отримання вибірки із запиту:

Отримайте 267 відеоуроків з 1С безкоштовно: Запит = Новий Запит("Вибрати Посилання, Код, Найменування З Довідник.Банки" );Вибірка = Запит. Виконати() . Вибрати() ;

Поки що Вибірка. Наступний() Цикл

//виробляємо дії, що цікавлять, з довідником "Банки"

Кінець циклу; Обидва наведені вище приклади отримують однакові набори даних для перебору.Методи вибірки 1С 8.3

  • Вибірка маєвелика кількість
  • методів, розглянемо їх докладніше:Вибрати()
  • — метод, за допомогою якого безпосередньо отримують вибірку. З вибірки можна отримати ще одну, підлеглу, вибірку якщо вказано тип обходу «угруповання».Власник()
  • - Метод, обернений Вибрати (). Дозволяє отримати «батьківську» вибірку запиту.Наступний()
  • — метод, який проводить переведення курсору на наступний запис. Якщо запис існує, повертає Істина, якщо записи закінчилися - Брехня.— дозволяє отримати наступний запис, відмінний від поточного положення значення. Наприклад, необхідно перебрати всі записи з унікальний значенняполя «Контрагент»: Вибірка.
  • Скинути()— дозволяє скинути поточне розташування курсору та встановити його у початкове положення.
  • Кількість()- Повертає кількість записів у вибірці.
  • Отримати()— за допомогою методу можна встановити курсор на потрібний запис за значенням індексу.
  • Рівень()рівень у ієрархії поточного запису (число).
  • ТипЗаписи()— відображає тип запису — ДетальнийЗапис, ПідсумокУгрупування, ПідсумокПоІєрархії або ЗагальнийПідсумок
  • Угруповання()— повертає ім'я поточного угруповання, якщо запис не є групуванням — пустий рядок.

Якщо Ви починаєте вивчати програмування 1С, рекомендуємо наш безкоштовний курс(не забудьте

Часто буває так, що необхідно проаналізувати якесь конкретне соціальне явище та отримати інформацію про нього. Такі завдання часто виникають у ста...

Вибірка - це... Визначення, види, методи та результати вибірки

Від Masterweb

09.04.2018 16:00

Часто буває так, що необхідно проаналізувати якесь конкретне соціальне явище та отримати інформацію про нього. Такі завдання часто виникають у статистиці та при статистичних дослідженнях. Перевірити певне соціальне явище найчастіше буває неможливим. Наприклад, як дізнатися думку населення чи всіх мешканців певного міста з якогось питання? Запитувати всіх – справа практично неможлива і дуже трудомістка. У таких випадках нам і потрібна вибірка. Це саме те поняття, на якому ґрунтуються практично всі дослідження та аналізи.

Що таке вибірка

Під час аналізу конкретного соціального явища необхідно отримати інформацію про нього. Якщо взяти будь-яке дослідження, можна помітити, що дослідженню та аналізу підлягає не кожна одиниця сукупності об'єкта дослідження. До уваги береться лише певна частина всієї цієї сукупності. Ось цей процес і є вибіркою: коли досліджуються лише певні одиниці з множини.

Звичайно ж, багато залежить від виду вибірки. Але й основні правила. Головне з них свідчить, що відбір із сукупності має бути абсолютно випадковим. Одиниці сукупності, які будуть використані, не повинні бути обрані за будь-яким критерієм. Грубо кажучи, якщо необхідно набрати сукупність із населення певного міста та відібрати лише чоловіків, то у дослідженні буде помилка, тому що відбір було проведено не випадково, а відібрано за ґендерною ознакою. Практично всі методи вибірки ґрунтуються на цьому правилі.

Правила вибірки

Для того, щоб відібрана сукупність відображала основні якості всього явища, вона повинна бути побудована за конкретними законами, де основну увагу необхідно приділяти таким категоріям:

  • вибірка (вибіркова сукупність);
  • Генеральна сукупність;
  • репрезентативність;
  • помилка репрезентативності;
  • одиниця сукупності;
  • методи побудови вибірки.

Особливості вибіркового спостереження та складання вибірки полягають у наступному:

  1. Усі отримані результати засновані на математичних законах та правилах, тобто при правильному проведенні дослідження та при правильних розрахунках результати не будуть спотворені за суб'єктивною ознакою
  2. Дає можливість значно швидше і з меншими витратами часу та ресурсів отримати результат, вивчаючи не весь масив подій, а лише їхню частину.
  3. Може бути застосовано для вивчення різних об'єктів: від конкретних питань, наприклад, вік, стать цікавої для нас групи, до вивчення громадської думки або рівня матеріального забезпечення населення.

Вибіркове спостереження

Вибіркове - це таке статистичне спостереження, у якому дослідженню піддається не вся сукупність досліджуваного, лише деяка, відібрана певним чином її частина, а отримані результати вивчення цієї частини поширюються протягом усього сукупність. Ця частина називається вибірковою сукупністю. Це єдиний спосіб вивчення великого масиву об'єкта дослідження.

Але вибіркове спостереження можна використовувати лише у випадках, коли необхідно досліджувати лише малу групу одиниць. Наприклад, при дослідженні співвідношення чоловіків до жінок у світі використовуватиметься вибіркове спостереження. Зі зрозумілих причин – взяти до уваги кожного жителя нашої планети неможливо.

А ось при такому ж дослідженні, але не всіх мешканців землі, а певного 2 «А» класу в конкретній школі, певного міста, певної країни може обійтися без вибіркового спостереження. Адже проаналізувати весь масив об'єкта дослідження цілком можливо. Необхідно порахувати хлопчиків та дівчаток цього класу – от і буде співвідношення.


Вибіркова та генеральна сукупність

Насправді, все не так складно, як звучить. У будь-якому об'єкті вивчення є дві системи: генеральна та вибіркова сукупність. Що це таке? Усі одиниці відносяться до генеральної. А до вибіркової – ті одиниці загальної сукупності, взяті для вибірки. Якщо все правильно зроблено, то відібрана частина складатиме зменшений макет усієї (генеральної) сукупності.

Якщо говорити про генеральну сукупність, то можна виділити всього два її різновиди: певна та невизначена генеральна сукупність. Залежить від того, чи відома загальна кількість одиниць даної системи чи ні. Якщо це певна генеральна сукупність, то вибірку робитиме легше через те, що відомо, який відсоток від загальної кількості одиниць складатиме вибірка.

Цей момент дуже потрібний у дослідженнях. Наприклад, якщо необхідно досліджувати відсоток недоброякісної продукції кондитерських виробів конкретному заводі. Припустимо, що генеральну сукупність вже визначено. Достеменно відомо, що на рік це підприємство виробляє 1000 кондитерських виробів. Якщо зробити вибірку 100 випадкових кондитерських виробів із цієї тисячі та відправити їх на експертизу, то похибка буде мінімальною. Грубо кажучи, дослідженню підлягало 10% всієї продукції, і за результатами можемо, взявши до уваги помилку репрезентативності, говорити про недоброякісність усієї продукції.

А якщо провести вибірку 100 кондитерських виробів із невизначеної генеральної сукупності, де їх насправді було, припустимо, 1 млн одиниць, то результат вибірки та самого дослідження буде критично неправдоподібним та неточним. Відчуваєте різницю? Тому визначеність генеральної сукупності здебільшого є вкрай важливою і дуже сильно впливає на результат дослідження.


Репрезентативність сукупності

Отже, тепер одне з найголовніших питань – якою має бути вибірка? Це самий головний моментдослідження. На цьому етапі необхідно розрахувати вибірку та відібрати одиниці із загального числа до неї. Сукупність була відібрана правильно, якщо певні особливості та характеристики генеральної сукупності залишається і у вибірковій. Це називається репрезентативністю.

Іншими словами, якщо після відбору частина зберігає ті ж самі тенденції та особливості, що і вся кількість досліджуваного, то така сукупність називається репрезентативною. Не кожна певна вибірка може бути відібрано з репрезентативної сукупності. Бувають і такі об'єкти дослідження, вибірка яких просто не може бути репрезентативною. Звідси і виникає поняття помилки репрезентативності. Але про це поговоримо трохи більше.

Як зробити вибірку

Отже, щоб репрезентативність була максимальною, виділяють три основні правила вибірки:

  1. Найунікальнішим показником числа вибірки вважається 20%. Статистична вибірка в 20% практично завжди даватиме результат максимально наближений до дійсності. У той самий час немає необхідності переносити у зібрану більшу частину генеральної сукупності. 20% вибірки – це показник, який вироблений багатьма дослідженнями. Наведемо ще трохи теорії. Чим більша вибірка, тим менша помилка репрезентативності та точніше результат дослідження. Чим ближче буде вибіркова сукупність до генеральної за кількістю одиниць, тим точнішими та правильнішими будуть результати. Адже якщо дослідити всю систему, то результат буде 100%. Але тут уже немає вибірки. Це ті дослідження, в яких досліджується весь масив, усі одиниці, тому нас це не цікавить.
  2. У разі недоцільності обробки 20 % генеральної сукупності допускається вивчення одиниць сукупності у кількості не менше 1001. Це також один із показників дослідження масиву об'єкта дослідження, що виробився з часом. Звичайно, він не дасть точних результатів при великих масивах дослідження, але максимально наблизить до можливої ​​точності вибірки.
  3. У статистиці існує безліч формул та зведених таблиць. Залежно від об'єкта дослідження та від критерію вибірки, існує доцільність вибору тієї чи іншої формули. Але цей пункт використовується у складних та багатоетапних дослідженнях.

Похибка (помилка) репрезентативності

Головною характеристикою якості обраної вибірки є поняття «похибки репрезентативності». Що це таке? Це певні розбіжності між показниками вибіркового та суцільного спостереження. За показниками похибки репрезентативність ділять на надійну, звичайну та наближену. Інакше кажучи, допустимими є відхилення у розмірі до 3%, від 3 до 10% та від 10 до 20% відповідно. Хоча у статистиці бажано, щоб похибка не перевищувала 5-6%. В іншому випадку є привід говорити про недостатню репрезентативність вибірки. Для обчислення похибки репрезентативності та того, як вона впливає на вибіркову чи генеральну сукупність, до уваги беруться багато факторів:

  1. Імовірність, з якою потрібно отримати точний результат.
  2. Кількості одиниць вибіркової сукупності. Як згадувалося раніше, що менше одиниць складе вибірка, то більше вписувалося буде помилка репрезентативності, і навпаки.
  3. Однорідність досліджуваної сукупності. Чим більш різнорідною є сукупність, тим більшою буде похибка репрезентативності. Можливість сукупності бути репрезентативною залежить від однорідності її складових одиниць.
  4. Спосіб відбору одиниць у вибіркову сукупність.

У заданих дослідженнях відсоток похибки середнього значення зазвичай задається самим дослідником виходячи з програми спостереження і за даними раніше проведених досліджень. Як правило, вважається припустимою гранична помилка вибірки (помилка репрезентативності) у межах 3-5%.


Більше – не завжди краще

Також варто пам'ятати, що головне при організації вибіркового спостереження - доведення його обсягу до допустимого мінімуму. При цьому не слід прагнути надмірного зменшення меж похибки вибірки, оскільки це може призвести до невиправданого збільшення обсягу даних вибірки і, отже, підвищення витрат на проведення вибіркового спостереження.

У той самий час не можна надмірно збільшувати розмір похибки репрезентативності. Адже в цьому випадку, хоч і станеться зменшення обсягу вибіркової сукупності, це призведе до погіршення достовірності отриманих результатів.

Які питання зазвичай ставиться перед дослідником

Будь-яке дослідження якщо і проводиться, то для якоїсь мети та для отримання якихось результатів. Під час проведення вибіркового дослідження, зазвичай, ставляться початкові питання:

  1. Визначення необхідної кількості одиниць вибіркової сукупності, тобто скільки одиниць буде досліджуватися. До того ж, для точного дослідження сукупність має бути репрезентативною.
  2. Розрахунок похибки репрезентативності із встановленим рівнем ймовірності. Відразу слід зазначити, що вибіркових досліджень немає з рівнем ймовірності 100 %. Якщо та інстанція, яка проводила вивчення певного сегмента, стверджує, що їх результати точні з ймовірністю 100%, це брехня. Багаторічна практика вже встановила процент ймовірності правильно проведеного вибіркового дослідження. Цей показник дорівнює 95,4%.

Способи відбору одиниць дослідження у вибірку

Не кожна вибірка є репрезентативною. Іноді та сама ознака по-різному виражений загалом й у її частини. Для досягнення вимог репрезентативності є доцільним використання різних прийомів створення вибірки. Причому використання тієї чи іншої способу залежить від конкретних обставин. Серед таких прийомів створення вибірки виділяють:

  • випадковий відбір;
  • механічний відбір;
  • типовий відбір;
  • серійний (гніздовий) відбір.

Випадковий відбір є систему заходів, вкладених у випадковий відбір одиниць сукупності, коли ймовірність потрапити у вибірку є рівної всім одиниць генеральної сукупності. Цей прийом доцільно застосовувати лише у разі однорідності та невеликої кількості властивих їй ознак. В іншому випадку деякі характерні рисиризикують бути не відображеним у вибірці. Ознаки випадкового відбору є основою всіх інших способів побудови вибірки.

При механічному відборі одиниць проводиться через певний інтервал. Якщо необхідно сформувати вибірку конкретних злочинів, можна вилучати зі всіх карток статистичного обліку зареєстрованих злочинів кожну 5-ту, 10-ту або 15-ту картку в залежності від їх загальної кількості та наявних розмірів вибірки. Недоліком цього є те, що перед відбором необхідно мати повний облік одиниць сукупності, потім потрібно провести ранжування і тільки після цього можна проводити вибірку з певним інтервалом. Цей метод займає багато часу, тому і не часто використовується.


Типовий (районований) відбір – вид вибірки, у якому генеральну сукупність поділяють на однорідні групи за певною ознакою. Іноді дослідники вживають замість «груп» інші терміни: «райони» та «зони». Потім із кожної групи у випадковому порядку відбирається певна кількість одиниць пропорційно до питомої ваги групи в загальній сукупності. Типовий відбір часто здійснюється у кілька етапів.

Серійний відбір - це метод, у якому відбір одиниць проводиться групами (серіями) і обстеженню підлягають всі одиниці відібраної групи (серії). Перевагою цього є те, що іноді відібрати окремі одиниці складніше, ніж серії, наприклад, щодо особистості, яка відбуває покарання. У межах відібраних районів, зон застосовується вивчення всіх одиниць без винятку, наприклад, вивчення всіх осіб, які відбувають покарання у певному установі.

Вулиця Київян, 16 0016 Вірменія, Єреван Сервіс +374 11 233 255

Поділитися