Влияние и значение систематических ошибок. Систематические и случайные ошибки


Cтраница 1


Систематические ошибки обнаруживаются и устраняются в процессе проверки исправности машины.  

Систематическая ошибка, т.е. ошибка, повторяющаяся и одинаковая во всей серии наблюдений.  

Систематические ошибки вызываются причинами, действующими одинаковым образом при проведении измерений в одних и тех же условиях или закономерно изменяющих показания в какую-либо одну сторону при изменении этих условий.  

Систематические ошибки возникают в том случае, если поглощающие частицы не сохраняют свою идентичность в гомогенном растворе. Обычно этот эффект включает межмолекулярную ассоциацию, особенно водородную связь и мицеллообразование.  

Систематические ошибки для данного измерительного средства должны рассматриваться как случайные при общей характеристике погрешности всех измерительных средств этого типа. Например, неправильная градуировка шкалы миниметра является систематической для данного миниметра, но случайной (не постоянной по величине и знаку) для массы миниметров с такими же техническими характеристиками.  

Систематические ошибки всех разновидностей суммируются алгебраически, а случайные - по вероятностным характеристикам рассеяния.  

Систематические ошибки здесь отсутствуют, поэтому расчеты проводят сразу для Ас, предельных допусков и коэффициентов влияния. Заметим, что все первичные ошибки (суммарные боковые зазоры) относятся к группе п (Ср / 0, см. с.  

Систематические ошибки - это ошибки, вызываемые известными причинами, или причины которых можно установить при детальном рассмотрении процедуры химического анализа. Другими словами, причины систематических ошибок значимы для аналитика.  

Систематические ошибки, не изменяя величины и знака, могут повторяться во многих параллельных определениях. Например, при параллельных титрованиях нескольких проб неправильно установленным рабочим раствором получаются сходные результаты, но неверные.  

Систематические ошибки обусловлены рядом причин, среди которых важнейшими являются: а) ошибки, вызванные недостаточно точным методом, б) применение рабочих растворов с неправильно установленными или изменившимися титрами, в) пользование неточными бюретками, пипетками и измерительными колбами, г) систематическое недотитрование или перетитрование, д) неправильно выбранный индикатор и е) личные особенности аналитика.  

Систематические ошибки постоянны во всей серии измерений или изменяются по определенному закону. Выявление их требует специальных исследований, но как только систематические ошибки обнаружены, они могут быть легко устранены введением соответствующих поправок в результаты измерения.  

Систематические ошибки часто возникают вследствие отклонения поведения реагентов или реакций, на которых основано определение, от идеального. Причинами таких отклонений могут быть малая скорость реакций, неполнота их протекания, неустойчивость каких-либо веществ, неспецифичность большинства реагентов и протекание побочных реакций, мешающих процессу определения. Например, в гравиметрическом анализе перед химиком стоит задача выделения определяемого элемента в виде возможно более чистого осадка. Если осадок не удается хорошо промыть, он будет загрязнен посторонними веществами и масса его будет завышена. С другой стороны, промывание, необходимое для удаления загрязнений, может привести к потере заметного количества осадка вследствие его растворимости; в результате возникает систематическая отрицательная ошибка. В любом случае тщательность проведения операции сводится на нет систематической ошибкой, обусловленной методом анализа.  

Ошибки измерения делятся на случайные (тот самый шум, о котором шла речь ранее) и систематические. Прояснить, что такое систематическая ошиб­ка, можно на следующем примере: предположим, мы немного изменим в схеме по рис. 13.3 сопротивление резистора R2. При этом у нас на опреде­ленную величину сдвинется вся шкала измерений: показания термометра бу­дут соответствовать действительности, только если мы прибавим (или вы­чтем, неважно) некоторую константу к полученной величине: / = /’ + 5, где / - «правильное» значение температуры (оно все же отличается от истинно­го значения из-за наличия случайной ошибки); /’ - показания термометра; 5 - величина систематической ошибки из-за сдвига шкалы. Более сложный случай систематической погрешности - если мы оставим R2 в покое, а не­много изменим R5, то есть изменим наклон характеристики термометра, или, как еще это называют, крутизну преобразования. Это равносильно тому, что мы умножаем показания на некий постоянный множитель к, и «правильное» значение будет тогда определяться по формуле: t = ht\ Эти виды ошибок но­сят название аддитивной и мультипликативной погрешностей.

О систематических погрешностях математическая статистика «ничего не зна­ет», она работает только с погрешностями случайными. Единственный спо­соб избавиться от систематических погрешностей (кроме, конечно, подбора прецизионных компонентов) - это процедуры калибровки (градуировки), о них мы уже говорили в этой главе ранее.

Случайные ошибки измерения и их оценка

я предполагаю, что читатель знаком с таким понятием, как вероятность. Ес­ли же нет - настоятельно рекомендую книгу , которая есть переиздание труда от 1946 г. Расширить кругозор вам поможет классический учебник , который отличает исключительная внятность изложения (автор его, извест­ный математик Елена Сергеевна Вентцель, кроме научной и преподаватель­ской деятельности, также писала художественную литературу под псевдони­мом И. Грекова). Более конкретные сведения о приложении методов математической статистики к задачам метрологии и обработки эксперимен­тальных данных, в том числе с использованием компьютера, вы можете най­ти, например, в . Мы же остановимся на главном - расчете случайной по­грешности.

В основе математической статистики лежит понятие о нормальном распре­делении. Не следует думать, что это нечто заумное - вся теория вероятно­стей и матстатистика, как прикладная дисциплина, в особенности, основа­ны на здравом смысле в большей степени, чем какой-либо другой раздел математики.

Не составляет исключения и нормальный закон распределения, который на­глядно можно пояснить так. Представьте себе, что вы ждете автобус на оста­новке. Предположим, что автопарк работает честно, и надпись на табличке «интервал 15 мин» соответствует действительности. Пусть также известно, что предыдущий автобус отправился от остановки ровно в 10:00. Вопрос - во сколько отправится следующий?

Как бы идеально ни работал автопарк, совершенно ясно, что ровно в 10:15 следующий автобус отправится вряд ли. Пусть даже автобус выехал из парка по графику, но тут же был вынужден его нарушить из-за аварии на перекре­стке. Потом его задержал перебегающий дорогу школьник. Потом он просто­ял на остановке из-за старушки с огромной клетчатой сумкой, которая за­стряла в дверях. Означает ли это, что автобус всегда только опаздывает? От­нюдь, у водителя есть план, и он заинтересован в том, чтобы двигаться побы­стрее, потому он может кое-где и опережать график, не гнушаясь иногда и нарушением правил движения. Поэтому событие, заключающееся в том, что автобус отправится в 10.15, имеет лишь определенную вероятность, не более.

Если поразмыслить, то станет ясно, что вероятность того, что следующий автобус отправится от остановки в определенный момент, зависит также от того, насколько точно мы определяем этот момент. Ясно, что вероятность отправления в промежутке от 10.10 до 10.20 гораздо выше, чем в промежутке от 10.14 до 10.16, а в промежутке от 10 до 11 часов оно, если не возникли ка­кие-то форс-мажорные обстоятельства, скорее всего, произойдет наверняка. Чем точнее мы определяем момент события, тем меньше вероятность того, что оно произойдет именно в этот момент, и в пределе вероятность того, что любое событие произойдет ровно в указанный момент времени, равна нулю.

Такое кажущееся противоречие (на которое, между прочим, обращал внима­ние еще великий отечественный математик Колмогоров) на практике разре­шается стандартным для математики способом: мы принимаем за момент события некий малый интервал времени 5/. Вероятность того, что событие произойдет в этом интервале, уже равна не нулю, а некоей конечной величи­не бЛ а их отношение 5P/5t при устремлении интервала времени к нулю рав­на для данного момента времени некоей величине /?, именуемой плотностью распределения вероятностей. Такое определение совершенно аналогично определению плотности физического тела (в самом деле, масса исчезающе малого объема тела также стремится к нулю, но отношение массы к объему конечно) и потому многие понятия математической статистики имеют назва­ния, заимствованные из соответствующих разделов физики.

Правильно сформулированный вопрос по поводу автобуса звучал бы так: ка­ково распределение плотности вероятностей отправления автобуса во време­ни? Зная эту закономерность, мы можем всегда сказать, какова вероятность того, что автобус отправится в определенный промежуток времени.

Интуитивно форму кривой распределения плотности вероятностей опреде­лить несложно. Существует ли вероятность того, что конкретный автобус отправится, к примеру, позже 10:30 или, наоборот, даже раньше предыдуще­го автобуса? А почему нет - подобные ситуации в реальности представить себе очень легко. Однако ясно, что такая вероятность намного меньше, чем вероятность прихода «около 10:15». Чем дальше в обе стороны мы удаляемся от этого центрального наиболее вероятного срока, тем меньше плотность ве­роятности, пока она не станет практически равной нулю (то, что автобус за­держится на сутки - событие невероятное, скорее всего, если такое случи­лось, вам уже будет не до автобусов). То есть распределение плотностей ве­роятностей должно иметь вид некоей колоколообразной кривой.

В теории вероятностей доказывается, что при некоторых предположениях относительно вероятности конкретных исходов нашего события, эта кривая будет иметь совершенно определенный вид, который называется нормаль­ным распределением вероятностей или распределением Гаусса. Вид кривой плотности нормального распределения и соответствующая формула показа­ны на рис. 13.5.

Рис. 13.5. Плотность нормального распределения вероятностей

Далее мы поясним смысл отдельных параметров в этой формуле, а пока отве­тим на вопрос: действительно ли реальные события, в частности, интере­сующие нас ошибки измерения, всегда имеют нормальное распределение? Строгого ответа на этот вопрос в общем случае нет, и вот по какой причине. Математики имеют дело с абстракциями, считая, что мы уже имеем сколь угодно большой набор отдельных реализаций события (в случае с автобусом это была бы бесконечная таблица пар значений «плотность вероятности - время»). В реальной жизни такой ряд невозможно получить не только пото­му, что для этого потребовалось бы бесконечно долго стоять около остановки и отмечать моменты отправления, но и потому, что стройная картина непре­рывного ряда реализаций одного события (прихода конкретного автобуса) будет в конце концов нарушена совершенно не относящимися к делу веща­ми: маршрут могут отменить, остановку перепестри, автопарк обанкротится, не выдержав конкуренции с маршрутными такси… да мало ли что может произойти такого, что сделает бессмысленным само определение события.

Однако все же интуитивно понятно, что, пока автобус ходит, какое-то, пусть теоретическое, распределение имеется. Такой идеальный бесконеч­ный набор реализаций данного события носит название генеральной сово­купности. Именно генеральная совокупность при некоторых условиях мо­жет иметь, в частности, нормальное распределение. В реальности же мы имеем дело с выборкой из этой генеральной совокупности. Причем одна из важнейших задач, решаемых в математической статистике, состоит в том, чтобы имея на руках две разных выборки, доказать, что они принадлежат одной и той же генеральной совокупности - проще говоря, что перед нами есть реализации одного и того же события. Другая важнейшая для практи­ки задача состоит в том, чтобы по выборке определить вид кривой распре­деления и ее параметры.

На свете сколько угодно случайных событий и процессов, имеющих распре­деление, совершенно отличное от нормального, однако считается (и доказы­вается с помощью т. н. центральной предельной теоремы), что в интересую­щей нас области ошибок измерений при большом числе измерений и истинно случайном их характере, все распределения ошибок - нормальные. Предпо­ложение о большом числе измерений не слишком жесткое - реально доста­точно полутора-двух дес5Гтков измерений, чтобы все теоретические соотно­шения с большой степенью точности соблюдались на практике. А вот про истинную случайность ошибки каждого из измерений можно говорить с из­рядной долей условности: неслучайными их может сделать одно только же­лание экспериментатора побыстрее закончить рабочий день. Но математика тут уже бессильна.

Полученные опытным путем характеристики распределения называются оценками параметров, и, естественно, они будут соответствовать «настоя­щим» значениям с некоторой долей вероятности - наша задача и состоит в том, чтобы определить интервал, в котором могут находиться отклонения оценок от «истинного» значения и соответствующую ему вероятность. Но настало время все же пояснить - что же это за параметры?

в формуле на рис. 13.5 таких параметра два- величины ц и а. Они называ­ется моментами нормального распределения (аналогично моментам распре­деления масс в механике). Параметр ц называется математическим ожидани­ем (или моментом распределения первого порядка), а величина а - средним квадратическим отклонением. Нередко употребляют его квадрат, обозначае­мый как D или просто и носящий название дисперсии (или центрального момента второго порядка).

Математическое ожидание есть абсцисса максимума кривой нормального распределения (в нашем примере с автобусом это время 10:15), а дисперсия, как видно из рис. 13.5, характеризует «размытие» кривой относительно этого максимума- чем больше дисперсия, тем положе кривая. Этим моменты имеют прозрачный физический смысл (вспомните аналогию с фи^зическим распределением плотностей): математическое ожидание есть аналогия цен­тра масс некоего тела, а дисперсия характеризует распределение масс отно­сительно этого центра (хотя распределение плотности материи в физическом теле далеко от нормального распределения плотности вероятности).

Оценкой гпх математического ожидания ц служит хорошо знакомое нам со школы среднее арифметическое:

Здесь п- число измерений; /- текущий номер измерения (/= l,…,w); дс/ - значение измеряемой величины в /-м случае.

Оценка дисперсии вычисляется по формуле:

(2)

Оценка среднего квадратического отклонения, соответственно, будет:

Здесь (jc, – гПх) - отклонения конкретных измерений от ранее вычисленного среднего.

Следует особо обратить внимание, что сумму квадратов отклонений делить следует именно на « – 1, а не на «, как может показаться на первый взгляд, иначе оценка получится смещенной. Второе, на что следует обратить внима­ние - разброс относительно среднего характеризует именно среднее квадра-тическое отклонение, вычисленное по формулам (2) и (3), а не среднее арифметическое отклонение, как рекомендуют в некоторых школьных справочни­ках - последнее дает заниженную и смещенную оценку (не напоминает ли вам это аналогию со средним арифметическим и действующим значениями переменного напряжения?).

Заметки на полях

Кроме математического ожидания, средние значения распределения вероят­ностей характеризуют еще величинами, называемыми модой и медианой. В случае нормального распределения все три величины совпадают, но в дру­гих случаях они могут оказаться полезными: мода есть абсцисса наивероят-нейшего значения (то есть максимума на кривой распределения, что полно­стью отвечает бытовому понятию о моде), а медиана выборки есть такая точка, что половина выборки лежит левее ее, а вторая половина - правее.

В принципе этими формулами для расчета случайных погрешностей можно было бы ограничиться, если бы не один важный вопрос: оценки-то мы полу­чили, а вот в какой степени они отвечают действительности? Правильно сформулированный вопрос будет звучать так: какова вероятность того, что среднее арифметическое отклоняется от «истинного» значения (то есть мате­матического ожидания) не более чем на некоторою величину 8 (например, на величину оценки среднего квадратического отклонения s)?

Величина 5 носит название доверительного интервала, а соответствующая вероятность - доверительной вероятностью (или надежностью). Обычно решают задачу, противоположную сформулированной: задаются величиной надежности и вычисляют доверительный интервал 5. В технике принято за­даваться величиной надежности 95%, в очень уж серьезных случаях - 99%. Простейшее правило для обычных измерений в этом случае таково: при уело-вии достаточно большого числа измерений (практически - более 15-20) доверительной вероятности в 95% соответствует доверительный интер­вал в 2Sy а доверительной вероятности в 99% - доверительный интервал в 3s. Это известное правило «трех сигма», согласно которому за пределы утро­енного квадратического отклонения не выйдет ни один результат измерения, но на практике это слишком жесткое требование. Если мы не поленимся про­вести не менее полутора десятков отдельных измерений величины дс, то с чистой совестью можем записать, что результат будет равен

Ошибки измеренийподразделяются на систематические и случайные.

Величина систематических ошибок одинакова во всех измерениях, проводящихся одним и тем же методом с помощью одних и тех же измерительных приборов. Различают четыре группы систематических ошибок:

1) ошибки, причина возникновения которых известна и величина которых может быть определена достаточно точно. Например, при определении результата прыжка рулеткой возможно изменение её длины за счёт различий в температуре воздуха. Это изменение можно оценить и ввести поправки в измеренный результат;

2) ошибки, причина возникновения которых известна, а величина нет. Такие ошибки зависят от класса точности измерительной аппаратуры. Например, если класс точности динамометра для измерения силовых качеств спортсменов составляет 2.0, то его показания правильны с точностью до 2% в пределах шкалы прибора. Но если проводить несколько измерений подряд, то ошибка в первом из них может быть равной 0,3%, а во втором – 2%, в третьем – 0,7% и т. д. При этом точно определить её значения для каждого из измерений нельзя;

3) ошибки, происхождение которых и величина неизвестны. Обычно они проявляются в сложных измерениях, когда не удаётся учесть все источники возможных погрешностей;

4) ошибки, связанные не столько с процессом измерения, сколько со свойствами объекта измерения. Как известно, объектами измерений в спортивной практике являются действия и движения спортсмена, его социальные, психологические, биохимические и т. п. показатели. Измерения такого типа характеризуются определённой вариативностью, и в её основе может быть множество причин. Рассмотрим следующий пример. Предположим, что при измерении времени сложной реакции хоккеистов используется методика, суммарная систематическая погрешность которой по первым трём группам не превышает 1%. Но в серии повторных измерений конкретного спортсмена получаются такие значения времени реакции (ВР): 0,653 с; 0,526 с; 0,755 с и т. д. Различия в результатах измерений обусловлены внутренними свойствами спортсменов: один из них стабилен и реагирует практически одинаково быстро во всех попытках, другой – нестабилен. Однако и эта стабильность (или нестабильность) может измениться в зависимости от утомления, эмоционального возбуждения, повышения уровня подготовленности.

Систематический контроль за спортсменами позволяет определить меру их стабильности и учитывать возможные погрешности измерений.

В некоторых случаях ошибки возникают по причинам, предсказать которые заранее невозможно. Такие ошибки называются случайными. Их выявляют и учитывают с помощью математического аппарата теории вероятностей.

Перед проведением любых измерений нужно определить источники систематических погрешностей и по возможности устранить их. Но так как полностью это сделать нельзя, то внесение поправок в результат измерения позволяет исправить его с учётом систематической погрешности.

Для устранения систематической погрешности используют:

а) тарирование – проверку показаний измерительных приборов путём сравнения их с показаниями эталонов во всём диапазоне возможных значений измеряемой величины;

б) калибровку – определение погрешностей и величины поправок.

Под случайными величинами понимают числовые характеристики случайных событий. Другими словами, случайные величины – это числовые результаты экспериментов, значения которых которые невозможно (в данное время) предсказать заранее. Случайные величины делят на дискретные и непрерывные в зависимости от того, каково множество всех возможных значений соответствующей характеристики – дискретное или же непрерывное.

Это деление довольно условно, но полезно при выборе адекватных методов исследования.

Случайные величины можно задавать разными способами. Дискретные случайные величины обычно задаются своим законом распределения. Тут каждому возможному значению x1, x2,... случайной величины X сопоставляется вероятность p1,p2,... этого значения. В результате образуется таблица, состоящая из двух строк:

Это и есть закон распределения случайной величины. Непрерывные случайные величины законом распределения задать невозможно, так как по самому своему определению их значения невозможно перенумеровать и потому задание в виде таблицы тут исключается. Однако для непрерывных случайных величин есть другой способ задания (применимый, кстати, и для дискретных величин) –это функция распределения:

равная вероятности события , которое состоит в том, что случайная величина X примет значение, меньшее заданного числа x.

14 При обработке данных используют такие характеристики случайной величины Х как моменты порядка q, т.е. математические ожидания случайной величины Xq, q = 1, 2, … Так, само математическое ожидание – это момент порядка 1. Для дискретной случайной величины момент порядка q может быть рассчитан как

Для непрерывной случайной величины

Моменты порядка q называют также начальными моментами порядка q, в отличие от родственных характеристик – центральных моментов порядка q, задаваемых формулой

Вопрос.

Диспе́рсия случа́йной величины́ - мера разброса данной случайной величины, то есть её отклонения от математического ожидания

Дисперсией дискретной случайной величины называют сумму квадратов отклонения значений случайной величины от своего математического ожидания. Дисперсия показывает величину разброса значений случайной величины от своего математического ожидания.

Пусть - случайная величина, определённая на некотором вероятностном пространстве. Тогда

D{X}=M [|X-M[X]| 2 ] , где символ M обозначает математическое ожидание.

Дисперсия любой случайной величины неотрицательна:

Если дисперсия случайной величины конечна, то конечно и её математическое ожидание;

Если случайная величина равна константе, то её дисперсия равна нулю

Дисперсия суммы двух случайных величин равна: , где - их ковариация;

Вероятность того, что истинное значение измеряемой величины лежит внутри некоторого интервала, называется доверительной вероятностью, или коэффициентом надежности, а сам интервал - доверительным интервалом. Каждой доверительной вероятности соответствует свой доверительный интервал. Однако это утверждение справедливо только при достаточно большом числе измерений (более 10), да и вероятность 0,67 не представляется достаточно надежной - примерно в каждой из трех серий измерений a может оказаться за пределами доверительного интервала. Для получения большей уверенности в том, что значение измеряемой величины лежат внутри доверительного интервала, обычно задаются доверительной вероятностью 0,95 - 0,99. Доверительный интервал для заданной доверительной вероятности учетом влияния числа измерений n можно найти, умножив стандартное отклонение среднего арифметического на так называемый коэффициент Стьюдента.

ОПРЕДЕЛЕНИЕ ОШИБОК ИЗМЕРЕНИЙ

Ошибки (погрешности), возникающие при измерениях, делятся на два больших класса: погрешности случайные и погрешности систематические. Для уяснения разницы между ними обратимся к конкретному примеру. Допустим, вы определяете массу тела взвешиванием его на рычажных весах. Обычно тело кладется на левую чашку весов, а разновесы – на правую. Плечи весов, разумеется, не могут быть абсолютно одинаковыми. Разница в их длине искажает результаты измерений и, притом, всегда одинаковым образом. Ошибки, сохраняющие величину и знак от опыта к опыту, носят название систематических. К систематическим относятся ошибки, связанные с неравноплечностью весов, неправильным весом гирь, неточной разбивкой шкалы измерительных приборов и т.д.

Однако, систематические ошибки не единственные причины погрешностей измерений. В том же опыте со взвешиванием тела есть ошибки, которые могут изменяться от опыта к опыту. В самом деле, коромысло весов качается с некоторым трением. Поэтому, даже при постоянной нагрузке весов, оно останавливается не всегда в одном и том же месте а в разных местах, лежащих в области, размер которой определяется силами трения. Ошибки в этом случае от опыта к опыту не повторяются.

Случайными ошибками называются ошибки, которые непредсказуемым образом изменяют свою величину и знак от опыта к опыту.

Бывают случаи, когда случайные ошибки не связаны с дефектами аппаратуры, а лежат в сущности изучаемого явления.

Так, например, если вы изучаете радиоактивный распад какого-либо радиоактивного элемента, то число зарегистрированных распадов, скажем, в 1 минуту, не будет оставаться постоянным. В одних измерениях вы зарегистрируете, например, 18,15,12,17 распадов в минуту, в других – 23, 25, 17, 22 распадов. В среднем вы получите 20 распадов в минуту. Отклонение измеренного числа распадов от среднего значения 20 распадов в минуту носит чисто случайный характер. И связано с самой природой изучаемого явления.

Влияние случайных ошибок может быть уменьшено при многократном повторении опыта, т.к. опыты, результаты которых превышают среднее значение будут встречаться столь же часто, как и опыты с результатами меньшими среднего значения.

Уменьшить же вклад систематических ошибок таким способом нельзя. Главной причиной этих погрешностей является несовершенство измерительных приборов. Поэтому для их уменьшения необходимо воспользоваться более совершенными средствами измерений, погрешность которых меньше. Качество измерительных приборов характеризуется их классом точности, т.е. той максимальной погрешностью, которую могут вносить эти приборы в измеряемую величину. Чем выше класс точности прибора тем эта погрешность ниже. Помимо необходимости совершенствовать приборы, можно изменить методику опыта. Например, в опыте со взвешиванием нужно либо уменьшить неравноплечность весов, либо взвешивать тело дважды, один раз на левой чашке весов, другой – на правой и усреднить полученные результаты.

Систематическая ошибка - ошибка исследования, не связанная с выборкой. Она может быть вызвана концептуальными или логическими ошибка­ми, неправильной интерпретацией ответов, а также стати­стическими, арифметическими, табуляционными, кодо­выми или отчетными ошибками.Систематические ошибки под­разделяется на: случайные(дают оценки, отличные от истинного значения; они могут приводить к отклонениям и в большую, и в меньшую сторону и имеют при этом случайный характер) и неслучайные(приводят к односторонним отклонениям, для них характерна тенденция к смеще­нию выборочного значения относительно параметра со­вокупности). Недостатки систематических ошибок: - не так часты, но и не настолько подконтрольны, как ошибки в выборке;- в систематических оши­бках, как направление, так и величина ошиб­ки могут оказаться совершенно непредсказуемыми, в отличие от выборок, где ошибки в выборке при использовании вероятностных методов могут быть оценены; - приводят к смещению вы­борочного значения относительно параметра совокуп­ности;- влияют на достоверность выборочных оценок. Особенно критичными ошибки становятся при работе с широкомасштабны­ми, хорошо продуманными вероятностными вы­борками, т.к. при увеличении эффектив­ности проектирования выборки и уменьшении выборочной дисперсии, эффект систематических ошибок усиливается. Чем эффективнее составлена выбор­ка, тем большую роль играют систематические ошибки и тем меньшим смыслом обладают вы­числения по определению доверительного интер­вала, в основе которых лежат обычные форму­лы. Система­тические ошибки делятся на два основных типа: ошибки, связанные с неполучением данных (ошибки ненаблюдения), и ошибки наблюдения. Ошибки ненаблюдения возникают вследствие невозможности получения данных от части элементов обследуемой совокупности и быть вызваны тем, что часть обследуе­мой совокупности не была представлена в выборке, или же элементы, отобранные для включения в выборку, не представили данных. Ошибки наблюдений воз­никают вследствие некорректной информации, полу­ченной от элементов выборки, они могут возникнуть и на стадии обработки данных или формулирования ито­гового вывода.

48.Понятие и сущность ошибок ненаблюдения. Существуют два типа оши­бок ненаблюдения: ошибки неохвата( систематическая ошибка, являющаяся следствием того, что определенные части или целые блоки генеральной со­вокупности не были включены в основу выборки) и ошибки непо­лучения данных. Неохват может стать источником серьезных неточностей, при этом ошибка неохвата относится только к ошибочно выпавшим из рассмот­рения частям совокупности. Таким образом, проблема не­охвата имеет отношение к основе выборки.Ошибка перебора может возникать из-за возникновения повторов в сводке элементов выборки.Ошибки неохвата:1) относятся к разряду систематических ошибок и потому не входят в стандартные стат. зависимос. ;2) как правило, не могут быть устранены посред­ством увеличения объема выборки;3) могут иметь существенный размер;4) могут быть уменьшены при осознании их наличия с помощью улучшения основы выборки и принятия ряда спе­циальных мер, позволяющих до определенной степени компенсировать остаточное несовершен­ство основы. Ошибка неполучения данных – систематическая ошибка, порожда­емая отсутствием информации о некоторых элементах, которые должны были войти в состав выборки. Для того, чтобы оптимизировать и стандартизировать практику исследований предлагается определение доли ответивших(отношение количества проведенных с респондентами интервью к количеству приемлемых респондентов в выборке). Различают две главные причины ошибки неполучения дан­ных - это отсутствие и отказ от интервью. Отсутствие – систематическая ошибка, возник. вследствие неполучения ответов от заранее определенных респондентов, отсутствующих дома в момент звонка регистратора.Отказы от интервью – систематическая ошибка, возникающая вследствие того, что часть респондентов отказывается принимать участие в обследовании. Доля отказов зависит часто от особен­ностей респондентов, организаций, осуществляющих финансовое обеспечение обследования, обстоятельств контакта, темы обследования и искусства интервьюе­ра.Стратегии, рекоменд. для корректировки ошибки:1. Увеличение доли первичных ответов (улучшение условий проведения интервью и углубленное обучение интервьюеров).2. Повторные попытки.3. Экстраполяция получ.информации(оценка возможного эффекта, обусловленного неполучением данных, и соответствующая коррек­ция результатов исследования).Частичное неполучение данных состоит в том, что респондент, согласившийся принять участие в оп­росе, не хочет или не может ответить на некоторые во­просы из-за специфики их формы или содерж. или вследствие нежелания обременять себя поиском инф.

49.Понятие и сущность ошибок наблюдения

Ошибка сбора – систематическая ошибка, возникающая при сборе данных.Человек отказ отве­чать на одни и дает неправильные ответы на другие вопросы интервьюера - ошибками пропуска и ошибками свидетельства. Поведенческие факторы . Биографические данные, мнения, позиции, намерения респондента могут являться источниками ошибок. Существуют 3 модели поведения интервьюеров , которые приводят к по­явлению ошибок: ошибки при формулировке во­просов и неумение задавать уточняющие вопросы, ошибки при записи ответов, подтасовка данных.Достоверность:

1) Метод опроса - проверяется соответствие ис­пользованного метода заданному (например, дей­ствительно ли проводился персональный, а не те­лефонный опрос).

2) Поставленные вопросы - проверка того, не были ли выпущены из рассмотрения важные вопросы (демографического или классификационного ха­рактера).

3) Демонстрация продукции - проверка того, дей­ствительно ли была произведена потребная для проведения опроса демонстрация продукта или информационного листа.

4) Знакомство респондента с интервьюером - про­верка того, не занимался ли интервьюер опросом своих знакомых или друзей.

5) Реакция на проведение опроса - проверка «ка­чества» работы интервьюера.

Офисные ошибки . Систематические ошибки могут возникать не только при сборе информации. Они мо­гут появляться при редактировании, кодировании, со­ставлении таблиц и анализе данных.

Суммарные ошибки. Частные ошибки, складываясь, приводят к ошибке суммарной, которая и должна интересовать исследователей.

При работе с ошибками сбора данных можно воспользоваться схемой Кана- Кэннела

интервьюер респондент

Характеристики: Характеристики: теже что и у интер-ра

Возраст Психологические факторы:теже

Образование Поведенческие факторы:

Ответы на вопросы

(адекватные – неадекватные)

(точные – неточные)

Социально-экономический статус

Национальность,Религиозная принадлежность,Пол и т.д.

Психологические факторы: Восприятие,Позиция,Намерения,мотивы

Поведенческие факторы: Ошибки при вопросах,Ошибки при распределении типа респондентаОшибки мотивации,Ошибки при записи ответов

Личные особенности (характеристики). личные осо­бенности могут серьезно повлиять на ответы. Психологические факторы . результаты работы интервьюеров имеют обусловленность их взглядами, позициями и стремлениями.

50.Редактирование данных. Редактирование включает в себя про­смотр и, если необходимо, исправление каждой анке­ты или формы регистрации наблюдений. Просмотр и внесение исправлений выполняются в 2 стадии: полевое редактирование и централизованное офисное редактирование.

Полевое редактирование - это предварительное редактирование, которое строится таким образом, чтобы обнаружить наиболее бросающиеся в глаза про­пуски и неточности данных.

Оно также полезно для контроля поведения персонала полевых сил и внесе­ния ясности. Полевое редактирова­ние выполняется как можно скорее после того, как анкета заполнена. В этом случае проблемы могут быть устранены прежде, чем проводивший сбор информации будет рас­формирован. Полевое редак­тирование обычно выполняется руководителем поле­вых работ.

Централизованное офисное редактирование - всеобъемлющая проверка и коррекция заполнен­ных форм сбора данных, включая принятие решения о том, что с этими данными делать.

Чтобы обес­печить логическую последовательность обработки ма­териалов, лучше всего предоставить все носители собранных данных одному человеку. Если эту работу приходится делить по соображениям ее объема и име­ющегося времени, подразделы должны определяться по частям анкеты, а не по респондентам. То есть, один редактор должен редактировать часть «А» всех анкет, а другой - часть «В».

В отличие от полевого, централизованное офисное редактирование в меньшей степенизависит от после­дующих процедур, и в большей - от степени полноты данных. При анализе необходимо решить, каким образом бу­дут обрабатываться носители собранных данных, со­держащие неполные ответы, явно неправильные отве­ты и ответы.

Вернувшиеся заполненные анкеты целиков. В некоторых окажутся пропущенными целые разделы. Другие будут оставленными без ответа отдельные позиции. Анкеты, в которых пропущены целые разделы, не должны отбрасы­ваться автоматически. Тщательное редактирование анкеты иногда показы­вает, что ответ на какой-то вопрос очевидно неправилен.

При анализе необходимо не пропустить заполненные анкеты, которые не­удачны с точки зрения интереса респон­дента. Свидетельства отсутствия интереса могут быть и очевидными, и очень трудно распознаваемыми.

51. Кодирование данных. Код-е – технический прием, с помо­щью которого данные распределяются по категориям. Прием связан со спецификацией альтернативных категорий или классов, в которые должны помещаться ответы, а самим классам должны назначаться кодовые номера.

I этап код-я заключается в специфи­цировании категорий или классов, к которым будут относиться ответы. Выбор ответов должен быть взаимоисключающим и исчерпывающим, чтобы каждый ответ логически по­падал в одну категорию. Код-е закрытых вопросов и большинства средств балльной оценки не сложно; потому что оно устанавливается при конструировании самой анкеты. Код-е открытых вопросов более сложно и более доро­гое, т.к. приходится определять подходящие категории на базе ответов, которые не всегда предсказуемы. Если анкет слишком много, и необходимо использовать для кодирования анкет нескольких кодировщиков, дополнительной пробле­мой может стать возникновение несоответствия в са­мом кодировании. Поэтому для получения логической последовательности обработки данных, эту работу не­обходимо разделять по задачам, а не в равных долях делить анкеты между кодировщиками.

II этап код-я касается назначения ко­довых номеров классов. Принято, для обозначения классов использовать цифры, а не буквы. Когда для анализа данных предполагается использо­вать компьютер, кодирование необходимо выполнять таким образом, чтобы данные оказывались готовыми для ввода в машину, поэтому полезно обеспечить нагляд­ность ввода посредством многоколонной записи. Когда вопрос допускает множество ответов, допускать отдельные колонки для кодирования каждого вариан­та ответа.

Необходимо использовать ровно столько колонок поля, назна­чаемого для переменной, сколько необходимо для пол­ного охвата всех ее возможных значений. Кроме того, любому полю должна назначаться не бо­лее чем одна переменная.Рекомендуется применять стандартные коды для «отсутствия информации». Так, все ответы «не знаю» должны коди­роваться цифрой 8, «нет ответов» - цифрой 9, а «не применялось» обозначаться как 0. Лучше, если во всем исследовании для каждого из этих типов «нет инфор­мации» используется один и тот же код.

Завершающий этап код-я состоит в подготовке книги кодов , которая содержит общие ин­струкции, указывающие, каким образом была закоди­рована каждая позиция данных. В ней перечисляются коды каждой переменной и категории, включенные в каждый код.

52.Табулирование данных. Табулирование заключается просто в подсчете ко­личества событий, которые попадают в различные ка­тегории. Табулирование может принимать форму про­стой табуляции, или перекрестной табуляции . Простая табуляция - подсчет количества событий, которые попадают в каждую категорию, когда категории базируются на одной пере­менной.Перекрестная табуляция - подсчет количества событий, которые попадают в каждую из нескольких категорий, когда категории базируются на двух и более переменных, рассматриваемых одновременно.Одномерная табуляция использует­ся в следующих целях:

1. для определе­ния степени безответности позиций анкеты является важной проблемой в большинстве исследований. Когда степень безответности большая, исследование в целом становится сомнительным и возникает необходимость пересмотреть его цели и методы. Возможно использование нескольких стратегий. - Оставить позиции пустыми и описать их количе­ство как отдельную категорию. -Исключать событие с утраченной позицией при анализе с использованием соответствующей пе­ременной. -Подставить значения утраченных позиций анке­ты. 2. для локализации грубых ошибок . Грубая ошибка– ошибка, которая возникает при редактировании, кодировании, клавиатурном наборе или табулировании данных.3. для локализации посторонних значений- наблюдение, настолько отличающееся по величине от остальных наблюдений, что возникает необходимость обрабатывать его как особое значение.4. для определения эмпирического распределения рассматриваемой переменной. Лучше всего представить в виде гистограммы.5. для расчета итоговых статистик.

Перекрестная табуляция является важным механиз­мом для изучения связей внутри и между переменными. В перекрестной табуляции выборка делится на под­группы. Связь между двумя переменными в пределах категорий размера семьи, называется условной таблицей , позволяющей обнаружить условную связь между переменными.Условные таблицы, построенные на основе одной регулируемой переменной, называются условными таблицами первого порядка . Таблицы, составленные с использованием двух регулируемых переменных, называются условными таблицами второго порядка .В настоящее время табулированные результаты чаще представляются в виде баннеров. Баннер – это последовательныйряд перекрестных табуляций между критерием и несколькими факторными переменными, оформленный в виде единой таблицы.

53.Традиционный, классический метод анализа документов и его составляющая.Традиционный анализ – это цепочка умственных, логических построений, направленных на выявление сути анализируемого материала с определенной, интересующей исследователя точки зрения в каждом конкретном случае. Основным недостатком этого анализа является субъективность. В традиционном анализе различают внешний и внутренний анализ. Внешний анализ – это анализ контекста документа и тех обстоятельств, которые сопутствовали его появлению. Цель внешнего анализа – установить вид документа, его форму, время и место появления, автора и инициатора, какие цели преследовались при его составлении, степень надежности и достоверности, каков его контекст. Внутренний анализ – это исследование содержание документа. Отдельные виды документов из-за своей специфики, требуют специальных методов анализа и привлечения для их выполнения специалистов других областей знаний. Юридический анализ. Он применяется для всех видов юридических документов. Его специфика заключается в том, что разработан особый словарь терминов, в котором значение каждого слова строго однозначно определено.Психологический анализ. Он применяется при оценке отношения автора к какому-либо политическому, экономическому или социальному явлению. На основе таких исследований можно получить представление о формировании общественного мнения, общественных установок и т.д.

54. Формализованный, количественный (контект-анализ) и его состав-е . Его называют часто количественный метод анализа документов (контент-анализ).Суть этих методов сводится к тому, чтобы найти легко подсчитываемые признаки, черты, свойства документа, которые отражали бы определенные существенные стороны содержания. Тогда качественное содержание делается измеримым, становится доступным для точных вычислений.Контент-анализ – это техника выделения заключения проводимого с помощью объективного и систематического выявления соответствующих характеристик текста задачам исследования. Существуют общие принципы, когда применяется контент-анализ:1. Когда требуется высокая степень точности или объективности анализа.2. При наличии большого по объему и несистематизированного материала.3. Когда категории, важные для целей исследования, характеризуются определенной частотой появления в изучаемых документах.Основными направлениями использования контент-анализа являются:

1. Выявление и оценка характеристик текста как индикаторов определенных сторон изучаемого объекта;2. Выявление причин, породивших сообщение; 3. Оценка эффекта воздействия сообщения (например, рекламного).Требование объективности анализа предполагает решение ряда проблем, связанных:1. с выработкой категорий анализа. Категории анализа – это понятие, в соответствии с которыми будут сортироваться единицы. Требования, предъявляемые к категориям:- должны быть исчерпывающими, - взаимоисключаемыми, - надежность.2.С выделение единиц анализа. Единицей анализа (смысловой или качественной) является та часть содержания, которая выделяется как элемент, подводимый под ту или иную категорию. Индикаторами могут быть:- относящиеся к теме слова и словосочетания;- термины;- имена людей;- названия организаций;- географические названия;- пути решения экономических проблем, 3. с выделение единиц счета. Единицы счета обладают разной степенью точности измерения, а так же разным временем, уходящим на кодировку материала, попавшего в выборку. В практике методом контент-анализа были выделены общие единицы счета, отвечающие различным исследовательским требованиям.1.Время – пространство. 2.Появление признаков в тексте

3.Частота появления. При разработке программы маркетинговых исследований необходимо четко определить, какого рода характеристики объекта подвергаются изучению, и в зависимости от этого оценивать документы с точки зрения их адекватности, надежности, достоверности.

Адекватность документа определяется как степень, в которой он отражает интересующие исследователя характеристики объекта.

Надежность оценивается сопоставлением всех данных содержания с какими-то другими данными. Здесь возможны несколько вариантов проверки:

1.Сравнение содержания документов , исходящих из одного источника. Такое сравнение может проводиться:а) во времени б) в различных ситуациях

в) в различных аудиториях .2.Метод независимых источников , т.е. выбираются характеристики из нескольких различных источников информации. Затем различия в характеристиках сравниваются с различиями в содержании сообщений.Оценка достоверности данных документа проводится путем последовательного перебора источников встречающихся в документе ошибок. Источники ошибок можно разделить на две категории:

Случайные (например, опечатки в статистических данных) -систематические.

Систематические ошибки делятся на сознательные и несознательные

Сознательные ошибки часто определяются теми намерениями, которыми руководствуется автор при составлении документа.

Выбор редакции
Три дня длилось противостояние главы управы района "Беговой" и владельцев легендарной шашлычной "Антисоветская" . Его итог – демонтаж...

Святой великомученик Никита родился в IV веке в Готии (на восточной стороне реки Дунай в пределах нынешней Румынии и Бессарабии) во...

РЕШЕНИЕ ИМЕНЕМ РОССИЙСКОЙ ФЕДЕРАЦИИ 07 мая 2014 года г. Ефремов Тульская областьЕфремовский районный суд Тульской области в...

Откуда это блюдо получило такое название? Лично я не знаю. Есть еще одно – «мясо по-капитански» и мне оно нравится больше. Сразу...
Мясо по-французски считается исконно русским блюдом, очень сытное блюдо, с удачным сочетанием картофеля, помидоров и мяса. Небольшие...
Мне хочется предложить хозяюшкам на заметку рецепт изумительно нежной и питательной икры из патиссонов. Патиссоны имеют схожий с...
Бананово-шоколадную пасту еще называют бананово-шоколадным крем-джемом, поскольку бананы сначала отвариваются и масса по консистенции и...
Всем привет! Сегодня в расскажу и покажу, как испечь открытый пирог с адыгейским сыром и грибами . Чем мне нравится этот рецепт — в нём...
Предлагаю вам приготовить замечательный пирог с адыгейским сыром. Учитывая, что пирог готовится на дрожжевом тесте, его приготовление не...