|
Ошибки экспериментальных данных
Исследовательская работа школьников связана с необходимостью правильно понимать и обрабатывать экспериментальные данные. Допустим в результате некоторого эксперимента ученик получил данные о содержании витамина С в лимоне 2,5 г/кг. Или значение частоты колебаний 375 Гц. Или длины побега 35 см. Что это говорит? Чаще всего, результат единичного измерения не говорит ни о чем, или говорит только о порядке измеряемой величины. Для оценки истинности данных эксперимента следует рассмотреть возможные причины ошибок и степень их влияния на измеряемую величину. Приборные погрешности. Эта погрешность равна той доле шкалы прибора, до которой с уверенностью можно производить отсчет, что определяется конструкцией и ценой деления шкалы прибора. Допустим, мы измеряем объем колбы мерным цилиндром с ценой деления 1 мл и получаем значение 242 мл. С какой точностью оно получено? По цене деления: 242±0,5 мл. Пусть мы проделали серию измерений и рассчитали среднее значение 242,837569. Можем ли мы утверждать, что определили объем колбы с точностью до десятимиллионной? Конечно нет. Точность нашего определения не может превосходить точности отдельного измерения, и мы вправе лишь записать: 242,8±0,5 мл. При этом последняя цифра является недостоверной, а все отброшенные цифры были незначащими. Это надо учитывать при записи результатов наблюдений и рассчитанных данных. Объем воды 10 мл, отмеренный мерной пипеткой с ценой деления 0,01 мл правильно указать 10,00, а мерным цилиндром просто 10. Число значащих цифр в результате вычислений не может быть больше, чем в наименее точном исходном числе. Приборные ошибки можно уменьшить, используя более совершенные приборы, но это связано, как правило, с большими материальными затратами. Кроме того, наряду с приборными ошибками можно выделить еще две группы ошибок, которые возникают в процессе эксперимента: систематические и случайные. Систематические ошибки вызываются неправильной конструкцией приборов, их неисправностью, недостаточно продуманной методикой эксперимента, наличием неучтенных факторов, влияющих на измеряемую величину Например: школьник решил изучить влияние освещенности на рост побегов. этой целью он разместил одно растение на подоконнике, другое в темном углу кабинета. Но при этом он не учел, что температура воздуха вблизи окна 12 градусов, а в темном углу – 24 градуса. О том, что систематические ошибки могут иметь очень серьезные последствия свидетельствует и роман Жюль Верна, в котором отважный 15-летний капитан и его команда из-за систематической ошибки в показаниях компаса попали вместо одного материка на другой. Но характерной особенностью систематических ошибок является их принципиальная устранимость или возможность коррекции. Случайные ошибки устранить нельзя, а также нельзя вывести никакой формулы для исправления полученного результата. В тоже время, влияние случайных ошибок может быть уменьшено проведением повторных измерений и статистической обработкой полученных данных. Как показано на большом числе экспериментальных данных распределение результатов измерения некоторой постоянной величины описывается некоторым математическим выражением, которое называется «нормальным распределением» или гауссовым распределением», «распределением вероятности» и т.п. Графически оно выражается следующей кривой (рис 1): |
|
Из графика видно, что существует вероятность, пусть и очень маленькая, что наше единичное измерение покажет результат, сколь угодно далеко отстоящий от истинного значения. Выходом из положения является проведение серии измерений. Если на разброс данных действительно влияет случай, то в результате нескольких измерений мы скорее всего получим следующее (рис 2): Будет ли рассчитанное среднее значение нескольких измерений совпадать с истинным? Как правило – нет. Но по теории вероятности, чем больше сделано измерений, тем ближе найденное среднее значение к истинному. На языке математики это можно записать так:
Но с бесконечностью у всех дело обстоит неважно. Поэтому на практике мы имеем дело не со всеми возможными результатами измерений, а с некоторой выборкой из этого бесконечного множества. Сколько же реально следует делать измерений? Наверное, до тех пор, пока полученное среднее значение не будет отличаться от истинного меньше чем точность отдельного измерения. Следовательно, когда наше среднее значение (рис. 2) отличается от истинного меньше чем погрешность измерений, дальнейшее увеличение числа опытов бессмысленно. Однако на практике мы не знаем истинного значения! Значит, получив среднее по результатам серии опытов, мы должны определить, какова вероятность того, что истинное значение находится внутри заданного интервала ошибки. Или каков тот доверительный интервал, в который с заданной надежностью попадет истинное значение (рис 3). Рассмотрим некоторый условный эксперимент, где в серии измерений получены некоторые значения величины Х (см. табл. 1). Рассчитаем среднее значение и, чтобы оценить разброс данных найдем величины DХ = Х – Хср
Ясно, что величины DХ как-то характеризуют разброс данных. На практике для усредненной характеристики разброса серии измерений используется дисперсия выборки: и среднеквадратичное или стандартное отклонение выборки: Последнее показывает, что каждое измерение в данной серии (в данной выборке) отличается от другого в среднем на ± s. Понятно, что каждое отдельное значение оказывает влияние на средний результат. Но это влияние тем меньше, чем больше измерений в нашей выборке. Поэтому дисперсия и стандартное отклонение среднего значения, будет определяться по формулам:
Можем ли мы теперь определить вероятность того, что истинное значение попадет в указанный интервал среднего? Или наоборот, рассчитать тот доверительный интервал в который истинное значение попадет с заданной вероятностью (95%)? Поскольку кривая на наших графиках это распределение вероятностей, то площадь под кривой, попадающая в указанный интервал и будет равна этой вероятности (доля площади, в процентах). А площади математики научились рассчитывать хорошо, знать бы только уравнение этой кривой. И здесь мы сталкиваемся еще с одной сложностью. Кривая, которая описывает распределение вероятности для выборки, для ограниченного числа измерений, уже не будет кривой нормального распределения. Ее форма будет зависеть не только от дисперсии (разброса данных) но и от степени свободы для выборки (от числа независимых измерений) (рис 4): Уравнения этих кривых впервые были предложены в 1908 году английским математиком и химиком Госсетом, который опубликовал их под псевдонимом Student (студент), откуда пошло хорошо известные термины «коэффициент Стьюдента» и аналогичные. Коэффициенты Стьюдента получены на основе обсчета этих кривых для разных степеней свободы (f = n-1) и уровней надежности (Р) и сведены в специальные таблицы. Для получения доверительного интервала необходимо умножить уже найденное стандартное отклонение среднего на соответствующий коэффициент Стьюдента. ДИ = sср*tf, P Проанализируем, как меняется доверительный интервал при изменении требований к надежности результата и числа измерений в серии. Данные в таблице 2 показывают, что чем больше требование к надежности, тем больше будет коэффициент Стьюдента и, следовательно, доверительный интервал. В большинстве случаев, приемлемым считают значение Р=95%
Из таблицы 3 и графика видно, что чем больше число измерений, тем меньше коэффициент и доверительный интервал для данного уровня надежности. Особенно значительное падение происходит при переходе от степени свободы 1 (два измерения) к 2 (три измерения). Отсюда следует, что имеет смысл ставить не менее трех параллельных опытов, проводить не менее трех измерений. Окончательно для измеряемой величины Х получаем значение Хсред±sср*tf,P. В нашем случае получаем: f=3; t=3,18; ДИ = 3,18*10,2 = 32,6; X = 143,5 ±32,6 Как правило, значение доверительного интервала округляется до одной значащей цифры, а значение измеряемой величины – в соответствии с округлением доверительного интервала. Поэтому для нашей серии окончательно имеем: X = 140 ±30 Найденная нами погрешность является абсолютной погрешностью и ничего не говорит еще о точности измерений. Она свидетельствует о точности измерений только в сравнении с измеряемой величиной. Отсюда представление об относительной ошибке:
Косвенные определения. Исследуемая величина рассчитывается в этом случае с помощью математических формул по другим величинам, которые были измерены непосредственно. В этом случае для расчета ошибок можно использовать соотношения, приведенные в таблице 4.
Из таблицы видно, что относительная ошибка и точность определения не изменяются при умножении (делении) на некоторый постоянный коэффициент. Особенно сильно относительная ошибка может возрасти при вычитании
близких величин, так как при этом абсолютные ошибки суммируются, а значение Х
может уменьшиться на порядки.
Окончательный результат V=2510±20 (мм3) e =0,8%. Чтобы повысить точность косвенного определения, нужно в первую очередь повышать точность измерения той величины, которая вносит больший вклад в ошибку (в данном случае – точность измерения диаметра проволочки). План проведения измерений: [1] 1. Знакомство с методикой, подготовка прибора, оценка приборной погрешности d. Оценка возможных причин систематических ошибок, их исключение. 2. Проведение серии измерений. Если получены совпадающие результаты, можно считать что случайная ошибка равна 0, DХ = d. Переходим к пункту 7. 3. Исключение промахов – результатов значительно отличающихся по своей величине от остальных. 4. Расчет среднего значения Хср, и стандартного отклонение среднего значения scp 5. Задание значения уровня надежности P, определение коэффициента Стьюдента t и нахождение доверительного интервала ДИ= t*scp 6. Сравнение случайной и приборной погрешности, при этом возможны варианты: - ДИ << d, можно считать, что DХ = d, повысить точность измерения можно, применив более точный прибор - ДИ >> d, можно считать, что DХ = ДИ, повысить точность можно, уменьшая случайную ошибку, повышая число измерений в серии, снижая требования к надежности. - ДИ » d, в этом случае расчитываем ошибку по формуле DХ = 7.
Записывается окончательный результат Х = Хср ± DХ. Если проводится несколько однотипных измерений (один прибор, исследователь, порядок измеряемой величины, условия) то подобную работу можно проводить один раз. В дальнейшем можно считать DХ постоянной и ограничиться минимальным числом измерений (два-три измерения должны отличаться не более, чем на DХ) Для косвенных измерений необходимо провести обработку данных измерения каждой величины. При этом желательно использовать приборы, имеющие близкие относительные погрешности и задавать одинаковую надежность для расчета доверительного интервала. На основании полученных значений Da, Db, определяется DХ для результирующей величины (см табл. 4). Для повышения точности надо совершенствовать измерение той величины, вклад ошибки которой в DХ наиболее существенен. Изучение зависимостей. Частым вариантом экспериментальной работы является измерение различных величин с целью установления зависимостей. Характер этих зависимостей может быть различен: линейный, квадратичный, экспоненциальный, логарифмический, гиперболический. Для выявления зависимостей широко используется построение графиков. При построении графиков вручную важно правильно выбрать оси, величины, масштаб, шкалы. Следует предупредить школьников, что шкалы должны иметь равномерный характер, нежелательна как слишком детальная, так и слишком грубая их разметка. Точки должны заполнять всю площадь графика, их расположение в одном углу, или «прижатыми» к одной из осей, говорит о неправильно выбранном масштабе и затрудняет определение характера зависимости. При проведении линии по точкам надо использовать теоретические представление о характере зависимости: является она непрерывной или прерывистой, возможно ли ее прохождение через начало координат, отрицательные значения, максимумы и минимумы. Наиболее легко проводится и анализируется прямая линия. Поэтому часто при изучении более сложных зависимостей часто используется линеаризация зависимостей, которая достигается подходящей заменой переменных. Например: Зависимость . Вводя новую переменную , получаем уравнение a = bx, которое будет изображаться на графике прямой линией. Наклон этой прямой позволяет рассчитать константу диссоциации. Разумеется и в этом случае полученные в эксперименте данные включают в себя различные ошибки, и точки редко лежат строго на прямой. Возникает вопрос, как с наибольшей точностью провести прямую по экспериментальным точкам, каковы ошибки в определении параметров. Математическая статистика показывает, что наилучшим приближением будет такая линия, для которой дисперсия (разброс) точек относительно ее будет минимальным. А дисперсия определяется как средний квадрат отклонений наблюдаемого положения точки от расчитанного: Отсюда название этого метода – метод наименьших квадратов. Задавая условие, чтобы величина s2 принимала минимальное значение, получают формулы для коэффициентов а и b в уравнении прямой у = а + bx:
и формулы для расчета соответствующих ошибок [2]. Если делать расчеты, используя калькулятор, то лучше оформлять их в виде таблицы:
Подводя итог, следует сказать, что обработка данных эксперимента достаточно сложный этап работы ученого. Необходимость проведения большого числа измерений требует большой затраты времени и материальных ресурсов. Громоздкость формул, необходимость использования большого числа значащих цифр затрудняют вычисления. Поэтому, возможно, не все рекомендации этой статьи применимы в рамках школьного исследования. Но понимать их сущность, значимость, необходимость, и в соответствии с этим адекватно оценивать свои результаты, должен любой исследователь. В настоящее время обработку экспериментальных данных существенно облегчают современные компьютерные технологии, современное программное обеспечение. Об том, как их можно использовать – в следующей статье. Литература: [1] Кассандрова О.Н., Лебедев В.В. Обработка результатов наблюдений, М., «Наука», 1970, 194 с. [2] Петерс Д., Хайес Дж., Хифтье Г. Химическое разделение и измерение – М.,: Химия, 1978, 816 с. |
© Можаев Г.М. |
|||