p>Пусть при некотором испытании событие А может наступить или не произойти (А). Обозначим вероятность А через р, а А через q= 1 -р ( других итогов испытания нет ). Тогда исходами двух последовательных независимых испытаний и их вероятностью будут:
АА - р2; АА - рq; АА - qр; АА - q2.
Отсюда видно, что двукратное появление события А равно р2, вероятность однократного появления - 2 рq, а вероятность того, что А не наступит ни разу - q2. Эти результаты единственно возможные и поэтому
. Это рассуждение можно перенести на любое число испытаний. Например, при трех испытаниях получим .
Подсчитаем вероятность того, что при n испытаниях событие А появится m раз. Это может произойти, например, в последовательности
Ясно, что вероятность равна рmqn-m. Но m событий А может быть и в другом сочетании. Число всех возможных сочетаний из n элементов по m (количество событий А) равно числу сочетаний. Используя теорему сложения вероятностей получаем общую вероятность Рm, n наступления m событий А из n испытаний Pm, n =
= .
Из этой формулы видно, что вероятности Рm, nдля различного исхода испытаний (появление или не появление определенного результата А) определяется
pn + npn-1q + .
Коэффициенты перед вероятностями р, q являются биноминальными коэффициентами, а общая вероятность представляет слагаемые в разложении бинома ( р+ q )n. Поэтому закон распределения случайной величины Х, в котором вероятность наступления событий А определяется коэффициентами бинома, называется биноминальным распределением дискретной случайной величины. Этот закон может быть задан в виде таблицы 1.
Таблица 1 Биноминальный закон распределения хi 0 1 2 .... m .... n pi qn npqn-1 .... .... pn
Биномиальные коэффициенты удобно получать с помощью треугольника Паскаля.
1 n = 0 1 1 n = 1 1 2 1 n = 2 1 3 3 1 n = 3 1 4 6 4 1 n = 4 1 5 10 10 5 1 n = 5
Все строки треугольника ( начинающегося с единицы ) начинаются и заканчиваются единицей. Промежуточные числа получаются сложением соседних чисел вышестоящей строки. Числа, стоящие в одной строке, являются биноминальными коэффициентами соответствующей степени.
Из описания биномиального распределения становится ясно, что область его действия там, где возможно многократное проведение испытаний с известной вероятностью.
Определим основные характеристики этого распределения. Математическое ожидание М (Х) = + + = np (q + p)n-1 = np.
Дисперсия распределения может быть определена из общего выражения ,
но это приводит к громоздким вычислениям. В то же время случайная величина Х принимает в каждом опыте только два значения: 1, если событие А произошло и 0, если оно не произошло с вероятностями, соответственно, р или q. Тогда математическое ожидание одного опыта определится
М (Х1) = 0Чq + 1Чр = р = х и соответственно дисперсия одного опыта
Тогда дисперсия всех n опытов составит D (X) = nЧpЧq. Закон Пуассона
В случае малых р ( или, наоборот, близких к 1 ) биноминальный закон распределения можно преобразовать следующим образом
, где . .
Определим предел Рm, n при n ® Ґ и постоянном m. Тогда пределы
равны единице, а . Окончательно имеем .
Это распределение называется законом Пуассона, где l - интенсивность распределения. Используется в задачах с редкими событиями. Определим его основные характеристики и смысл величины l.
Запишем закон распределения в виде таблицы. хi 0 1 2 .... m .... pi e-l .... .... M (X) = + .
Выражение в скобках есть разложение функции еl в ряд Маклорена. Поэтому
М (Х) = lе-lеl = l. Не рассматривая вывод отметим, что D (Х) = l, т. е. дисперсия равна математическому ожиданию.
Рассмотренные виды распределений случайной величины, конечно, не исчерпывают всех существующих распределений. Можно назвать еще несколько: распределение Бернулли, экспоненциальное распределение, гамма-распределение, распределение Вейбула, гипергеометрические распределения и др. При определенных условиях и параметрах один вид распределения может переходить в другой. Поэтому при решении практических задач по законам распределения случайных величин следует обращаться к специальной литературе.
Понятие статистической гипотезы и статистического критерия
Статистической гипотезой называют любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин. Такие утверждения можно делать на основе теоретических соображений или статистических исследований других наблюдений. Например, при многократном измерении некоторой физической величины, точное значение Х которой не известно, но в процессе измерений оно меняется. На результат измерений влияют многие случайные факторы, поэтому результат i- го измерения можно записать в виде аi = Х + ei, где ei - случайная погрешность измерения. Если eiскладывается из большого числа ошибок, каждая из которых не велика, то на основании центральной предельной теоремы можно предположить, что случайные величины аiимеют нормальное распределение. Такое предположение является статистической гипотезой о виде распределения наблюдаемой случайной величины. Если для исследуемого явления сформулирована та или иная гипотеза ( обычно ее называют основной или нулевой гипотезой и обозначают символом Но), то задача состоит в том, чтобы сформулировать правило, которое позволяло бы по результатам наблюдений принять или отклонить эту гипотезу. Правило, согласно которому проверяемая гипотеза Нопринимается или отвергается, называется статистическим критерием проверки гипотезы Но .
Наиболее распространены такие статистические гипотезы, как: а) вида распределения;
б) однородности нескольких серий независимых результатов; в) случайности результатов эксперимента и т. п.
Статистический критерий проверки гипотезы Нослужит для определения возможного отклонения от основной гипотезы. Характер отклонений может быть различным. Если критерийІулавливаетІ любые отклонения от Но, то такой критерий называют универсальным или критерием согласия. Существуют критерии, которые выявляют отклонения от заданного вида, это узко направленные критерии.
Выбор правила проверки гипотезы Но эквивалентен заданию критической области х1, при попадании в которую переменной х гипотеза Но отвергается. Критерий, определяемый критической областью х1 называют критерием х1. В процессе проверки гипотезы Но можно прийти к правильному решению или совершить ошибку первого рода - отклонить Но когда она верна, или ошибку второго рода - принять Но, когда она ложна. Иными словами, ошибка первого рода имеет место, если точка х попадает в критическую область х1, в то время как верна нулевая гипотеза Но, а ошибка второго рода - когда х О хо, но гипотеза Но ложна. Желательно провести проверку гипотезы так, чтобы свести к минимуму вероятности обоих ошибок. Однако при данном числе испытаний n в общем случае невозможно одновременно обе эти вероятности сделать как угодно малыми. Поэтому наиболее рационально выбирать критическую область следующим образом: при заданном числе испытаний n устанавливается граница для вероятности ошибки первого рода и при этом выбирается та критическая область х1, для которой вероятность ошибки второго рода минимальна.
2. 5. Вероятности ошибок первого и второго рода
Рассмотрим станок, который может работать только в одном из двух состояний. Если он работает в налаженном режиме, то для интересующего нас признака качества, например, длины или диаметра заготовки, имеет место нормальное распределение при работе как в налаженном так и в разлаженном режиме. Оба режима отличаются только уровнем настройки процесса по математическому ожиданию ( М(х) = 10 и 11, соответственно в налаженном и разлаженном режиме ), в то время как дисперсии в обоих случаях составляютs2 = 4.
Проверить нужно нулевую гипотезу, в соответствии с которой М(х) = 10, против альтернативы ( в данном случае единственной ) М(х) = 11. Конкурирующую гипотезу обозначим Н1. Тогда Но: М(х) = 10; Н1: М(х) = 11.
Необходимо по результатам выборки определить в каком из состояний работает станок. Примем объем выборки n из потенциально бесконечной генеральной совокупности. В качестве контрольной величины возьмем выборочное среднее Хn. На рис. 9 изображены плотности распределения Хn для n = 25 и n = 4. Для формулировки критерия необходимо разделить область изменения контрольной величины (х) на критическую область отклонения гипотезы Но ( принятия Н1 ) и область принятия гипотезы Но. Для этого необходимо выбрать число К, такое, что 10 < К < 11, и интервал ( -Ґ; К ] рассматривать как область принятия гипотезы Но, а интервал [ К; Ґ ) - как область отклонения гипотезы Но. По рис. 9 видно, что каждая реализация Х25 или Х4 возможна при верности любой из двух гипотез, но с различной вероятностью. рода a ( отклонения верной гипотезы Но ) и второго рода b ( принятие гипотезы Но, когда она не верна ). Также видно, что увеличение n ведет к уменьшению дисперсии распределения х и тем самым- к одновременному уменьшению вероятностей a и b. В соответствии с рис. 9 можно записать:
; .
Эти два уравнения содержат четыре величины a, b, К, n. Задав две из четырех величин, можно определить две другие.
Например, при n = 25 и К = 10, 4 определим: ; .
Если задаться величинами a и b, то можно определить величины К, n.
2. 6. Проверка гипотезы вида закона распределения вероятностей
При проверке эксперимента закон распределения вероятностей случайных величин неизвестен и можно лишь предположительно судить о его виде . Выборочные оценки параметров распределения несут в себе случайные ошибки, искажающие истинный характер распределения. Поэтому после получения эмпирического распределения производится подбор теоретического закона распределения, пригодного для описания вероятностных свойств изучаемой случайной величины. Критерии подбора ( проверки гипотезы соответствия ) называют в статистике критериями согласия. Все они основаны на выборе допустимой меры расхождения между теоретическим распределением и выборочными данными.
Общую процедуру проверки гипотезы закона распределения можно представить в следующей последовательности:
По опытным данным строится эмпирическая кривая распределения вероятностей; Определяются параметры эмпирического распределения ( в соответствии с его видом );
Выдвигается одна или несколько гипотез о функции плотности исследуемой случайной величины, исходя из внешнего вида эмпирической кривой, значений ее параметров, технических факторов, влияющих на ее вид;
Эмпирическая кривая выравнивается по одной или нескольким теоретическим кривым; Проводится сравнение по одному или нескольким критериям согласия; Выбирается теоретическая функция, дающая наилучшее согласование. Поясним п. 4; 5. Определив по эмпирическим данным параметры распределения, подставляют их в теоретическую кривую закона распределения и рассчитывают вероятность середин интервалов эмпирического распределения. Умножив значение полученной вероятности на общее число опытов, получают теоретическое значение частот случайной величины, которые и определяютІвыровненнуюІкривую. Теперь можно найти вероятность того, что эмпирическая кривая соответствует выбранной теоретической, выбрав вероятность согласия ( уровень значимости ). Если результат расхождения не выйдет за принятый уровень значимости, то считают, что эмпирическое распределение согласуется с теоретическим. Если сравнение осуществляется с несколькими теоретическими законами, то окончательно принимать тот, который дает лучшее соответствие. Чаще всего в качестве критериев согласия принимают критерий Пирсона ( c2 ) и критерий Колмогорова - Смирнова ( К - С - критерий ). Критерий c2является наиболее состоятельным при большом числе наблюдений. Он почти всегда опровергает неверную гипотезу, обеспечивает минимальную ошибку в принятии неверной гипотезы по сравнению
с другими критериями. c2 = , где mj - наблюдаемая частота случайного события;
m*j - ожидаемая по принятому теоретическому закону распределения; К - число интервалов случайной величины.
Затем определяется число степеней свободы l: l = К - r - 1; где К - число интервалов случайной величины; r - число параметров теоретической функции распределения.
К - С -критерий лучше всего использовать в случае, если теоретические значения параметров распределения известны. При неизвестных параметрах его можно использовать, но он дает несколько завышенные результаты. При использовании этого критерия определяется величина
, где
mнj, m*нj - соответственно, накопленные наблюдаемые и ожидаемые (теоретические) частоты;
n - число проведенных опытов.
То есть, в данном случае оценивается только максимальное отклонение накопленной частоты случайного события, возникающее в одном из диапазонов изменения случайной величины. Полученное значение коэффициента сравнивается с табличным для числа степеней свободы опыта и принятого уровня значимости результата. Если табличное значение коэффициента больше, то гипотеза о принятом законе распределения не отвергается.
Контрольные вопросы Сущность непрерывной и дискретной случайной величины;
Сущность интегрального закона распределения случайной величины; Сущность дифференциального закона распределения случайной величины; Связь интегрального и дифференциального законов распределения; Основные характеристики случайной величины, заданной своим распределением; Назовите примеры законов распределения непрерывной и дискретной случайной величины;
Понятие статистической гипотезы и статистического критерия; Назовите примеры статистических гипотез;
Сущность ошибок первого и второго рода; Сущность проверки гипотезы вида закона распределения;
Принципиальное различие в критериях Пирсона и Колмогорова - Смирнова.
НАХОЖДЕНИЕ ИНТЕРПОЛИРУЮЩИХ КРИВЫХ
В первой части пособия рассматривались измерения той или иной физической величины, находящейся при проведении серии измерений в неизменном состоянии. Очень часто исследуемая величина меняется в соответствии с изменением условий опыта или времени. Цель эксперимента в этом случае состоит в нахождении функциональной зависимости, которая наилучшим образом описывает изменение интересующего нас параметра.
Следует понимать, что однозначно восстановить ( большей частью неизвестную ) функциональную зависимость между переменными невозможно даже в том случае, если бы переменные величины, полученные из опыта, не имели бы ошибки измерения. Тем более не следует ожидать, что это удастся сделать, имея экспериментальные данные, содержащие, по крайней мере, случайные ошибки измерений. Поэтому математическая обработка результатов наблюдений не может ставить перед собой задачу разгадать истинный характер зависимости между переменными. Она позволяет лишь представить результаты опыта в виде наиболее простой формулы. В зависимости от назначения этих формул существуют различные методы их получения, отличающиеся сложностью расчетных процедур и точностью получаемых решений.
Графический метод обработки результатов
Графический метод заключается в построении графика зависимости между исследуемыми величинами с последующим определением уравнения зависимости между ними.
Графики строят прежде всего в равномерных шкалах. Если характер связи между исследуемыми величинами неизвестен, то сначала проверяют совпадение экспериментальных точек с заданной кривой. Если предварительные сведения о характере уравнения отсутствуют, то первым этапом обработки данных является нахождение кривой, совпадающей с опытными точками. Эта задача решается методом подбора. Можно использовать эталон-кальку с предварительно вычерченным на ней семейством кривых с различными параметрами. Естественно, что масштаб кальки и эмпирической кривой должен быть одинаков.
Построенный по опытным данным отрезок кривой может совпадать с большим количеством различных кривых, проходящих достаточно близко к опытным точкам. В этом случае выбирают кривую с наиболее простым и удобным в использовании уравнением. Иногда эмпирическая кривая может иметь перегибы или состоять из отдельных ярко выраженных участков. Однако при этом необходимо определить координаты точек перехода от одной кривой к другой.
Уравнение зависимости между исследуемыми величинами при графическом методе просто определяется тогда, когда эмпирические точки достаточно хорошо совпадают с прямой линией, т. е. описываются уравнением y = ax + b, где a, b- коэффициенты, подлежащие определению. Определение коэффициентов при графическом методе основано на Іспособе натянутой нитиІ. Нанеся результаты эксперимента на график (лучше, если он выполнен на миллиметровке), подбираем графическую прямую, ближе всего подходящую к нанесенным точкам. Выбрав положение прямой, определяем две произвольные точки на этой прямой (не обязательно являющиеся точками эксперимента), определяем их координаты (x1; y1), (х2; y2). И для определения коэффициентов а и b получаем два простых уравнения
ах1 + b = y1; ах2 + b = y2.
На рис. 10 приведена иллюстрация этого метода. Точки -результаты, полученные в эксперименте. Прямая проведена на глаз как можно ближе к экспериментальным точкам. На прямой выбраны точки М (2; 4) и N (13; 10). Коэффициент а характеризует угол наклона прямой.
Поэтому . Таким образом y = 0, 55х + 2, 9.
В случае, если экспериментальная зависимость имеет нелинейный характер, то графическим способом в системе координат с равномерными шкалами определить коэффициенты кривой затруднительно. Но достаточно большой класс нелинейных зависимостей путем замены переменных и графического изображения в функциональных шкалах можно привести к линейным и далее использовать способ натянутой нити.
Функциональные шкалы и их применение
Пусть функция y = ¦(х) непрерывна и монотонна на некотором промежутке [ a; b ]. Возьмем ось ОМ, на которой будет строиться шкала, выберем на ней точку начала отсчета О и установим масштабm. Функциональная шкала строится следующим образом. Разбив интервал [ а; b ] на равные части, вычисляем значение функции ¦(х) в каждой из точек деления и отложим на оси ОМ для каждой точки отрезок m¦(х). Получающаяся при этом точка снабжается отметкой х, т. е. откладывается в выбранном масштабе значение функции, а надписывается значение аргумента. Иногда начало шкалы помещают в первую точку отсчета, т. е. точку с надписью а совмещают с 0. Тогда точка х будет находиться в конце отрезкаm [ ¦(х) - ¦(а) ]. Полученная шкала позволяет судить о поведении функции на рассматриваемом участке: большие промежутки между отметками укажут, что функция изменяется быстрее, чем там, где эти промежутки малы.
Выбор масштаба mопределяет длину шкалы. Чаще поступают наоборот: задаются длиной шкалы l и определяют масштаб.
Ю m = .
Пример. Построим функциональную шкалу для функции y = x2 на участке [ 1; 2 ]. Зададимся длиной шкалы l = 12 см. Тогда m = см. Разобьем отрезок [ 1; 2 ]на десять равных частей и вычислим значения функции во всех точках деления. Совместим начало шкалы с точкой отсчета х = 1. Результаты расчета сведены в табл. 2, а функциональная шкала приведена на рис. 11.
С помощью функциональных шкал графики многих функций могут быть преобразованы к прямолинейному виду.
Например, уравнение параболы y = x2. Если на оси OY нанести равномерную шкалу, а на оси OX1 шкалу квадратов х1 = х2, то получится сетка, где уравнение параболы имеет изображение прямой линии ( y = x1 ),
проходящей через начало координат.
Особенно часто используются различные логарифмические функции, с помощью которых можноІвыпрямлятьІ графики степенных и показательных функций. Например, y = aebx; lg y = (b lg е) х + lg a. Полагая lg y = y1, lg a = A, b lg e = B запишем исходное уравнение в виде y1= А + Вх, откуда видно, что оставив равномерной шкалу х и построив логарифмическую шкалу y1, можно изобразить исходное уравнение прямой линией. Полученная координатная сетка называется полулогарифмической.
Очевидно, что такого рода преобразования возможны и в более общем случае. Всякая неявная функция, заданная соотношением вида
аj(х) + by(y) + с = 0,
где a, b, с -постоянные, будет изображаться прямой линией на функциональной сетке, где на оси ОХ построена шкалаj(х), а на оси OY - шкала функции y(y). Естественно, что функции j(х) и y(y) должны удовлетворять условиям непрерывности и монотонности. В табл. 3 приведены преобразования для некоторых функций.
Таблица 3 Линеаризация некоторых функций Исходная формула Преобразованная формула Замена переменных Линеаризованная формула y=axb lg y=bЧlgx+lga lg y=y1 lg x=x1 lg a=a1 y1=bx1+a1 y=aЧlgx+b ѕ lg x=x1 y=ax1+b y=ebx+k lg y=bЧlgeЧx+kЧlge lg y=y1 bЧlg e=a kЧlg e=k1 y1=ax+k1 y=aebx lg y=bxЧlge+lga lg y=y1 bЧlg e=b1 lg a=a1 y1=b1x+a1 y= ѕ y=ax1+b y= y1=ax+b y= y1=bx1+a
Из сказанного ясна роль функциональных сеток при обработке результатов эксперимента. Если результаты эксперимента располагаются вблизи кривой, то по имеющемуся ограниченному участку кривой трудно судить, какого типа функцией ее лучше всего приближать. Переведя полученные экспериментальные данные на функциональные сетки можно оценить на какой из них эти данные ближе всего подходят к прямой и, следовательно, какой функцией лучше всего описываются.
Аналитические методы обработки результатов
Графический метод обработки результатов обладает наглядностью, относительной простотой, однако его результаты содержат определенную субъективность и относительно низкую точность.
Аналитические методы лишены в какой -то степени указанных недостатков и позволяют получить результат для более широкого класса функций с большей точностью, чем графический метод. Существуют различные аналитические методы получения параметров эмпирических кривых в зависимости от критерия, принятого при их получении. Рассмотрим некоторые из существующих способов.
Способ средней
Допустим, что имеется n сочетаний xi, yi, полученных при эксперименте. Даже в том случае, если между х и y теоретически установлена функциональная связь ( в данном случае предположим, что линейная ), то наблюдаемые значения yi будут отличаться от ахi + b вследствие наличия экспериментальных ошибок. Обозначим через Di соответствующую ошибку
Di = yi - axi - b (i = 1, 2, .... , n)
Если выбирать параметры а и b так, чтобы для всех n наблюдений ошибки уравновешивались, т. е. , то это привело бы нас к одному уравнению, тогда как для нахождения двух коэффициентов (а, b) их требуется два. Поэтому предположим, что уравновешивание происходит не только для всех произведенных наблюдений в целом, но и для каждой группы, содержащей половину ( или почти половину ) всех наблюдений в отдельности.
В этом случае можно прийти к системе уравнений , где m - число наблюдений в первой группе. Данную систему уравнений запишем теперь в виде .
Изложенное показывает, что метод средних ІуравновешиваетІположительные и отрицательные отклонения теоретической кривой от экспериментальных значений.
Пример. Используя данные рис. 10 определим коэффициенты а, b методом средней. Для этого семь измерений разделим на две группы m = 3 первых значений, n- m = 4 последующих ; ;
; . Получаем систему Решая систему находим ; b = Таким образом способ средней дает прямую y = 0, 55х + 3, 11.
В сравнении с графическим способом коэффициенты а совпадают и имеется различие в коэффициенте b.
3. 3. 2. Метод наименьших квадратов
В методе средних при определении коэффициентов уравнения использовалось условие равенства нулю алгебраической суммы отклонений результатов эксперимента от теоретической кривой ( в частном случае прямой ). Очевидно, что при этомDi могут быть значительной величины. Имеет значение только ІуравновешиваниеІ положительных и отрицательных отклонений. Поставим теперь задачу нахождения по результатам наблюдений наиболее вероятные значения неизвестных коэффициентов.
Предположим, что искомая зависимость y = ¦(х) существует. Тогда параметры этой линии необходимо выбрать таким образом, чтобы точки yi располагались по обе стороны кривой y = ¦(х) как можно ближе к последней. Предположим, что разброс точек yi относительно y = ¦(х) подчиняется закону нормального распределения. Тогда мерой разброса является дисперсияs2 или ее приближенное выражение - средний квадрат отклонений.
.
И требование минимального разброса будет удовлетворено, если минимизировать выражение (Dyi )2. Как известно, необходимым условием того, что функция приобретает минимальное значение, является то, что ее первая производная ( или частные производные для функции многих переменных ) равна нулю. Применение метода наименьших квадратов имеет смысл, если число экспериментальных точек n больше числа определяемых коэффициентов.
Рассмотрим реализацию метода наименьших квадратов применительно к уравнению вида y = ax + b.
Для нахождения коэффициентов а, b искомой прямой необходимо минимизировать сумму квадратов расстоянийDyi по ординате от точки (хi; yi) до прямой ( см. рис. 12 ). Расстояния Dyi определятся
Dyi = yi - axi - b.
Для минимизации приравниваем к нулю производные этой суммы по параметрам а, b: ;
. Преобразуем эту систему
Получим систему нормальных уравнений метода наименьших квадратов. Решая ее относительно а, b получаем:
; .
Вычисляя из n опытов необходимые суммы и производя указанные действия, получаем величину коэффициентов а, b.
Как видно, способ наименьших квадратов достаточно громоздок и при его применении широко используется вычислительная техника. Метод наименьших квадратов может использоваться и в случае нелинейных функций. Например, если определяются параметры квадратичной зависимости:
y = ах2 + bx + с, то .
Дифференцируя это соотношение по а, b, с получаем систему нормальных уравнений:
Из этой системы можно определить параметры а, b, с.
При использовании метода наименьших квадратов при других нелинейностях, удобнее будет линеаризовать исходные зависимости.
В табл. 4 приведены системы нормальных уравнений для некоторых исходных уравнений.
Таблица 4 Системы нормальных уравнений Исходное уравнение Система нормальных уравнений y=axb y=aЧlgx+b y=eax+b y=aebx y= y= y=
Примечания: 1. Величины х, y обозначают значения величин хi, yi в i-ом опыте;
Знак S обозначают сумму величин от i = 1 до i = n, где n - число равноточных измерений. Интерполирование функций
Известно, что под интерполированием понимают отыскание значений функции, соответствующих промежуточным значениям аргумента, отсутствующим в таблице логарифмов, тригонометрических и др. функций.
В общем смысле можно сказать, что задача интерполирования обратна задаче табулирования функций. При интерполировании по таблице значений функции строится ее аналитическое выражение, т. е. по значениям функции yo, y1, .... , yn при значениях аргумента хо, х1, .... , хn определяется выражение неизвестной функции. Понятно, что через данные точки ( даже большого числа ) можно провести множество различных кривых. Поэтому существует интерполирование в различных функциях F (х). Чаще всего требуют, чтобы функция F(х) была многочленом степени на единицу меньшей, чем число известных значений.
Таким образом, задачу интерполирования функций можно сформулировать следующим образом.
Для данных значений х є хо, х1, .... , хn и y є yo, y1, .... , yn найти многочлен y = F (х) степени n, удовлетворяющий условиям F (хо) = yo, F (х1) = y1, .... , F (хn) = yn. Точки хо, х1, .... , хn называют узлами интерполяции. Многочлен F (х) - интерполяционным многочленом , а формулы его построения - интерполяционными формулами. Как видно из описания сущности интерполирования, в отличии от описанных ранее способов получения функций ( графического, метода средних, метода наименьших квадратов ), интерполяционный многочлен опишет кривую, проходящую точно через заданные точки.
Параболическое интерполирование
При параболическом интерполировании в качестве интерполяционного многочлена F (х) принимают многочлен n- ой степени вида
F (х) = ао + а1х + а2х2 + .... + аnxn.
Используя свойство прохождения функции F (х) через заданные точки для неизвестных коэффициентов аi можно составить n + 1 уравнений с n + 1 неизвестным: ао + а1хо + а2хо2 + .... + аnхоn = yo;
Эта система имеет единственное решение, если значения хiотличны друг от друга. Понятно, что при большом n возникает сложность решения этой системы. Перед рассмотрением общего способа решения, рассмотрим простой пример.
Дано: хо = 0, х1 = 1, х2 = 2, yо = 1, y1 = 1, y2 = 3. Определить многочлен F (х). Записывая многочлен F (х) в виде
F (х) = ао + а1х + а2х2 составим систему уравнений или
откуда ао = 1, а1 = - 1, а2 = 1 и интерполирующий многочлен имеет вид
F (х) = 1 - х + х2.
Теперь рассмотрим общий подход к отысканию интерполяционного многочлена F (х), не решением системы, а непосредственной записью.
Определим выражение для многочлена, принимающего в точке х = хо значение yо = 1, а в точках х = х1, х2, .... , хn - значения y1 = y2 = .... = yn = 0. Очевидно, что многочлен будет иметь вид
.
Здесь при х = хо числитель и знаменатель равны, а при х = х1, х2, .... , хn - числитель равен нулю. Теперь построим многочлен Fо (х), принимающий в точке хо значение yо и обращающийся в нуль для значений х = х1, х2, .... , хn. Учитывая предыдущее построение можно записать
.
Теперь можно записать многочлен F (х) для произвольного значения хi ( i = 0, 1, 2, .... , n ) принимающего значения F (хi) = yi, а во всех остальных точках х № хi значение, равное нулю
.
Как видно из записи, числитель не будет содержать выражения (х - хi), а знаменатель - (хi - хi), т. е. выражений, обращающих числитель и знаменатель в нуль. Искомый многочлен будет равен сумме
,
т. е. снова в каждой точке хi одно из слагаемых принимает нужное значение yi, а все остальные обращаются в нуль. В развернутом виде
= .... + .
Полученная формула называется интерполяционной формулой Лагранжа. Используя формулу Лагранжа запишем многочлен F (х) для разобранного выше примера.
= =. Получили тоже самое выражение, что и ранее. Контрольные вопросы Назначение графического метода обработки результатов; Сущность графического метода обработки результатов; Понятие и назначение функциональной шкалы; Выбор масштаба функциональной шкалы; Сущность аппроксимации методом средних; Сущность аппроксимации методом наименьших квадратов;
Принципиальное отличие метода интерполирования от метода наименьших квадратов.
4. ОСНОВЫ НОМОГРАФИИ
Номография - слово греческое. Номос - закон, графо - пишу, черчу. В буквальном переводе это слово означает Ічерчение законаІ. Своей задачей номография ставит построение специальных графиков -номограмм, служащих для решения различных уравнений. Номограммы дают возможность компактно представлять функции многих переменных и таблицы с несколькими входами. На номограммах можно решать некоторые трансцендентные уравнения и системы таких уравнений. Номограммы можно применять не только для вычислительных целей, но и для исследования положенных в их основу функциональных зависимостей.
Наглядность представления различных закономерностей и простота использования номограмм при достаточно высокой точности результата обеспечивают широкое использование номограмм в различных областях техники.
В основе номограмм лежит понятие функциональной шкалы ( см. выше ). На основе функциональных шкал создаются не только номограммы, но и различные вычислительные средства: универсальные вычислительные номограммы, логарифмические линейки и т. п.
В данной главе излагается один из возможных видов номограмм -номограммы в декартовой системе координат, имеющие достаточно широкое использование в машиностроении.
Номограммы в декартовой системе координат
В разделах 3. 1. , 3. 2. описана процедура построения графиков для функции одного переменного. При этом на графике получается одна линия ( прямая или кривая ). Если же изучаемая функция зависит от двух переменных
Z = ¦ (х, y),
то придавая в этом уравнении, например, параметру y ряд частных ( постоянных ) значений y1, y2, .... , yn можно, как и для функции одного переменного, построить зависимости
Z = ¦ (х, y1); Z = ¦ (х, y2); ............................ Z = ¦ (х, yn).
Получим систему кривых ( в частном случае прямых ), называемых номограммой из ІпомеченныхІ линий, т. к. каждая линия помечается соответствующим значением yi. Пример. При исследовании процесса фрезерования было установлено, что наиболее целесообразно величину радиального биения смежных зубьев фрезы назначать по условию обеспечения участия в процессе резания всех зубьев фрезы. Аналитически это условие выражается уравнением
, где Sz - расчетная величина подачи на зуб, мм/зуб; k = - параметр операции; D - диаметр фрезы, мм; t - глубина резания, мм; D - величина биения смежных зубьев фрезы, мм.
Как видно, Sz = ¦ (k, D) является функцией двух параметров. Здесь можно отметить, что, фактически Sz = ¦ (D, t, D), т. е. функцией трех параметров, но два параметра (D, t) заменены одним - k = , легко определяемым и уменьшающим количество переменных. Данный прием широко используется в номографии.
Теперь необходимо определиться с осями и помеченным параметром. В качестве оси ординат, в соответствии с функциональной зависимостью, рационально принять Sz. В качестве же оси абсцисс можно принять либо k, либо D. Если в качестве оси ординат принять k ( а помеченным параметром Di ), то зависимость
Sz = ¦ (k, Di)
будет получаться криволинейной, в соответствии с закономерностью . Проще строить и использовать прямолинейные графики при равномерных шкалах. Поэтому стараются номограммы строить на основе прямых линий. Поэтому лучше будет строить номограмму из помеченных линий вида
Sz = ¦ (D, Ki), где .
Теперь выбираем масштаб построения и диапазоны изменения переменных. С учетом условий процесса фрезерования принимаемD Ј 0, 08 мм; Sz Ј 0, 20 мм/зуб. Параметр k изменяем дискретно k = 2; 5; 10; 20; 30; 40; 50. Так как зависимость Sz = ¦ (D, Ki) является прямой линией, проходящей через начало координат, то для построения графиков достаточно вычислить только одно значение Sz при каком - либо значении D. Например, для k = 2, при D = 0, 06 мм имеем
( мм/зуб ).
Теперь через точки ( 0; 0 ) и ( 0, 06; 0, 06 ) можно провести прямую линию и пометить ее параметр k = 2. Аналогично проводятся и другие линии. На номограмме наносится линия, показывающая порядок ее использования.
4. 2. Составные номограммы с помеченными линиями
Номограмму в одной четверти можно построить для функции двух переменных. При большем числе переменных это сделать уже нельзя. В этом случае используют составные номограммы. Идею построения рассмотрим сначала в общем виде. Пусть нам дано уравнение в неявном виде с четырьмя переменными
¦ (х, y, z, h) = 0. Допустим, что его можно привести к виду ¦1(х, y) = ¦2 (z, h), т. е. можно разделить переменные. Положим ¦1 (х, y) = g; ¦2 (z, h) = g.
Мы получим два уравнения, зависящих от двух переменных. Каждое из этих уравнений можно номографировать, как описано выше. Обеспечив отсчет величиныg на одинаковой функциональной шкале, можно обойтись и без численных значений g ( если они нас не интересуют по условиям решаемой задачи ).
Аналогично поступают и с уравнениями с большим числом переменных, которое будет приводить к увеличению числа общих шкал и большему числу четвертей построения номограммы. Нужно только иметь в виду, что не всякое уравнение допускает разложение на несколько уравнений с двумя переменными и, следовательно, не всякое уравнение удается таким образом номографировать.
Рассмотрим реальный пример построения составной номограммы. При исследовании процесса фрезерования было установлено, что сила резания при фрезеровании узких поверхностей приобретает характер повторяющихся импульсов не гармонической формы. И возмущение технологической системы осуществляется не на одной, а в бесконечном диапазоне частот. Наиболее опасно воздействие первых трех гармоник, несущих значительно больше энергии возмущения, чем все другие. Распределение энергии по этим трем гармоникам осуществляется в зависимости от отношения фронтов нарастания и спада силы в импульсе. Это отношение можно характеризовать отношением углов контакта фрезы (j) и зуба фрезы (y) с заготовкой. Причем всегда j і y. Для наглядного представления и определения характера распределения энергии по трем гармоникам в зависимости от условий операции построим номограмму. В одной из четвертей первоначально отражается характер распределения энергии по гармоникам возмущения в зависимости отj/y(рис. 15). Эти зависимости построены из результатов исследований, которые здесь не отражаются. Коэффициент Х2 характеризует Іудельный весІ энергии данной гармоники в общем силовом возмущении. Диапазон j/y = 1.... 9. Теперь отношение j/y раскрываем в параметрах инструмента и операции
. Видно, что здесь четыре переменных величины: D, t, B, w.
Введем промежуточную ось С и построим номограмму из помеченных линий для одной из переменных величин, а именно Вi
.
Видно, что это уравнения прямых линий, проходящих через начало координат. Задаваясь одним значениемj/y и Вi можно провести ее график. Например, при j/y = 5, Вi = 5 получим С = 2Ч5Ч5 = 50. Аналогично поступаем для Вi = 10; 15; 20. Далее вводим следующую промежуточную ось ( и соответственно переменную ) L = C Чtg wi. Задаваясь величинами угла wi и С можно определить положение помеченных линий. Например, при w = 45°, С = 50 L = 50Чtg 45° =50. Аналогично поступаем и для других углов wi = 15°; 30°; 60°; 75°. Проводим прямые линии через начало системы координат и помечаем значение углаwi каждой линии.
Таким образом осталась одна взаимосвязь параметров .
Здесь необходимо определиться с параметром, направленном по оси и ІпомеченнымІпараметром. В любом случае зависимость нелинейная. Кроме того, глубина резания является задаваемым параметром и его лучше взять в качествеІпомеченногоІпараметра. Для построения помеченных линий нужно определить несколько координат каждой линии.
Рассмотрим ІпомеченнуюІлинию t = 5 мм. В качестве переменного параметра принимаем диаметр фрезы D. При D = 25; 50; 100; 150; 200 мм соответственно имеем
По найденным точкам строится линия для t = 5 мм. Аналогично поступают и для других значений t.
Указаны промежуточные оси С, L, которые при использовании номограммы не нужны и могут не указываться, указаны и частные зависимости для каждой четверти номограммы.
Полученная номограмма наглядно показывает, что распределение энергии по гармоникам возмущения технологической системы определяется условиями операции, изменяя которые можно воздействовать на возмущение технологической системы. Для исключения резонансных явлений необходимо знать спектр собственных частот системы и согласовывать условия операции с их значениями, уменьшая количество энергии наІрезонанснойІчастоте. Эти данные, как правило, отсутствуют. Поэтому используя номограмму можно скорректировать условия операции. Для этого по известным параметрам фрезы, которая показала неудовлетворительные результаты, и элементам режима резания необходимо определить распределение энергии по гармоникам возмущения и выбрать другое распределение. Так как глубину резания и ширину фрезерования изменять, как правило, невозможно, а изменение угла наклона режущей кромки часто нецелесообразно по условиям стойкости инструмента, то новое распределение энергии можно получить изменив диаметр фрезы ( в большую или меньшую сторону по сравнению с первоначальным ). При этом необходимо сохранить прежним относительное число зубьев ( z/D) и скорость резания, так как число оборотов и зубьев фрезы играют самостоятельную роль в определении частотного диапазона возмущения (inz).
Как видно из изложенного, номограмма может существенно помогать в управлении процессом резания, на основе заложенных в нее функциональных зависимостей.
Контрольные вопросы Сущность и назначение номографии;
Функцию какого числа переменных можно отразить в одной четверти декартовой системы координат ?
Понятие номограммы из ІпомеченныхІ линий;
Сущность составной номограммы и промежуточной функциональной шкалы.
ТИПОВЫЕ ЗАДАЧИ МАТЕМАТИЧЕСКОЙ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
В целях закрепления знаний и получения практических навыков предлагается решить несколько задач, имеющих практическую направленность.
Для каждой группы данных определить значение измеряемого параметра, наличие промахов в ряду измерений. Для какой группы измерений результат получен точнее? Выбрав в случайном порядке 1, 4, 9, 16, 25 отсчетов проверить справедливость зависимости точности среднего значения от числа измерений. Построить эмпирические законы интегрального и дифференциального распределений. Подобрать теоретический закон распределения и оценить его соответствие. Отклонения диаметра вала распределены по нормальному закону. Половина значений диаметра лежит в интервале 20±0, 1 мм. Отклонения диаметра отверстия также распределены по нормальному закону. Половина всех отклонений отверстия находится в интервале 20±0, 05 мм. Полагая, что сборка соединения производится вручную, определите, сколько из 50 валов не подойдет по размеру. Какой номинальный диаметр осевого отверстия ( вместо 20 мм ) следует задать ( при том же законе распределения ), чтобы все 100% деталей подошли друг к другу при ручной сборке. В цехе машиностроительного завода выполняется сложный заказ, с определенной вероятностью возникновения брака. Для обеспечения плана выпуска 100 изделий запущено в производство 110 единиц. Какова вероятность, что заказ будет выполнен если вероятность получения одного изделия 0, 9; 0, 95 ? При исследовании обрабатываемости одного из конструкционных материалов были получены зависимости периода стойкости зуба фрезы от угла наклонаw стружечной канавки. Результаты приведены в таблице:
w° 20 30 40 50 60 T, мин 30 60 80 70 50
Используя метод наименьших квадратов и параболического интерполирования получить аналитическую зависимость стойкости от угла наклона . С помощью критерия c2проверьте соответствие числа бракованных деталей за 51 смену пуассоновскому распределению.
Число бракованных изделий за одну смену, m 0 1 2 3 4 5 6 7 8 Число смен с m бракованными изделиями 3 7 9 12 9 6 3 2 0
Известно, что количество бракованных инструментов в партии соответствует закону Пуассона с параметром интенсивностиl = 0, 5. Определить количество бракованных изделий в партии. Случайная величина х распределена по закону равной вероятности в интервале [ 1; 10 ]. Определите при каком значении х вероятность его нахождения в заданном интервале равна 0, 05 и 0, 95 ?
Случайная величина х подчиняется нормальному закону распределения с параметрами х = 3, s2 = 25. Вычислить вероятности Р ( Х і 10 ), Р ( -2 Ј Х Ј 8 ), Р ( Х Ј -10 ). Дайте графическую иллюстрацию результата. Станок -автомат настроен на выполнение размера 100, 1 мм. Разброс размеров деталей подчиняется нормальному закону распределения с дисперсиейs2 = 0, 25 мм2. Поле допуска на размер детали составляет 100 ±0, 15 мм. Найдите долю брака при проведенной настройке, представьте ее в виде графика от среднеарифметического значения. На какое значение необходимо настроить автомат, чтобы доля брака была минимальной, определите эту долю. Пусть х = 100, s = 0, 5. Что окажет большее влияние на увеличение доли брака - сдвиг х на ±0, 5 или увеличение s на 0, 5 ? При исследовании силы резания в зависимости от глубины резания была измерена главная составляющая силы резания Рz при четырех значениях глубины резания
t, мм 1 2 3 4 Pz, Н 2300 3200 4000 4600
Графическим методом, методом средних и методом наименьших квадратов установить зависимость составляющей силы от глубины резания.
ЛИТЕРАТУРА Теория Вероятностей, М. 1998
Гутер Р. С. , Овчинский Б. В. Элементы численного анализа и математической обработки результатов опыта. - М. : Физматгиз, 1962. - 356 с. Зайдель А. Н. Ошибки измерения физических величин. - Л. : Наука, 1974. - 108 с. Кассандрова О. Н. , Лебедев В. В. Обработка результатов наблюдений. - М. : Наука, 1970. - 104 с. Колесников А. Ф. Основы математической обработки результатов измерений. - Томск: ТГУ, 1963. - 49 с. Плескунин В. И. , Воронина Е. Д. Теоретические основы организации и анализа выборочных данных в эксперименте. Учебное пособие. - Л. : ЛЭУ, 1979. - 232 с. Румшинский Л. З. Математическая обработка результатов эксперимента. Справочное руководство. - М. : Наука, 1971. - 192 с.
Рыжов Э. В. , Горленко О. А. Математические методы в технологических исследованиях. - Киев: Наук. думка, 1990. - 184 с.
Сухов А. Н. Математическая обработка результатов измерений. Учебное пособие. - М. : МИСИ, 1982. - 89 с. Чкалова О. Н. Основы научных исследований. - Киев: Вища школа, 1978. - 120 с.