Гистограмма (от греч. histos - столб и gramma - запись) - представление для плотности распределения
вероятности (ПРВ) случайной величины в виде ступенчатой функции. Метод Г. является
одним из методов непараметрич. оценивания ПРВ и состоит в следующем. Пусть x1,
x2, . . ., хп - случайные числа, ПРВ к-рых надо оценить.
Разобьём интервал (t0, tm), содержащий эти
случайные числа, на т отрезков (ti, ti+1),
наз. каналами или ячейками Г. Длины отрезков ti+1-ti
наз. ширинами каналов, на практике для простоты их часто выбирают
равными между собой. Подсчитаем ni - кол-ва случайных
чисел, попавших в каждый отрезок (канал Г.). Искомая ступенчатая функция fn(t)
в интервале t0<x<tn определяется соотношением
fn(t)=ni/n(ti+1-ti), вне
указанного интервала функция f(t) не определена и её обычно полагают
равной нулю. Можно показать, что при больших ni значение fn(t)
близко к ср. значению ПРВ на отрезке, содержащем t, а ошибка оценки значения
ПРВ . Учитывая
это обстоятельство, ширины каналов выбирают так, чтобы ni
были достаточно велики. С др. стороны, если xk являются результатами
измерений, ширины каналов не следует выбирать намного меньше ошибок измерения
величин xk. Графически Г. можно изобразить в виде столбчатой
диаграммы, состоящей из смежных прямоугольников, построенных на прямой линии
так, что площадь каждого прямоугольника пропорциональна ni/n.
В нек-рых случаях, напр. при очень больших ni, Г. можно считать
искомой функцией ПРВ, заданной таблично. Сравнивая Г. и предполагаемую функцию ПРВ
f(x)(графически или численно), можно сделать заключение о соответствии
выборки случайных чисел предполагаемой ПРВ. При этом надо иметь в виду, что
несовпадение Г. и f(х)может быть обусловлено флуктуациями чисел ni,
соответствующих биномиальному распределению с дисперсией
(см. Статистический
критерий гипотез). В ряде случаев по Г. удобнее вычислять приближённое значение
моментов распределения f(x), причём при правильно выбранной ширине канала
потери информации практически не происходит.
Метод Г. применяется в обработке физ. информации, для выделения сигналов из шума, в автоматич. распознавании образов, для сокращения объёма данных, для представления получаемых результатов в виде спектров.
А. А. Лебедев