Статистика
Материал из Википедии — свободной энциклопедии
Стати́стика — отрасль знаний, в которой излагаются общие вопросы сбора, измерения и анализа массовых статистических (количественных или качественных) данных.
Слово «статистика» происходит от латинского status - состояние, положение вещей. Первоначально оно употреблялось в значении «политическое состояние». В научный обиход слово «статистика» ввел в XVIII веке немецкий ученый Г. Ахенваль[источник не указан 15 дней]. Статистика — это наука об организации, сборе, представлении, анализе и интерпретации количественных данных. Статистика разрабатывает специальную методологию исследования и обработки материалов: массовые статистические наблюдения, метод группировок, средних величин, индексов, балансовый метод, метод графических изображений и другие методы анализа статистических данных. Статистика как наука включает разделы: теоретическая статистика (общая теория статистики), прикладная статистика, математическая статистика, экономическая статистика, эконометрика, правовая статистика, демография, медицинская статистика, технометрика, хемометрика,биометрика, наукометрика, иные отраслевые статистики и др.
В России формированием официальной статистической информации занимается Федеральная служба государственной статистики (Росстат).
Статистикой называется также набор определенных статистических данных (статистика смертности, статистика посещений сайта, …).
В математической статистике статистикой называют измеримую функцию наблюдений
, где
- выборка.
Содержание |
[править] Развитие представлений о статистике
Первая опубликованная статистическая информация появляется уже в «Книга чисел» в Ветхом Завете, в которой рассказано о переписи военнообязанных, проведённой под руководством Моисея и Аарона. Впервые термин «статистика» встречается в художественной литературе — в «Гамлете» Шекспира. Смысл этого слова у Шекспира — знать, придворные. Оно происходит от латинского слова status, что в оригинале означает «состояние» или «политическое состояние».
В течение следующих 400 лет термин «статистика» понимали и понимают по-разному. Вначале под статистикой понимали описание экономического и политического состояния государства или его части. Например, к 1792 г. относится определение: «статистика описывает состояние государства в настоящее время или в некоторый известный момент в прошлом». И в настоящее время деятельность государственных статистических служб вполне укладывается в это определение.[1]
Однако постепенно термин «статистика» стал использоваться более широко. По Наполеону Бонапарту, «статистика — это бюджет вещей». Тем самым статистические методы были признаны полезными не только для административного управления, но и для применения на уровне отдельного предприятия. Согласно формулировке 1833 г., «цель статистики заключается в представлении фактов в наиболее сжатой форме».[1]
В ХХ в. статистику часто рассматривают прежде всего как самостоятельную научную дисциплину. Статистика есть совокупность методов и принципов, согласно которым проводится сбор, анализ, сравнение, представление и интерпретация числовых данных. В 1954 г. академик АН УССР Б. В. Гнеденко дал следующее определение: «Статистика состоит из трёх разделов:
- сбор статистических сведений, то есть сведений, характеризующих отдельные единицы каких-либо массовых совокупностей;
- статистическое исследование полученных данных, заключающееся в выяснении тех закономерностей, которые могут быть установлены на основе данных массового наблюдения;
- разработка приёмов статистического наблюдения и анализа статистических данных. Последний раздел, собственно, и составляет содержание математической статистики».[2]
Термин «статистика» употребляют ещё в двух смыслах. Во-первых, в обиходе под «статистикой» часто понимают набор количественных данных о каком-либо явлении или процессе. Во-вторых, статистикой называют функцию от результатов наблюдений, используемую для оценивания характеристик и параметров распределений и проверки гипотез.
[править] Краткая история статистических методов
Типовые примеры раннего этапа применения статистических методов описаны в Библии, в Ветхом Завете. Там, в частности, приводится число воинов в различных племенах. С математической точки зрения дело сводилось к подсчёту числа попаданий значений наблюдаемых признаков в определённые градации.
Сразу после возникновения теории вероятностей (Паскаль, Ферма, XVII век) вероятностные модели стали использоваться при обработке статистических данных. Например, изучалась частота рождения мальчиков и девочек, было установлено отличие вероятности рождения мальчика от 0.5, анализировались причины того, что в парижских приютах эта вероятность не та, что в самом Париже, и т. д.
В 1794 г. (по другим данным — в 1795 г.) К.Гаусс разработал метод наименьших квадратов, один из наиболее популярных ныне статистических методов, и применил его при расчёте орбиты астероида Церера — для борьбы с ошибками астрономических наблюдений.[3] В ХIХ веке заметный вклад в развитие практической статистики внёс бельгиец Кетле, на основе анализа большого числа реальных данных показавший устойчивость относительных статистических показателей, таких, как доля самоубийств среди всех смертей.[4]
Современный этап развития статистических методов можно отсчитывать с 1900 г., когда англичанин К. Пирсон основал журнал «Biometrika». Первая треть ХХ в. прошла под знаком параметрической статистики. Изучались методы, основанные на анализе данных из параметрических семейств распределений, описываемых кривыми семейства Пирсона. Наиболее популярным было нормальное распределение. Для проверки гипотез использовались критерии Пирсона, Стьюдента, Фишера. Были предложены метод максимального правдоподобия, дисперсионный анализ, сформулированы основные идеи планирования эксперимента.
Разработанную в первой трети ХХ в. теорию анализа данных называют параметрической статистикой, поскольку её основной объект изучения — это выборки из распределений, описываемых одним или небольшим числом параметров. Наиболее общим является семейство кривых Пирсона, задаваемых четырьмя параметрами. Как правило, нельзя указать каких-либо веских причин, по которым распределение результатов конкретных наблюдений должно входить в то или иное параметрическое семейство. Исключения хорошо известны: если вероятностная модель предусматривает суммирование независимых случайных величин, то сумму естественно описывать нормальным распределением; если же в модели рассматривается произведение таких величин, то итог, видимо, приближается логарифмически нормальным распределением. и т. д.
[править] См. также
- Статистические методы
- Правовая статистика
- Математическая статистика
- Прикладная статистика
- Демография
- Перепись населения
- Статистика запросов
- Список статистиков
- Центральное статистическое управление
[править] Примечания
- ↑ 1 2 Никитина Е.П., Фрейдлина В.Д., Ярхо А.В. Коллекция определений термина «статистика». — Москва: МГУ, 1972.
- ↑ Гнеденко Б.В. Очерк по истории теории вероятностей. — Москва: УРСС, 2001.
- ↑ Клейн Ф. Лекции о развитии математики в ХIХ столетии. Часть I. — Москва, Ленинград: Объединенное научно-техническое издательство НКТП СССР, 1937.
- ↑ Плошко Б.Г., Елисеева И.И. История статистики: Учеб. пособие. — Москва, Ленинград: Финансы и статистика, 1990.
[править] Источники
- Федеральная служба государственной статистики Российской Федерации- Росстат
- http://magbase.rssi.ru/REFMAN/STATTEXT/default.htm
- http://www.statsoft.ru/home/portal/default.asp
- Государственный комитет статистики Украины
- Онлайн Ресурс за Статистически Пресмятания - Statistics Online Computational Resource (UCLA)
- Статистическа електронна книга (EBook)
- US Census Bureau центральный статистический орган США - Бюро переписи США
- Мир Статистики - образовательный статистический сайт
| Это незавершённая статья по статистике. Вы можете помочь проекту, исправив и дополнив её. |
Для улучшения этой статьи желательно?:
|

