Istotność statystyczna w czasach big data

Mirosław Szreder

Abstract

The development of new technologies has affected both the procedures of traditional statistical surveys and the perception of their results in the light of other available sources of information. In this connection, the role of the verification of statistical hypotheses and of the interpretation and presentation of its results, including the use of statistical significance and p-value, has recently returned as a frequent topic for discussion among the scientific community. The author was inspired to write this paper by a wave of discussion regarding this matter held at the beginning of 2019 in the Nature and The American Statistician journals. The aim of the paper is to present the opportunities provided and challenges posed by the use of big data to the hypothesis verification process and to statistical inference, both in the traditional and Bayesian approaches. The author explains the necessity of discontinuing adopting excessive simplifications while performing statistical inference and presenting the results of the verification of hypotheses. This involves both the postulate to pay greater attention to the quality of sampling data, especially in the case of data originating from big data sets, as well as the postulate to provide full information about the statistical model on the basis of which the inference is being performed.
Author Mirosław Szreder (FM/DS)
Mirosław Szreder,,
- Department of Statistics
Other language title versionsStatistical significance in the era of big data
Journal seriesWiadomości Statystyczne, ISSN 0043-518X, e-ISSN 2543-8476, (N/A 20 pkt, Not active)
Issue year2019
Vol64
No11
Pages42-57
Publication size in sheets0.75
Keywords in Polishwnioskowanie statystyczne, testowanie hipotez, istotność statystyczna, wskaźnik p-value, big data, podejście bayesowskie
Keywords in Englishstatistical inference, hypothesis testing, statistical significance, p-value, big data, Bayesian approach
ASJC Classification2700 General Medicine
Abstract in PolishRozwój nowych technologii wpływa zarówno na realizację badań statystycznych, jak i na postrzeganie ich wyników w świetle innych źródeł informacji. W tym kontekście powraca w środowisku naukowym temat roli testowania hipotez statystycznych oraz interpretowania i przedstawiania jego wyników, w tym stosowania kategorii istotności statystycznej oraz wskaźnika p-value. Inspiracją do powstania tego opracowania stała się fala dyskusji wokół tego zagadnienia toczących się na forum czasopism „Nature” i „The American Statistician” na początku 2019 r. Celem artykułu jest ukazanie szans i zagrożeń, jakie big data stwarza dla weryfikacji hipotez i wnioskowania statystycznego, zarówno w ujęciu klasycznym, jak i w podejściu bayesowskim. Autor uzasadnia konieczność zaniechania zbyt daleko posuniętych uproszczeń w realizacji procesu wnioskowania statystycznego oraz prezentowaniu wyników weryfikacji hipotez. Chodzi zarówno o postulat uwzględnienia jakości danych próbkowych, zwłaszcza typu big data, jak i o podawanie pełnej informacji o modelu statystycznym, na podstawie którego przeprowadza się wnioskowanie.
URL https://ws.stat.gov.pl/Article/2019/11/042-057
Languagepl polski
LicenseRepository; published final; Other open licence; with publication
File
Szreder_Miroslaw_Istotnosc_statystyczna_w_czasach_big_data_2019.pdf Szreder_Miroslaw_Istotnosc_statystyczna_w_czasach_big_data_2019.pdf 377,85 KB
Score (nominal)20
Score sourcejournalList
ScoreMinisterial score = 20.0, 29-01-2020, ArticleFromJournal
Citation count*
Additional fields
LicencjaKorzystanie z tego materiału jest możliwe zgodnie z właściwymi przepisami o dozwolonym użytku lub o innych wyjątkach przewidzianych w przepisach prawa, a korzystanie w szerszym zakresie wymaga uzyskania zgody uprawnionego
Cite
busy
Share Share

Get link to the record


* presented citation count is obtained through Internet information analysis and it is close to the number calculated by the Publish or Perish system.
Back
Confirmation
Are you sure?