Definición de estadística, significado, concepto, que es
Definición de estadística, significado, concepto, que es.La estadística es la ciencia relacionada con el desarrollo y el estudio de métodos para recopilar, analizar, interpretar y presentar datos empíricos. La estadística es un campo altamente interdisciplinario; la investigación en estadística encuentra aplicabilidad en prácticamente todos los campos científicos y las preguntas de investigación en los diversos campos científicos motivan el desarrollo de nuevos métodos y teorías estadísticas.
Al desarrollar métodos y estudiar la teoría que subyace a los métodos, los estadísticos se basan en una variedad de herramientas matemáticas y computacionales.
Dos ideas fundamentales en el campo de las estadísticas son la incertidumbre y la variación. Hay muchas situaciones que encontramos en la ciencia (o más generalmente en la vida) en las que el resultado es incierto. En algunos casos, la incertidumbre se debe a que el resultado en cuestión aún no está determinado (por ejemplo, es posible que no sepamos si lloverá mañana), mientras que en otros casos la incertidumbre se debe a que, aunque el resultado ya se ha determinado, no nos damos cuenta de ello ( por ejemplo, es posible que no sepamos si aprobamos un examen en particular).
La probabilidad es un lenguaje matemático usado para discutir eventos inciertos y la probabilidad juega un papel clave en las estadísticas. Cualquier medición o esfuerzo de recopilación de datos está sujeto a una serie de fuentes de variación. Con esto queremos decir que si se repitiera la misma medida, la respuesta probablemente cambiaría. Los estadísticos intentan comprender y controlar (cuando sea posible) las fuentes de variación en cualquier situación.
-----
La estadística es una rama de las matemáticas que se ocupa de la recopilación de datos , organización, análisis, interpretación y presentación. Al aplicar estadísticas a, por ejemplo, un problema científico, industrial o social, es convencional comenzar con una población estadística o un proceso de modelo estadístico a estudiar. Las poblaciones pueden ser temas diversos como "todas las personas que viven en un país" o "cada átomo que compone un cristal". La estadística se ocupa de todos los aspectos de los datos, incluida la planificación de la recopilación de datos en términos del diseño de encuestas y experimentos.
Cuando no se pueden recopilar datos del censo , los estadísticos recopilan datos mediante el desarrollo de diseños de experimentos específicos y muestras de encuestas . El muestreo representativo asegura que las inferencias y conclusiones puedan extenderse razonablemente de la muestra a la población en general. Un estudio experimental implica tomar mediciones del sistema en estudio, manipular el sistema y luego tomar mediciones adicionales utilizando el mismo procedimiento para determinar si la manipulación ha modificado los valores de las mediciones. En contraste, un estudio observacional no implica manipulación experimental.
---
Estadísticas es una colección de herramientas que puede utilizar para obtener respuestas a preguntas importantes sobre datos.
Puede usar métodos estadísticos descriptivos para transformar las observaciones sin procesar en información que pueda comprender y compartir. Puede utilizar métodos estadísticos inferenciales para razonar desde pequeñas muestras de datos hasta dominios completos.
---
Estadística es una palabra con dos significados. La mayoría de las personas están conscientes de la definición mundana de estadística como una recopilación de datos, como las estadísticas de béisbol o estadísticas que el gobierno recopila durante un censo. Hay poca conciencia de la definición más importante y más amplia de las estadísticas como una rama de los académicos, algunos dirían que es una rama de las matemáticas, por lo que para gran parte de la sociedad el hecho de hacer estadísticas es simplemente la recopilación y presentación de datos con fines informativos. o fines persuasivos.
La definición más amplia de estadística es una disciplina relacionada con el análisis de datos y la toma de decisiones basada en datos. También se puede utilizar para detectar tendencias o aislar causas. Las estadísticas se basan en un sólido edificio de teoremas matemáticos probados a través de leyes de lógica irrefutables. En teoría, las estadísticas funcionan todo el tiempo. Discutiremos los problemas inherentes con las estadísticas a su debido tiempo, porque, como mucha gente sabe, las estadísticas pueden ser engañosas.
El análisis estadístico y las decisiones se basan en las nociones de probabilidad, el estudio de medir cómo la probabilidad afecta ciertos eventos o resultados. Uno de los problemas de probabilidad más simples es lanzar una moneda. La probabilidad de obtener "caras" es la mitad, o el cincuenta por ciento. Este es un ejemplo de una probabilidad teórica, y todas las probabilidades teóricas están relacionadas con encontrar formas de contar todos los resultados posibles de algún experimento hipotético. En el siglo xvi se pensó un poco en este tipo de problemas, pero se puede decir que las teorías modernas de probabilidad se remontan a una correspondencia entre Pierre de Fermat y Blaise Pascal en 1654.
El siguiente gran avance se produjo alrededor de 1809 cuando Karl Friederich Gauss derivó la distribución normal , conocida popularmente como la curva de campana . Esta curva de campana es una firma de aleatoriedad cuando la mayoría de los datos se agrupan simétricamente en torno a un centro y se producen cada vez menos datos a medida que se mueve hacia un extremo en ambos lados. Esta construcción puede usarse para medir las probabilidades de que los datos se produzcan dentro o fuera de rangos específicos. Por ejemplo, la definición clínica de genio basada en las puntuaciones de IQ son aquellas personas que se encuentran en el uno por ciento superior de IQ. En la curva de campana, un coeficiente intelectual de 100 es promedio, en el centro, mientras que el límite del uno por ciento superior se encuentra en un coeficiente intelectual de 135 o superior.
Las estadísticas tal como las conocemos y usamos se desarrollaron a partir de 1893 y continúan refinándose hasta nuestros días. Es un área temática muy grande que se aplica principalmente en formas prácticas a datos para los cuales no existe una probabilidad teórica. Por ejemplo, las empresas farmacéuticas deben probar nuevos medicamentos antes de poder comercializarlos. A los grupos de personas se les administran estos medicamentos y se los compara con grupos similares que no toman estos medicamentos.
¿Cómo podemos predecir un resultado? No podemos, por lo que medimos el resultado y determinamos a través de métodos de estadísticas, basados en la probabilidad, si los resultados fueron significativos o no.
Se estudian dos formas de estadísticas a nivel elemental, es decir, nivel introductorio. El primero estudia la medida de un solo tipo de cantidad, conocida como una sola variable. Los ejemplos podrían incluir medir el número de defectos producidos por una línea de producción, medir la edad de los graduados del colegio o medir la presión arterial de personas en ciertos grupos de riesgo para la salud. Los resultados se comparan con un estándar establecido, y al usar la probabilidad, se mide la importancia, si la hay, de la diferencia entre el resultado experimental y un estándar establecido. Alternativamente, los resultados se utilizan para producir una estimación de rango para el grupo más grande del que provienen las muestras de datos. Verá este tipo de estadísticas en las encuestas de opinión con sus márgenes de error.
La otra forma común de estadísticas se refiere a la comparación de cómo una cantidad se ve afectada por otra, o si existe una diferencia entre cantidades similares. El análisis de la varianza, ANOVA, fue desarrollado por los cultivadores de semillas en la década de 1920 como una forma de determinar si ciertos híbridos de cultivos son significativamente diferentes de otros híbridos, pero ANOVA se usa ampliamente en estos días para todo tipo de datos. La comparación de dos variables medibles con números, por ejemplo, las tasas de criminalidad y los niveles educativos entre los estados, es el ámbito de la regresión lineal. Uno puede medir qué tan bien, si alguna, una variable se ve afectada por la otra, o una puede producir un gráfico que se ajuste mejor a los datos y que se pueda usar para hacer predicciones o detectar tendencias.
Las estadísticas se han utilizado mucho más extensamente en el mundo de los negocios desde el final de la Segunda Guerra Mundial. Un estadístico poco conocido llamado W. Edwards Deming fue enviado a Japón para ayudar a los japoneses a reconstruir su país. Les enseñó el valor de las estadísticas en el monitoreo de la calidad, además de establecer un conjunto de principios de gestión conocidos como Gestión de la calidad total (TQM). (Varios más hicieron cosas similares para los japoneses porque Deming es ahora el más famoso). Finalmente, los japoneses se volvieron muy competitivos y reconocidos por sus productos de calidad, y las ideas de Deming, que siempre incluían un papel para las estadísticas, se han extendido por todo el país y otros. .
Ahora para una explicación de la frase común, "mentir con estadísticas". La cita más famosa en estadísticas se atribuye al primer ministro inglés, Benjamin Disraeli, quien en 1871 declaró: "Hay tres tipos de mentiras: mentiras, malditas mentiras y estadísticas". Se refería claramente a la propensión de algunos políticos a distorsionar la información mediante distorsiones selectivas de los datos. Una de las distorsiones estadísticas más famosas en los días modernos fue el uso por parte de Procter & Gamble durante años de la línea de comercialización, "Cuatro de cada cinco dentistas recomiendan Crest". La broma que suplica esta línea es: "¿Con qué cinco dentistas hablaron?" Un año, dos estudiantes en la clase del autor fueron al corazón de P&G en Cincinnati y, al llamar a cincuenta dentistas, demostraron que esta afirmación era significativamente exagerada.
Es cierto que la información estadística se puede manipular de manera que distorsione la imagen. Los errores en los métodos de recopilación de datos estadísticos también pueden ser sutiles, pero pueden llevar a conclusiones engañosas. Un ejemplo reciente y famoso es la confusión de la noche electoral en la elección presidencial de 2000, y otro ejemplo famoso fue la declaración de los medios de que John Dewey derrotó a Harry S Truman en 1948. ¿Alguna vez escuchó hablar del presidente Dewey?
Aquí hay un punto importante: las estadísticas no mienten. Aparte de las personas que distorsionan deliberadamente la información por su presentación de datos, las estadísticas funcionan cada vez que se facturan, siempre que se sigan los supuestos subyacentes a los teoremas estadísticos. Cuando falla, generalmente se debe a que la muestra de datos recopilados no es lo suficientemente aleatoria, pero está sesgada de alguna manera.
Leer también: qué es estadística descriptiva, qué es estadística inferencial
Comentarios
Publicar un comentario