Critical values for 33 discordancy test variants for outliers in normal samples up to sizes 1000, and applications in quality control in Earth Sciences



Document title: Critical values for 33 discordancy test variants for outliers in normal samples up to sizes 1000, and applications in quality control in Earth Sciences
Journal: Revista mexicana de ciencias geológicas
Database: PERIÓDICA
System number: 000279427
ISSN: 1026-8774
Authors: 1

Institutions: 1Universidad Nacional Autónoma de México, Centro de Investigación en Energía, Temixco, Morelos. México
Year:
Season: Abr
Volumen: 25
Number: 1
Pages: 82-96
Country: México
Language: Inglés
Document type: Artículo
Approach: Analítico, teórico
Spanish abstract En dos trabajos anteriores (Verma and Quiroz-Ruiz, 2006, Rev. Mex. Cienc. Geol., 23, 133-161, 302-319) se han reportado valores críticos precisos para pruebas de discordancia en muestras normales univariadas n hasta 100. Sin embargo, para n >100, se dispone solamente de valores críticos para las pruebas: N1 para n hasta 147, N4k2 para n hasta 149, N6, N14 y N15 (para las últimas tres pruebas, valores críticos han sido reportados solamente para n=200, 500 y 1000). Esto demuestra claramente la necesidad de proponer nuevos valores críticos para n>100 mediante una metodología estadística apropiada. Por lo tanto, se reportan las modifi caciones del procedimiento de la simulación así como valores críticos o puntos porcentuales nuevos y más precisos y exactos (con cuatro hasta ocho puntos decimales; el error estándar de la media ~ 0.00000003 – 0.0039) para 15 pruebas de discordancia con 33 variantes, y cada una con siete niveles de signifi cancia α = 0.30, 0.20, 0.10, 0.05, 0.02, 0.01 y 0.005, para muestras normales con tamaño n hasta 1000, viz., nmin (1)100(5)200(10)500(20)1000. Por primera vez en la literatura, se reporta el error estándar de la media explícitamente y en forma individual para cada valor crítico. De igual manera, una nueva metodología que consiste en la aplicación de redes neuronales artifi ciales (ANN, por sus siglas en inglés) fue usada, por primera vez en la literatura publicada, para obtener ecuaciones de interpolación para las 33 variantes de las pruebas de discordancia y para cada uno de los siete niveles de signifi cancia. Cada ecuación fue ajustada con los 76 datos de las simulaciones para n desde 100 hasta 1,000 correspondientes a cada prueba y cada nivel de signifi cancia. Sumas de cuadrados de los residuales extremadamente pequeñas (~5.5 ×10-8 – 8.4 ×10-5; generalmente <10-5) fueron obtenidas en el ajuste de las ecuaciones por ANN para n =100 a 1,000
English abstract In two earlier papers (Verma and Quiroz-Ruiz, 2006, Rev. Mex. Cienc. Geol., 23, 133-161, 302-319) precise critical values for normal univariate samples of sizes n up to 100 have been reported. However, for greater n, critical values are available only for a few tests: N1 for n up to 147, N4k2 for n up to 149, N6, N14 and N15 (for the latter three tests, critical values were reported for only n=200, 500, and 1000). This clearly demonstrates the need for proposing new critical values for n>100 through an adequate statistical methodology. Therefore, modifi cations of our earlier simulation procedure as well as new, precise, and accurate critical values or percentage points (with four to eight decimal places; average standard error of the mean ~0.00000003–0.0039) of 15 discordancy tests with 33 test variants, and each with seven signifi cance levels α = 0.30, 0.20, 0.10, 0.05, 0.02, 0.01, and 0.005, for normal samples of sizes n up to 1000, viz., nmin (1)100(5)200(10)500(20)1000, are reported. For the fi rst time in the literature, the standard error of the mean is also reported explicitly and individually for each critical value. Similarly, a new methodology involving artifi cial neural network (ANN) was used, for the fi rst time in published literature, to obtain interpolation equations for all 33 discordancy test variants and for each of the seven signifi cance levels. Each equation was fi tted using 76 simulated data for n from 100 to 1000 for a given test and signifi cance level. Extremely small sums of squared residuals (~5.5 ×10-8 – 8.4 ×10-5; generally <10-5) in the ANN equations fi tted for n=100 to 1,000 were obtained
Disciplines: Matemáticas
Keyword: Matemáticas aplicadas,
Redes neuronales artificiales,
Estadística,
Simulación de Montecarlo,
Desviación estándar,
Hidrocarburos,
Petróleo
Keyword: Mathematics,
Applied mathematics,
Artificial neural networks,
Statistics,
Monte Carlo simulation,
Standard deviation,
Hydrocarbons,
Petroleum
Full text: Texto completo (Ver PDF)