Análise da complexidade computacional de problemas de estatística descritiva com entradas intervalares.

Loreto, Aline Brum

Use este identificador para citar ou linkar para este item: http://hdl.handle.net/11624/584

Autor(es):	Loreto, Aline Brum
Título:	Análise da complexidade computacional de problemas de estatística descritiva com entradas intervalares.
Data do documento:	2006
Resumo:	A Estatística é uma ferramenta indispensável em todos os campos científicos. A Estatística descritiva é usada para sintetizar dados. O principal problema desta área está relacionado aos valores de uma amostra, os quais geralmente possuem erros que ocorrem durante a obtenção dos dados. Um dos objetivos deste trabalho é apresentar uma forma de apresentação para os valores amostrais que considera os erros contidos nestes valores. Esta representação é realizada através de intervalos. A literatura mostra que foram realizadas pesquisas somente em problemas de calcular os valores intervalares das medidas de dispersão variância, covariância e coeficiente de correlação, que a utilização da computação intervalar na solução de problemas de medidas de dispersão intervalar sempre fornece solução com intervalos superestimados (intervalos com amplitude grande), e que ao procurar uma solução com intervalos de amplitude pequena (através da computação da imagem intervalar), o problema passa a pertencer a classe de problemas NP-Difícil. Com o objetivo principal de analisar a complexidade computacional dos problemas de computar os valores dos indicadores estatísticos descritivos com entradas intervalares, e realizar uma classificação quanto a classe de complexidade, a presente tese apresenta: i) definições intervalares de medidas de tendência central, medidas de dispersão e separatrizes; ii) investigação da complexidade de problemas das medidas de tendência central média, mediana e moda, das medidas de dispersão amplitude, variância, desvio padrão, coeficiente de variação, covariância, coeficiente de correlação e das separatrizes e iii) representação intervalar dos valores reais, de tal modo que garante a qualidade de aproximação nos intervalos solução calculado através da extensão intervalar. Primeiramente, apresentamos uma abordagem intervalar para os indicadores estatísticos e propomos algoritmos para a solução dos problemas de computar os intervalos de medidas de tendência central intervalar, dispersão intervalar e separatrizes intervalares. Tais algoritmos utilizam a aritmética intervalar definida por Moore, a extensão intervalar e foram projetados para serem executados em ambientes intervalares como IntLab e Maple Intervalar. Por meio da análise da complexidade computacional verificamos que os problemas de medidas de tendência central, dispersão e separatrizes, com entradas intervalares, pertencem à classe de problemas P. Este trabalho apresenta, portanto, algoritmos de tempo polinomial que calculam os intervalos dos indicadores estatísticos com entradas intervalares, e que retornam como solução intervalos com qualidade de aproximação. Os resultados obtidos no desenvolvimento do trabalho tornaram viável a computação da Estatística Descritiva Intervalar.
Resumo em outro idioma:	Statistics in a fundamental tool for all scientific areas. Descriptive Statistics are used to analyze data. The main problem in this area is related to sample values, which are typically error prone due to the experimental processes used to obtain these values. One of the aims of this thesis is to suggest a representation form to sample values that takes these errors into account by using intervals. There are already approaches to calculate values of dispersion, variance, covariance and correlation coefficient using intervals, but the interval computation of dispersion measures gives always overestimated intervals (with wide amplitude) as results. Moreover, if better solutions are needed, by using the interval image representation, calculating such measures turns out to be an NP-hard problem. The main aim of this thesis is to analyze the computational complexity of the descriptive statistics measures using intervals as input values. More concretely this work presents: i) definitions of central trend, dispersion and separatriz using intervals; ii) investigation of the complexity of problems related to the calculation of central trend measures mean, median and moda, of the dispersion measures amplitude, variance, standard deviation. variance coefficient, covariance, correlation coefficient and separatriz; and iii) interval representation of real values such that guarante the quality of the approximation in the result intervals calculated using interval extension does not occur. First, an interval approach to statistics measures is presented, and then algorithms to compute the above described measures are proposed. Such algorithms are based on the interval arithmetics defined by Moore, on interval extension, and were designed to execute in ambients like IntLab and Interval Maple. By analyzing the computational complexity of these algorithms, we conclude that all defined measures are in the P class of complexity. This means that there are polynomial time algorithms that calculate the resulting intervals of the main descriptive statistical measures with interval input values with quality of the approximation. The impact of this result is to make Interval Descriptive Statistics feasible.
Nota:	Inclui bibliografia.
Instituição:	Universidade Federal do Rio Grande do Sul
Curso/Programa:	Programa de Pós-Graduação em Computação
Tipo de obra:	Tese de Doutorado
Assunto:	Complexidade computacional Análise de intervalos (Matemática) Estatística
Orientador(es):	Ribeiro, Leila
Coorientador(es):	Toscani, Laira Vieira
Aparece nas coleções:	Programas de Pós-Graduação em Outras Instituições

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
AlineBrumLoreto.pdf		380.26 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item

Este item está licenciado sob uma Licença Creative Commons