Método de classificação com rejeição por indecisão e observação atípicas.
dc.contributor.author | Pires, Ana M. | |
dc.contributor.author | Santos-Pereira, Carla | |
dc.date.accessioned | 2014-05-30T13:48:57Z | |
dc.date.available | 2014-05-30T13:48:57Z | |
dc.date.issued | 2004 | |
dc.description.abstract | Num problema típico de classificação, o objectivo é criar uma regra de decisão que permita afectar um objecto, de origem desconhecida, a uma de c classes pré-definidas, a partir dos valores observados de um conjunto de p variáveis numa amostra de treino. Na impossibilidade de separação absoluta ou numa situação de dúvida (quando as funções de decisão assumem valores muito idênticos ou a quando da existência de observações atípicas-outliers) poderá ser preferívelnão classificar do que optar por classificar com uma probabilidade de erro elevada. Nesse caso introduz-se uma opção de rejeição, por indecisão ou por existência de observações atípicas pelo que de uma forma genérica teremos um classificador em c + 2 classes. Neste trabalho apresenta-se um método de classificação em c + 2 classes com especial realce no tratamento das observações atípicas. Propõe-se uma nova regra de rejeição de outliers, RRO, baseada em análise de clusters e utilização de distâncias tipo Mahalanobis com estimadores clássicos e robustos que demonstrou ter bom comportamento em simulações de dados normais e não normais, com e sem outliers. Como método de clustering utilizaram-se o k-means, pam (partitioning around methods) e mclust (model based clustering) e para estimadores do vector de médias e de matriz de covariâncias o RMCD25 (Reweight Mininum Covariance Determinant com um ponto de rotura aproximado de 25%), os estimadores clássicos e o estimador OGK de Maronna e Zamar. O método apresentado é ilustrado com dois exemplos práticos. | pt |
dc.description.abstract | The aim of a supervised classification problem is to build a decision rule according to which a new object is assigned to one of a set of c predefined classes on the basis of an observed p-dimensional feature vector (tranning sample). In the absence of absolute separation or when there is some uncertainty it may be better not to classify. In that case we can introduce a rejection option either in cases of dobt or of atypical observations (outliers). This work presents a method for classifying a new object into one of c + 2 Classes. Special emphasis is given to the treatment of atypical observations: we propose a new outlier rejection rule, based on clustering analysis and mahalanobis type distance with classical and robust estimators, wich performed well in a simulation study with normal and non-normal data, with and without outliers. We consideredthree clustering methods: k-means, pam and mclust; and three pairs of location-scatter estimators: classical, Reweighted Minimum Covariance Determinant with an approximate 25% breakdown point (RMCD25) and Orthogonalised Gnanadesikan-Kettenring (OGK) of Maronna and Zamar. The method is illustrated with two applications. | pt |
dc.identifier.citation | Santos-Pereira, C., & Pires, A.M. (2004). Método de classificação com rejeição por indecisão e observação atípicas. In Rodrigues, P. M. M., Rebelo, E. L. & Rosado, F. (ed.) Estatística com acaso e necessidade: Actas do XI Congresso Anual da Sociedade Portuguesa de Estatística, Faro, 24-27 Set. (pp. 595-604). | pt |
dc.identifier.uri | http://hdl.handle.net/11328/754 | |
dc.language.iso | por | pt |
dc.rights | open access | pt |
dc.subject | Análise multivariada | pt |
dc.subject | Análise discriminante | pt |
dc.subject | Classificação supervisionada | pt |
dc.subject | Região de indecisão | pt |
dc.subject | Detecção outliers | pt |
dc.subject | Estimadores robustos | pt |
dc.subject | Métodos de clustering | pt |
dc.subject | Modelos de misturas | pt |
dc.subject | Multivariate analysis | pt |
dc.subject | Discriminant analysis | pt |
dc.subject | Supervised classification | pt |
dc.subject | Region of doubt | pt |
dc.subject | Detection of outliers | pt |
dc.subject | Robust estimators | pt |
dc.subject | Clustering methods | pt |
dc.subject | Mixture models | pt |
dc.title | Método de classificação com rejeição por indecisão e observação atípicas. | pt |
dc.type | conferenceObject | pt |
dspace.entity.type | Publication | en |
person.affiliation.name | REMIT | |
person.familyName | Santos-Pereira | |
person.givenName | Carla | |
person.identifier.ciencia-id | DD11-7CE2-337F | |
person.identifier.orcid | 0000-0002-3545-6265 | |
person.identifier.rid | G-9695-2016 | |
person.identifier.scopus-author-id | 12794047600 | |
relation.isAuthorOfPublication | 646900de-975c-4251-8c3f-476dfee276b5 | |
relation.isAuthorOfPublication.latestForDiscovery | 646900de-975c-4251-8c3f-476dfee276b5 |
Ficheiros
Principais
1 - 1 de 1