Classificação supervisionada com dúvidas: compromisso erro/rejeição.
Date
2001
Embargo
Authors
Advisor
Coadvisor
Journal Title
Journal ISSN
Volume Title
Publisher
Language
Portuguese
Alternative Title
Abstract
Num problema de classificação supervisionada, o objectivo é criar uma regra de decisão que permita afectar um objecto, de origem desconhecida, a uma de c classes (ou grupos) pré-definidas, a partir dos valores observados de um conjunto de p variáveis. Na impossiblidade de separação absoluta ou numa situação de indecisão (quando as funções de decisão assumem valores muito idênticos ou quando da existência de objectos muito diferentes dos restantes - observações atíticas), poderá ser preferível não classificar, introduzindo-se uma opção de rejeição, do que optar por uma decisão com probabilidade de erro elevada. Isto acontece, por exemplo, no diagnóstico médico. Consequentemente poderão ser criadas mais duas classes, uma de indecisão e outra de observações atípicas. Neste trabalho estuda-se uma solução para o problema da dúvida derivada da decisão, pela introdução de uma opção de rejeição, para as regras de classificação baseadas nas discriminantes linear, quadrática e logística. Consideram-se vários procedimentos para a estimação das taxas de erro e rejeição, em particular recorrendo-se à simulação. Para ilustrar estas metodologias serão apresentados dois exemplos.
The aim of a supervised classification procedure is to build a decision rule according to wich a new object is assigned to one of c predefined classeson the basis of an observed feature vector. in the absence of absolute separation or when there is some uncertainty it may be better not to classify (for example in medical diagnostic). This happens when the decisions are very similar or in the presence of outliers. In general the misclassification rate of a rule can be made arbiraily small when the object is rejected for exceptional handling. So, we can have nor c+2 classes, one of doubt and one of atypical observations. This work deals with the problem of doubt in the presence of uncertainty, by introducing a rejection pocion in the context of linear, quadratic and logistic discrimination. We consider several procedures, including simulation, for the estimation of the error and reject rates. To illustrate these methodologies two applications will be presented.
The aim of a supervised classification procedure is to build a decision rule according to wich a new object is assigned to one of c predefined classeson the basis of an observed feature vector. in the absence of absolute separation or when there is some uncertainty it may be better not to classify (for example in medical diagnostic). This happens when the decisions are very similar or in the presence of outliers. In general the misclassification rate of a rule can be made arbiraily small when the object is rejected for exceptional handling. So, we can have nor c+2 classes, one of doubt and one of atypical observations. This work deals with the problem of doubt in the presence of uncertainty, by introducing a rejection pocion in the context of linear, quadratic and logistic discrimination. We consider several procedures, including simulation, for the estimation of the error and reject rates. To illustrate these methodologies two applications will be presented.
Keywords
Reconhecimento de padrões, Compromisso erro/rejeição, Análise discriminante, Pattern recognition, Error/reject tradeoff, Discriminant analysis
Document Type
conferenceObject
Publisher Version
Dataset
Citation
Santos-Pereira, C., & Pires, A.M. (2001). Classificação supervisionada com dúvidas: compromisso erro/rejeição. In A estatística em movimento: Actas do VIII Congresso Anual da Sociedade Portuguesa de Estatística, Peniche, 4-7 Out. 2000 (pp. 313-322).
Identifiers
TID
Designation
Access Type
Open Access