José Alejandro Reyes Ortiz, Beatriz Adriana González Beltrán, Mireya Tovar Vidal



El procesamiento automático de textos clínicos ha tomado relevancia en los últimos años, debido a que, diariamente, se genera una gran cantidad de información electrónica que no está estructurada. Este procesamiento puede apoyar a la toma de decisiones clínicas para establecer un tratamiento o realizar un diagnóstico. Este artículo presenta un enfoque de clasificación supervisada de reportes clínicos mediante el algoritmo de Máquinas de Soporte Vectorial (MSV). Se utiliza información lingüística de los textos, con la finalidad de apoyar el diagnóstico de cuatro tipos de cáncer: estómago, pulmonar, cáncer de pecho y cáncer de piel. Una evaluación de información lingüística como el uso de verbos, sustantivos y adjetivos fue desempeñada sobre el conjunto de reportes clínicos. Los resultados de la evaluación de nuestro enfoque son prometedores y proporcionan un referente como herramienta para el procesamiento de textos clínicos en apoyo a los diagnósticos clínicos.

Palabras Claves: Apoyo al diagnóstico de cáncer, características lingüísticas, clasificación de textos, procesamiento de lenguaje natural.



Automatic processing of clinical texts has become relevant in recent years, due to the large amount of electronic and unstructured data that is produced daily. This processing can support clinical decision making such as establishing a treatment or providing a diagnosis. This paper presents a supervised classification of clinical reports using the Support Vector Machine (SVM) algorithm and linguistic information from texts, in order to support the diagnosis of four types of cancer: digestive cancer, lung cancer, breast cancer and skin cancer. An evaluation of linguistic information such as the use of verbs, nouns and adjectives was performed. Evaluation results of our approach are promising and serve as a reference to the processing of clinical texts as support for clinical diagnoses.

Keywords: Cancer diagnosis support, linguistic features, natural language processing, text classification.

