De la Recolección de Datos al Análisis de Sentimientos: Un Enfoque Integral para Clasificar Noticias Económicas

Ponente(s): Sergio Valles Quintanilla
En esta investigación, se generó un conjunto de datos aplicando técnicas de web scraping a un sitio de noticias de economía. Posteriormente, se realizó un análisis de sentimientos utilizando la librería NLTK para identificar la polaridad y el sentimiento asociado a cada artículo. El preprocesamiento incluyó la eliminación de stopwords, lematización y tokenización. Con los datos de sentimientos, se aplicó el algoritmo de K-means para clasificar las noticias en diferentes temáticas, como criptomonedas, commodities y coronavirus. Para mejorar la interpretación y visualización de los resultados, se utilizó el Análisis de Componentes Principales (PCA) para reducir la dimensionalidad del conjunto de datos. Los resultados muestran una clasificación coherente de las noticias según sus temáticas, facilitando el análisis y comprensión del contenido económico. Esta metodología combina técnicas de minería de datos y aprendizaje automático, demostrando su eficacia en la categorización y análisis de grandes volúmenes de información textual.