PECULIARITIESS OF LITERARY GENRE CLASSIFICATION USING LARGE LANGUAGE MODELS
DOI:
https://doi.org/10.32782/folium/2025.6.19Keywords:
genre classification, large language models, genre parameterization, automated text analysis, genre ontologiesAbstract
The article examines the historical context of genre classification, the parameterization of genres, and their role in structuring literary works. The experience of applying automated parameterization in the fields of films (Netflix) and music (Spotify, Apple Music) is analyzed, demonstrating how it enables personalized user experiences. Similar methods are used in the literary sector, particularly on Amazon, where genre parameterization aids in book sales and recommendations. In scientific literature, genre classification also plays a key role in knowledge systematization, contributing to more efficient search and analysis of academic works.One of the central issues addressed in the article is the role of large language models in genre classification. The study explores how these models can identify genre-specific features of texts by highlighting stylistic techniques and considering lexical and syntactic parameters. Particular attention is given to methods for assessing the accuracy of automated classification, as well as analyzing confusion matrices and evaluating model confidence. It was emphasized that integrating large language models with genre ontologies and refining adaptive algorithms could significantly enhance the quality of automated classification.The article also compares traditional and automated approaches to genre classification. Traditional methods rely on expert analysis and take into account the cultural and historical context of genres, providing deeper analytical insights but limiting scalability. Automated methods, on the other hand, allow for the rapid processing of large volumes of text but may overlook nuances and genre hybridity. The optimal approach is a combination of these methods, ensuring a balance between accuracy and interpretability.Among the key challenges in genre classification using large language models, the study highlights the ambiguity of genre boundaries, the impact of training data biases on model performance, and the difficulty of recognizing complex stylistic techniques. Suggested improvements include expanding training data corpora, integrating models with literary knowledge bases, implementing multi-level classification strategies, and enhancing the explainability of classification results.Thus, the article makes a significant contribution to research on automated genre classification, demonstrating both the advantages and limitations of large language models in this task.
References
Абрамчук, О.В. (23–24 березня 2016 р.). Жанри сучасної української літератури. Матеріали XLV Науково-технічної конференції ВНТУ. Вінниця, Україна. URL: http://conferences.vntu.edu.ua/index.php/all-hum/all-hum-2016/paper/view/108/.
Барабаш, С. (2011). Поняття “жанр” як теоретична категорія та чинник художньої специфіки творчості М. Козоріса. Науковий часопис НПУ ім. М. П. Драгоманова. Серія 8. Філологічні науки (мовознавство та літературознавство), 11, 42–46.
Бехта, І. А., & Марчук, О. В. (2021). Структурно-типологічна параметризація художнього текстопростору англомовного фентезі. Науковий вісник Міжнародного гуманітарного університету. Сер.: Філологія, 47, 17–21.
Вибір редакції Amazon: добірка наших книжок. (2025). URL: https://ridna-mova.com/vibir-redaktsii-amazon-dobirka-nashih-knigok.html.
Ворочек, О. Г., & Соловей, І. В. (2024). Використання мовних моделей штучного інтелекту для генерації публікацій у соціальних мережах. Технічна інженерія, 93, 128–134. DOI: https://doi.org/10.26642/ten-2024-1(93)-128-134.
Гоца, Н. М. (2009). Проблема визначення поняття “стиль” жанру роману та методи його аналізу. Філологічні трактати, 3–4, 32–42.
Гулик, Ю. В. (2023). Використання штучного інтелекту для аналізу статистичних профілів текстів. Науковий журнал Львівського державного університету безпеки життєдіяльності «Львівський філологічний часопис», 14, 29–35.
Жанри і жанрові процеси в історико-літературній перспективі. (2012). Кам’янець-Подільський : Аксіома.
Лозинська, Н. А. (2018). Феномен бестселера у сучасній видавничій справі: зарубіжний досвід та українські реалії. Лідери книжкового ринку: матеріали Підсумкової науково-практичної конференції ІІ туру Всеукраїнського конкурсу студентських наукових робіт із галузі знань «Журналістика». С. 1–53.
Самвидав на Amazon: Крок за кроком до публікації книги. (2025). URL: https://mindthegraph.com/blog/uk/%D1%81%D0%B0%D0%BC%D0%B2%D0%B8%D0%B4%D0%B0%D0%B2-%D0%BD%D0%B0-%D0%B0%D0%BC%D0%B0%D0%B7%D0%BE%D0%BD%D1%96.
Черниш, О. А. (2020). Теорія жанрів у сучасній лінгвістиці. Вчені записки ТНУ імені В. І. Вернадського. Серія: Філологія. Соціальні комунікації, 31, 70–75.
Apuk, V., & Nuci, K. P. (2021). Classification of Pedagogical Content Using Conventional Machine Learning and Deep Learning Models. https://doi.org/10.48550/arXiv.2101.07321.
Biswas, A., Dhabal, S., & Venkateswaran, P. (2023). Exploring Music Genre Classification: Algorithm Analysis and Deployment Architecture. https://doi.org/10.48550/arXiv.2309.04861.
Doulaty, M., Saz, O., & Raymond, W. M. (September 8–12, 2016). Automatic Genre and Show Identification of Broadcast Media. 17th Annual Conference of the International Speech Communication Association, Interspeech. San Francisco, USA. P. 2115–2119. https://doi.org/ 10.48550/arXiv.1606.03333
Garbacz, P. (2006). An Outline of a Formal Ontology of Genres. (August 5–8, 2006). Conference: Knowledge Science, Engineering and Management, First International Conference. Guilin, China. P. 151–163. DOI: 10.1007/11811220_14.
Karjus, A. (2024). Machine-assisted quantitizing designs: augmenting humanities and social sciences with artificial intelligence. https://doi.org/10.48550/arXiv.2309.14379.
Lepekhin, M., & Sharoff, S. (2022). Estimating Confidence of Predictions of Individual Classifiers and Their Ensembles for the Genre Classification Task. https://doi.org/10.48550/arXiv.2206.07427.
Martin, C., & Hood, D. (2024). The Use of Natural Language Processing in Literature Reviews. URL: https://insights.axtria.com/hubfs/thought-leadership-whitepapers/Axtria-Insights-White-Paper-The-Use-of-Natural-Language-Processing-in-Literature-Reviews.pdf
Mu, Y., Dong, C., Bontcheva, K., & Song, X. (2024). Large Language Models Offer an Alternative to the Traditional Approach of Topic Modelling. https://doi.org/10.48550/arXiv.2403.16248.
Netflix Help Center (2025). URL: https://help.netflix.com/en.
Schreiber, H. (2016). Genre Ontology Learning: Comparing Curated with Crowd- Sourced Folksonomies. (August 7–11, 2016). Proceedings of the 17th International Society for Music Information Retrieval Conference. New York City, USA. P. 400–406. URL: h t t p s : / / a r c h i v e s . i s m i r. n e t / i s m i r 2 0 1 6 / paper/000074.pdf.
Sobchuk, O., & Sela, A. (2023). Computational thematics: Comparing algorithms for clustering the genres of literary fiction. https://doi.org/10.48550/arXiv.2305.11251.