ОПТИМАЛЬНИЙ АЛГОРИТМ ЛІНГВІСТИЧНОЇ ІНДЕКСАЦІЇ

Автор(и)

  • Людмила Власюк Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» https://orcid.org/0000-0003-1020-0076
  • Ольга Демиденко Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» https://orcid.org/0000-0002-0643-5510

DOI:

https://doi.org/10.32782/folium/2025.6.6

Ключові слова:

лінгвістична індексація, семантика та синтаксис, порівняльний аналіз, мовна система, прикладна лінгвістика та корпус, структура речень, медіатекст

Анотація

Однією з ключових особливостей розвитку лінгвістики у ХХІ столітті є поява великих обсягів документів, публікацій та інших джерел інформації, які потребують сортування та подальшої уніфікації. Саме на цей період припадає поява перших інформаційно-пошукових систем.На перших етапах такий пошук здійснювався виключно вручну, проте стрімкий розвиток комп’ютерної індустрії та, відповідно, автоматизація всіх процесів значно сприяли оцифруванню текстового формату інформації і, як наслідок, розвитку автоматизованих інформаційно-пошукових систем. У статті представлено всебічний огляд явища лінгвістичної індексації, включаючи поточні проблеми, які виникають в результаті неструктурованих текстових даних в цифрову епоху. Підкреслюючи необхідність вдосконалення процесу пошуку інформації, в статті особливу увагу приділено питанню низької ефективності існуючих систем аналізу інформації, головним чином через неконтрольоване інформаційне перевантаження. Для досягнення основної мети цієї статті автори також надають детальний огляд наявних систем автоматичного аналізу мови з метою виявлення їхніх основних особливостей, функцій та потенційних недоліків, які потребують подальшого вирішення.Розробляючи методологію оптимального алгоритму лінгвістичної індексації, автори ретельно аналізують та інтегрують усі рівні мовного аналізу: морфологічний, синтаксичний та семантичний. Автори створюють структурований, комплексний, багатоетапний підхід з метою підвищення якості автоматизованого аналізу тексту, який включає в себе граматичний розбір, морфологічне тегування, аналіз синтаксично-семантичних залежностей та семантичне моделювання. Результати дослідження свідчать, що такий підхід підвищує точність аналізу інформації та сприяє більш ефективному та точному структуруванню інформаційної екосистеми текстів.

Посилання

Corazza, E. (2004). Reflecting the Mind: Indexicality and Quasi-Indexicality. Oxford : Oxford University Press.

Giorgi Alessandra. (2010). About the Speaker: Towards a Syntax of Indexicality. New York: Oxford University Press.

Steinbach, M. A. (2011). Comparison of Document Clustering Techniques. Minnesota : Minnesota Publishing.

Ticher, S., & Mejer, M. (2009). Methods for analyzing text and discourse. Oxford : Oxford University Press.

Лобановська, І.Г. (2011). Індексування документів ключовими словами. Київ: Нілан-ЛТД.

Сухий, О.Л., Міленін, В.М., & Тарадайнік, В.М. (2005). Алгоритми пошуку в інформаційних системах. Київ.

##submission.downloads##

Опубліковано

2025-05-26

Номер

Розділ

Статті