В исследовании рассматривается один из перспективных способов практического использования данных о семантическом потенциале текста на русском языке – специфическом интегральном показателе, отражающем меру его смысловой неопределенности с точки зрения автоматизированного анализатора. Оценивание данного показателя посредством формально-семантического анализа многозначной лексики применено в интересах разработки минимизированного алгоритма автоматической классификации русскоязычных текстов по признаку их функционально-стилевой отнесенности, что, в свою очередь, позволяет в перспективе обеспечить оптимизацию производительности и эффективности основных разновидностей автоматизированных систем обработки текстов – средств понимания естественного языка, поисковых роботов и каталогизаторов, а также систем машинного перевода.
все жанры