Адрес страницы: https://psychlib.ru/resource/pdf/studwork/2021/TulyakovEV_2021/TulyakovEV_11.pdf
Описание
Туляков Е. В. Программа для семантического анализа текстов: Автореф. вып. квалификац. работы: Бакалавр. работа: Направление 02.03.03 "Математическое обеспечение и администрирование информационных систем". Профиль программы "Информационные системы и базы данных" / Моск. гос. психолого-пед. ун-т. — М., 2021. — 11 с. — URL: https://psychlib.ru/inc/absid.php?absid=402601.
Рубрики:
• Прочие отрасли знания → Информатика, вычислительная техника
• Прочие отрасли знания → Математика
• Прочие отрасли знания → Языкознание
Аннотация:
Одной из наиболее интересных областей знаний в сфере компьютерных наук является разработка методов, применяемых для анализа естественных языков. Специалистами в области анализа данных и компьютерной лингвистики было разработано достаточно большое количество алгоритмов и математических моделей, которые активно применяются для создания поисковых систем, сервисов машинного перевода, баз знаний и т. д. темой данной квалификационной работы является разработка программы для семантического анализа текстов. Данная работа состоит из введения, двух глав, описывающих теоретические аспекты проводимых исследований, а также третьей главы, посвящённой разработки программного продукта семантического анализа текстов на естественном языке. Введение описывает цель и задачи данной выпускной квалификационной работы, а также основания для выбора данной темы. В первой главе происходит сравнение и анализ математических моделей дистрибутивной (векторной) семантики. Рассматривается основополагающая гипотеза, стоящая за процессом выявления семантической схожести слов. Более подробно описывается модель Word2Wec и её преимущества над традиционными методами дистрибутивного анализа. Рассматривается метрика семантического сходства, а также пример визуализации векторного представления слов на плоскости.
Одной из наиболее интересных областей знаний в сфере компьютерных наук является разработка методов, применяемых для анализа естественных языков. Специалистами в области анализа данных и компьютерной лингвистики было разработано достаточно большое количество алгоритмов и математических моделей, которые активно применяются для создания поисковых систем, сервисов машинного перевода, баз знаний и т. д. темой данной квалификационной работы является разработка программы для семантического анализа текстов. Данная работа состоит из введения, двух глав, описывающих теоретические аспекты проводимых исследований, а также третьей главы, посвящённой разработки программного продукта семантического анализа текстов на естественном языке. Введение описывает цель и задачи данной выпускной квалификационной работы, а также основания для выбора данной темы. В первой главе происходит сравнение и анализ математических моделей дистрибутивной (векторной) семантики. Рассматривается основополагающая гипотеза, стоящая за процессом выявления семантической схожести слов. Более подробно описывается модель Word2Wec и её преимущества над традиционными методами дистрибутивного анализа. Рассматривается метрика семантического сходства, а также пример визуализации векторного представления слов на плоскости.
• Открыть карточку в Электронном каталоге: 402601