Раджабова Н.Ш., Махмудов М.Р.
Email: Radzhabova678@scientifictext.ru
Раджабова Наима Шамильевна – кандидат физико-математических наук, доцент;
Махмудов Магомед Риадович – магистрант,
кафедра дискретной математики и информатики,
Дагестанский государственный университет,
г. Махачкала
Аннотация: в данной работе исследуется актуальная проблема увеличения разметочных данных путём использования кластеризации. При широкой востребованности кластеризацииозникает необходимость в программных системах, предоставляющих возможности как для анализа работы алгоритмов, так и данных, а также для удобного отображения результатов.
Разметочные данные – конечное множество объектов в виде вектора параметров, описывающих объект. В контексте данной работы процесс векторизации производится на строковых объектах, необходимых для кластерного анализа.
Ключевые слова: машинное обучение, кластеризация, метод к-средних, кластерный анализ.
CLUSTERING OF UNSTRUCTURED TEXT BY ADVANCE OF PRESCRIBED CATEGORIES
Radzhabova N.Sh., Маkhмudov М.R.
Radzhabova Naima Shamilyevna – Candidate of Physical and Mathematical Science, Associate Professor;
Мakhмudоv Маgоmеd Riadovich – Undergraduate,
DEPARTMENT OF THE DISCRETE MATHEMATICS AND COMPUTER SCIENCE,
DAGESTAN STATE UNIVERSITY,
MAKHACHKALA
Abstract: in this paper, we study the urgent problem of increasing markup data by using clustering. With the wide demand for clustering, there is a need for software systems that provide opportunities for both analyzing the operation of algorithms and data, as well as for convenient display of results.
Markup data is a finite set of objects in the form of a vector of parameters describing the object. In the context of this work, the vectorization process is performed on string objects required for cluster analysis.
Keywords: machine learning, clustering, k-means method, cluster analysis.
Список литературы / References
- Хранение данных: вендоры, объемы данных, прогнозы. [Электронный ресурс]. Режим доступа: https://www.crn.ru/news/detail.php?ID=124815/ (дата обращения: 25.11.2019).
- Обзор алгоритмов кластеризации данных. [Электронный ресурс]. Режим доступа: https://habr.com/ru/post/101338/ (дата обращения: 1.12. 2019).
Ссылка для цитирования данной статьи
Тип лицензии на данную статью – CC BY 4.0. Это значит, что Вы можете свободно цитировать данную статью на любом носителе и в любом формате при указании авторства. |
||
Электронная версия. Раджабова Н.Ш., Махмудов М.Р. КЛАСТЕРИЗАЦИЯ НЕСТРУКТУРИРОВАННОГО ТЕКСТА ПО ЗАРАНЕЕ ЗАДАННЫМ КАТЕГОРИЯМ // Вестник науки и образования №24(78), 2019. [Электронныйресурс].URL: http://scientificjournal.ru/images/PDF/2019/VNO-78/klasterizatsiya.pdf (Дата обращения:ХХ.ХХ.201Х). Печатная версия. Раджабова Н.Ш., Махмудов М.Р. КЛАСТЕРИЗАЦИЯ НЕСТРУКТУРИРОВАННОГО ТЕКСТА ПО ЗАРАНЕЕ ЗАДАННЫМ КАТЕГОРИЯМ// Вестник науки и образования № 24(78), 2019, C. {см. журнал}. |
Поделитесь данной статьей, повысьте свой научный статус в социальных сетях
Tweet |