Тел.: +7(915)814-09-51 (WhatsApp)
E-mail:

Russian English
scientificjournal-foto2

Если Вы хотите напечататься в ближайшем номере, не откладывайте отправку заявки. Потратьте одну минуту, заполните и отправьте заявку в Редакцию.

Печатная версия журнала «Вестник науки и образования» выходит ежемесячно (ориентировочно 19 числа, ежемесячно уточняется). Следующая печатная версия журнала выйдет - 21.01.2025 г. Статьи принимаются до 17.01.2025 г.

В электронной официальной версии (Роскомназдор Эл № ФС77-58456) журнала Вы можете опубликовать статью моментально после одобрения её публикации. Как отдельный электронный журнал, журнал выходит каждую пятницу. Следующая электронная версия журнала выйдет - 10.01.2025 г. Статьи принимаются до 09.01.2025 г.



Раджабова Н.Ш., Махмудов М.Р.

Email: Radzhabova678@scientifictext.ru

Раджабова Наима Шамильевна – кандидат физико-математических наук, доцент;

Махмудов Магомед Риадович – магистрант,

кафедра дискретной математики и информатики,

Дагестанский государственный университет,

 г. Махачкала

Аннотация: в данной работе исследуется актуальная проблема увеличения разметочных данных путём использования кластеризации. При широкой востребованности кластеризацииозникает необходимость в программных системах, предоставляющих возможности как для анализа работы алгоритмов, так и данных, а также для удобного отображения результатов.

Разметочные данные – конечное множество объектов в виде вектора параметров, описывающих объект. В контексте данной работы процесс векторизации производится на строковых объектах, необходимых для кластерного анализа.

Ключевые слова: машинное обучение, кластеризация, метод к-средних, кластерный анализ.

CLUSTERING OF UNSTRUCTURED TEXT BY ADVANCE OF PRESCRIBED CATEGORIES

Radzhabova N.Sh., Маkhмudov М.R.

Radzhabova Naima Shamilyevna – Candidate of Physical and Mathematical Science, Associate Professor;

Мakhмudоv Маgоmеd Riadovich – Undergraduate,

DEPARTMENT OF THE DISCRETE MATHEMATICS AND COMPUTER SCIENCE,

DAGESTAN STATE UNIVERSITY,

MAKHACHKALA

Abstract: in this paper, we study the urgent problem of increasing markup data by using clustering. With the wide demand for clustering, there is a need for software systems that provide opportunities for both analyzing the operation of algorithms and data, as well as for convenient display of results.

Markup data is a finite set of objects in the form of a vector of parameters describing the object. In the context of this work, the vectorization process is performed on string objects required for cluster analysis.

Keywords: machine learning, clustering, k-means method, cluster analysis.

Список литературы / References

  1. Хранение данных: вендоры, объемы данных, прогнозы. [Электронный ресурс]. Режим доступа: https://www.crn.ru/news/detail.php?ID=124815/ (дата обращения: 25.11.2019).
  2. Обзор алгоритмов кластеризации данных. [Электронный ресурс]. Режим доступа: https://habr.com/ru/post/101338/ (дата обращения: 1.12. 2019).

Ссылка для цитирования данной статьи

scientificjournal-copyright    

Электронная версия. Раджабова Н.Ш., Махмудов М.Р. КЛАСТЕРИЗАЦИЯ НЕСТРУКТУРИРОВАННОГО ТЕКСТА ПО ЗАРАНЕЕ ЗАДАННЫМ КАТЕГОРИЯМ // Вестник науки и образования №24(78), 2019. [Электронныйресурс].URL: http://scientificjournal.ru/images/PDF/2019/VNO-78/klasterizatsiya.pdf (Дата обращения:ХХ.ХХ.201Х).

Печатная версия. Раджабова Н.Ш., Махмудов М.Р. КЛАСТЕРИЗАЦИЯ НЕСТРУКТУРИРОВАННОГО ТЕКСТА ПО ЗАРАНЕЕ ЗАДАННЫМ КАТЕГОРИЯМ// Вестник науки и образования № 24(78), 2019, C. {см. журнал}.

scientificjournal

Поделитесь данной статьей, повысьте свой научный статус в социальных сетях

      Tweet   
  
  

Кто на сайте

Сейчас на сайте 269 гостей и нет пользователей

Импакт-фактор

Вконтакте

REGBAN