скачать книгу бесплатно
Класс (Class) – это термин из набора перечисленных целевых значений меток. Например, в модели бинарной классификации, обнаруживающей спам-рассылку, существует два класса – это спам и не спам. В многоклассовой модели классификации, которая идентифицирует породы собак, классами будут пудель, бигль, мопс и так далее[412 - Class [Электронный ресурс] https://www.primeclasses.in URL: https://www.primeclasses.in/glossary/data-science-course/machine-learning/class (дата обращения: 02.05.2023)].
Класс большинства (Majority class) – это метка в наборе данных с несбалансированным классом. Несбалансированные данные относятся к случаям, когда количество наблюдений в классе распределено неравномерно, и часто существует основной класс -класс большинства, который имеет гораздо больший процент набора данных, и второстепенные классы, в которых недостаточно примеров[413 - Majority class [Электронный ресурс] https://towardsdatascience.com URL: https://towardsdatascience.com/how-to-handle-imbalance-data-and-small-training-sets-in-ml-989f8053531d (дата обращения: 07.07.2022)].
Класс меньшинства (Minority class) – это метка в несбалансированном по классам наборе данных. Например, учитывая набор данных, содержащий 99% ярлыков, не относящихся к спаму, и 1% ярлыков для спама, ярлыки для спама относятся к классу меньшинства в наборе данных с несбалансированным классом[414 - Класс меньшинства [Электронный ресурс] https://docs.microsoft.com URL: https://docs.microsoft.com/ru-ru/azure/open-datasets/dataset-mnist?tabs=azureml-opendatasets (дата обращения: 07.07.2022)].
Класс сложности NP (недетерминированное полиномиальное время) (NP) – в теории вычислительной сложности – это класс, используемый для классификации проблем принятия решений. NP – это множество проблем решения, для которых экземпляры проблемы, где ответ «да», имеют доказательства, проверяемые за полиномиальное время с помощью детерминированной машины Тьюринга[415 - NP [Электронный ресурс] https://wiki2.org URL: https://wiki2.org/en/NP_(complexity) (дата обращения: 03.03.2022)].
Классификация (Classification). В задачах классификации используется алгоритм для точного распределения тестовых данных по определенным категориям, например, при отделении яблок от апельсинов. Или, в реальном мире, алгоритмы обучения с учителем можно использовать для классификации спама в отдельной папке из вашего почтового ящика. Линейные классификаторы, машины опорных векторов, деревья решений и случайный лес – все это распространенные типы алгоритмов классификации[416 - Classification [Электронный ресурс] https://www.ibm.com URL: https://www.ibm.com/cloud/blog/supervised-vs-unsupervised-learning (дата обращения: 03.05.2023)].
Кластеризация (Clustering) – это метод интеллектуального анализа данных для группировки неразмеченных данных на основе их сходства или различия. Например, алгоритмы кластеризации K-средних распределяют сходные точки данных по группам, где значение K представляет размер группировки и степень детализации. Этот метод полезен для сегментации рынка, сжатия изображений и т.д.[417 - Clustering [Электронный ресурс] https://medium.com URL: https://medium.com/@venkatesh.t.16072001/difference-between-supervised-and-unsupervised-learning-algorithm-8bda6352489f (дата обращения: 03.05.2023)].
Кластеризация временных данных (Temporal data clustering) – это разделение неразмеченного набора временных данных на группы или кластеры, где все последовательности, сгруппированные в одном кластере, должны быть согласованными или однородными. Хотя для кластеризации различных типов временных данных были разработаны различные алгоритмы, все они пытаются модифицировать существующие алгоритмы кластеризации для обработки временной информации[418 - Temporal data clustering [Электронный ресурс] www.sciencedirect.com URL: https://www.sciencedirect.com/topics/computer-science/temporal-data (дата обращения: 07.07.2022)].
Кластеризация на основе центроида (Centroid-based clustering) – это категория алгоритмов кластеризации, которые организуют данные в неиерархические кластеры. Алгоритм k средних (k-means) – это наиболее широко используемый алгоритм кластеризации на основе центроидов, один из алгоритмов машинного обучения, решающий задачу кластеризации[419 - Centroid-based clustering [Электронный ресурс] https://developers.google.com URL: https://developers.google.com/machine-learning/glossary#centroid-based-clustering (дата обращения: 03.05.2023)].
Кластерный анализ (Cluster analysis) – это тип обучения без учителя, используемый для исследовательского анализа данных для поиска скрытых закономерностей или группировки в данных; кластеры моделируются с мерой сходства, определяемой такими метриками, как евклидово или вероятностное расстояние.
Ключевые точки (Keypoints) – это координаты определенных объектов на изображении. Например, для модели распознавания изображений в задачах компьютерного зрения, такие как оценка позы человека, обнаружение лиц и распознавание эмоций, обычно работают с ключевыми точками на изображении[420 - Keypoints [Электронный ресурс] https://albumentations.ai URL: https://albumentations.ai/docs/getting_started/keypoints_augmentation/ (дата обращения: 07.07.2022)]
Вы ознакомились с фрагментом книги.
Для бесплатного чтения открыта только часть текста.
Приобретайте полный текст книги у нашего партнера: