27.09 Анализ данных (звезды)
Ошибка.
Попробуйте повторить позже
Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба.
Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиусом . Каждая звезда обязательно
принадлежит только одному из кластеров.
Истинный центр кластера, или центроид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера минимальна.
Под расстоянием понимается расстояние Евклида между двумя точками и
на плоскости,
которое вычисляется по формуле:
В файле A хранятся данные о звёздах двух кластеров, где у верхнего кластера и
у нижнего
кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата
,
затем координата
. Значения даны в условных единицах, которые представлены вещественными числами. Известно,
что количество звёзд не превышает 3215.
В файле Б хранятся данные о звёздах трёх кластеров, где у левого кластера,
у верхнего кластера и
у правого кластера. Известно, что количество звёзд не превышает 15682. Структура хранения информации о
звездах в файле Б аналогична файлу А.
Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: —
среднее арифметическое абсцисс центров кластеров, и
– среднее арифметическое ординат центров
кластеров.
В ответе запишите четыре числа через пробел: сначала целую часть произведения для файла А и
для файла А, далее целую часть произведения
для файла Б и
для файла
Б.
Возможные данные одного из файлов иллюстрированы графиком.
Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.
Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в ,
перейдем в раздел «Вставка
Диаграммы
Точечная».
Диаграмма для файла А имеет вид:
Нанесём на график прямую: :
Точки, которые удовлетворяют неравенству: принадлежат верхнему(первому) кластеру. Все остальные -
нижнему(второму) кластеру.
Код программы для файла А:
f = open(’27_3_A.txt’) n = f.readline() clusters = [[] for i in range(2)] for i in range(3215): star = list(map(float, f.readline().replace(’,’, ’.’).split())) x,y = star[0],star[1] if y >= 8 + x: clusters[0].append(star) else: clusters[1].append(star) sum_x = sum_y = 0 for i in clusters: tx = ty = 0 mn = 100000050000 for j in i: x1, y1 = j sm = 0 for k in i: x2, y2 = k sm += ((x2-x1)**2 + (y2-y1)**2)**0.5 if sm < mn: mn = sm tx, ty = x1, y1 sum_x += tx sum_y += ty print(int(sum_x / len(clusters) * 250)) print(int(sum_y / len(clusters) * 250))
Диаграмма для файла Б имеет вид:
Нанесём на график две прямые: и
:
Теперь можем провести определить какие звезды к каким кластерам относятся.
Если точка находится в пересечении неравенств: и
, то данная точка относится к верхнему
(первому) кластеру.
Если точка находится в пересечении неравенств: и
, то данная точка относится к левому
(второму) кластеру.
Если точка находится в пересечении неравенств: и
, то данная точка относится к правому
(третьему) кластеру.
Код программы для файла Б:
f = open(’27_3_B.txt’) n = f.readline() clusters = [[] for i in range(3)] for i in range(15682): star = list(map(float, f.readline().replace(’,’, ’.’).split())) x, y = star[0], star[1] if y >= 7 + x and y >= -6 - x: clusters[0].append(star) elif y >= 7 + x and y <= -6 - x: clusters[1].append(star) elif y <= 7 + x and y >= -6 - x: clusters[2].append(star) sum_x = sum_y = 0 for i in clusters: tx = ty = 0 mn = 100000050000 for j in i: x1, y1 = j sm = 0 for k in i: x2, y2 = k sm += ((x2 - x1) ** 2 + (y2 - y1) ** 2) ** 0.5 if sm < mn: mn = sm tx, ty = x1, y1 sum_x += tx sum_y += ty print(int(sum_x / len(clusters) * 300)) print(int(sum_y / len(clusters) * 300))
Специальные программы

Программа
лояльности v2.0
Приглашай друзей в Школково и получай вознаграждение до 10%!

Крути рулетку
и выигрывай призы!
Крути рулетку и покупай курсы со скидкой, которая привязывается к вашему аккаунту.

Бесплатное онлайн-обучение
Для школьников из приграничных территорий России, проживающих в ДНР, ЛНР, Херсонской, Запорожской, Белгородской, Курской, Брянской областях и Крыму.

Налоговые вычеты
Узнай, как получить налоговый вычет при оплате обучения в «Школково».

Специальное предложение
для учителей
Бесплатный доступ к любому курсу подготовки к ЕГЭ, ОГЭ и олимпиадам от «Школково». Мы с вами делаем общее и важное дело, а потому для нас очень значимо быть чем-то полезными для учителей по всей России!

Вернём деньги за курс
за твою сотку на ЕГЭ
Сдать экзамен на сотку и получить обратно деньги за подготовку теперь вполне реально!