27.09 Анализ данных (звезды)
Ошибка.
Попробуйте повторить позже
Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба.
Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиусом . Каждая звезда обязательно
принадлежит только одному из кластеров. Истинный центр кластера, или центроид, – это одна из звёзд на графике,
сумма расстояний от которой до всех остальных звёзд кластера минимальна. Под расстоянием понимается
расстояние Евклида между двумя точками
и
на плоскости, которое вычисляется по
формуле:
В файле A хранятся данные о звёздах двух кластеров, где для каждого кластера. В каждой строке записана
информация о расположении на карте одной звезды: сначала координата
, затем координата
. Значения даны в
условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает
1000.
В файле Б хранятся данные о звёздах трех кластеров, где для каждого кластера. Известно, что количество
звёзд не превышает 10 000. Структура хранения информации о звездах в файле Б аналогична файлу
А.
Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: —
среднее арифметическое абсцисс центров кластеров, и
– среднее арифметическое ординат центров
кластеров.
В ответе запишите четыре числа через пробел: сначала целую часть для файла А, затем
для файла
А, далее целую часть
для файла Б и
для файла Б.
Возможные данные одного из файлов иллюстрированы графиком.
Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.
Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в ,
перейдем в раздел «Вставка
Диаграммы
Точечная».
Диаграмма для файла А имеет вид:
Из нее видно, что все точки, чьи абсциссы больше 0, принадлежат одному кластеру, а абсциссы меньше 0 – другому.
Код программы для файла А:
f = open(’1A.txt’) n = f.readline() a = [[] for i in range(2)] for i in range(999): star = list(map(float, f.readline().replace(’,’,’.’).split())) if star[0] > 0: a[0].append(star) else: a[1].append(star) sum_x = sum_y = tx = ty = 0 for i in a: mn = 100000050000 for j in i: x1, y1 = j sm = 0 for k in i: x2, y2 = k sm += ((x2-x1)**2 + (y2-y1)**2)**0.5 if sm < mn: mn = sm tx, ty = x1, y1 sum_x += tx sum_y += ty print(int(sum_x / 2 * 10)) print(int(sum_y / 2 * 10))
Диаграмма для файла Б имеет вид:
Из нее видно, что все точки, чьи ординаты больше 0, принадлежать первому кластеру; точки, чьи ординаты находятся в интервале (-30; 0) – второму кластеру; остальные точки – третьему.
Код программы для файла Б:
f = open(’1B.txt’) n = f.readline() a = [[] for i in range(3)] for i in range(9998): star = list(map(float, f.readline().replace(’,’,’.’).split())) if star[1] > 0: a[0].append(star) elif star[1] > -30 and star[1] < 0: a[1].append(star) else: a[2].append(star) sum_x = sum_y = tx = ty = 0 for i in a: mn = 100000050000 for j in i: x1, y1 = j sm = 0 for k in i: x2, y2 = k sm += ((x2-x1)**2 + (y2-y1)**2)**0.5 if sm < mn: mn = sm tx, ty = x1, y1 sum_x += tx sum_y += ty print(int(sum_x / 3 * 10)) print(int(sum_y / 3 * 10))
Специальные программы

Программа
лояльности v2.0
Приглашай друзей в Школково и получай вознаграждение до 10%!

Крути рулетку
и выигрывай призы!
Крути рулетку и покупай курсы со скидкой, которая привязывается к вашему аккаунту.

Бесплатное онлайн-обучение
Для школьников из приграничных территорий России, проживающих в ДНР, ЛНР, Херсонской, Запорожской, Белгородской, Курской, Брянской областях и Крыму.

Налоговые вычеты
Узнай, как получить налоговый вычет при оплате обучения в «Школково».

Специальное предложение
для учителей
Бесплатный доступ к любому курсу подготовки к ЕГЭ, ОГЭ и олимпиадам от «Школково». Мы с вами делаем общее и важное дело, а потому для нас очень значимо быть чем-то полезными для учителей по всей России!

Вернём деньги за курс
за твою сотку на ЕГЭ
Сдать экзамен на сотку и получить обратно деньги за подготовку теперь вполне реально!