Тема 27. Программирование

27.09 Анализ данных (звезды)

Вспоминай формулы по каждой теме
Решай новые задачи каждый день
Вдумчиво разбирай решения
ШКОЛКОВО.
Готовиться с нами - ЛЕГКО!
Подтемы раздела программирование
Решаем задачи

Ошибка.
Попробуйте повторить позже

Задача 1#99575

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиусом R  . Каждая звезда обязательно принадлежит только одному из кластеров.

Истинный центр кластера, или центроид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера минимальна. Центроид не вычисляется для колец, он вычисляется только для кластеров, представляющих собой круг.

Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B(x2,y2)  на плоскости, которое вычисляется по формуле:

        ∘ --------------------
d(A, B) =  (x2 − x1)2 + (y2 − y1)2

В файле A хранятся данные о звёздах двух кластеров, где R = 1,5  для внутреннего кластера и R = 3,1  для внешнего кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x  , затем координата y  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 1245.

В файле Б хранятся данные о звёздах трёх кластеров, где R = 4,1  для двух внутренних кластеров и R = 17,1  для внешнего кластера. Известно, что количество звёзд не превышает 9414. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс центров кластеров, и Py  – среднее арифметическое ординат центров кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть произведения Px ⋅100  для файла А и Py ⋅100  для файла А, далее целую часть произведения Px ⋅100  для файла Б и Py ⋅100  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Внутренний кластер симметричен относительно оси Ox и Oy. Радиус внутреннего кластера равен 1.5, соответственно, та или иная звезда будет принадлежать данному кластеру если она удовлетворяет следующему неравенству окружности:  2   2
x + y  ≤ 2.25

Код программы для файла А:

f = open(’27_1_A.txt’)
n = f.readline()
cluster = []  # Создаём список для кластера
for i in range(1245):  # Считываем звёзды из файла
    star = list(map(float, f.readline().replace(’,’, ’.’).split()))
    if star[0] ** 2 + star[1] ** 2 <= 1.5**2:  # Звезда относится к внутреннему кластеру
        cluster.append(star)

tx = ty = 0
mn = 100000050000

for j in cluster:  # Перебор предполагаемого центроида
    x1, y1 = j
    sm = 0  # Суммарное расстояние
    for k in cluster:  # Перебор всех звёзд для вычисления суммарного расстояния
        x2, y2 = k
        sm += ((x2 - x1) ** 2 + (y2 - y1) ** 2) ** 0.5
    if sm < mn: # У текущей звезды расстояние до остальных звёзд меньше предыдущей
        mn = sm
        tx, ty = x1, y1 # Сохранение нового центроида

print(int(tx * 100))
print(int(ty * 100))

Диаграмма для файла Б имеет вид:

PIC

Определим подходящие уравнения окружностей, внутри которых лежат внутренние кластеры. Геометрические центры левого и правого кластеров находятся около точки (-7; 0) и (7; 0) соответственно, и для них можно выбрать радиус 4.5, не задевая внешний кластер. Получим следующие неравенства для внутренних кластеров:

      2   2     2
(x− 7) + y  ≤ 4.5  – для левого кластера

(x+ 7)2 + y2 ≤ 4.52  – для правого кластера

Код программы для файла Б:

f = open(’27_1_B.txt’)
n = f.readline()
clusters = [[] for i in range(2)]
for i in range(9414):
    star = list(map(float, f.readline().replace(’,’, ’.’).split()))
    if (star[0] - 7) ** 2 + star[1] ** 2 <= 4.5 ** 2:
        clusters[0].append(star)
    elif (star[0] + 7) ** 2 + star[1] ** 2 <= 4.5 ** 2:
        clusters[1].append(star)

sum_x = sum_y = 0
for i in clusters:
    tx = ty = 0
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2 - x1) ** 2 + (y2 - y1) ** 2) ** 0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / len(clusters) * 100))
print(int(sum_y / len(clusters) * 100))

Ответ: -8 -9 -5 -4

Ошибка.
Попробуйте повторить позже

Задача 2#99576

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиусом R  . Каждая звезда обязательно принадлежит только одному из кластеров.

Истинный центр кластера, или центроид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера минимальна.

Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B(x2,y2)  на плоскости, которое вычисляется по формуле:

d(A, B) = ∘ (x-−-x-)2 +-(y-−-y-)2
            2   1      2   1

В файле A хранятся данные о звёздах трёх кластеров, где R = 3  . В каждой строке записана информация о расположении на карте одной звезды: сначала координата x  , затем координата y  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 4119.

В файле Б хранятся данные о звёздах четырёх кластеров, где R = 2  . Известно, что количество звёзд не превышает 11268. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс центров кластеров, и Py  – среднее арифметическое ординат центров кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть произведения Px ⋅250  для файла А и Py ⋅250  для файла А, далее целую часть произведения Px ⋅300  для файла Б и Py ⋅300  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Нанесём на график две прямые: y = x  и y = − x  :

PIC

Точки, находящиеся в пересечении неравенств:

y ≥ x

y ≥ − x

принадлежат верхнему(первому) кластеру.

Точки, находящиеся в пересечении неравенств:

y ≥ x

y ≤ − x

принадлежат левому(второму) кластеру.

Точки, находящиеся в пересечении неравенств:

y ≤ x

y ≥ − x

принадлежат правому(третьему) кластеру.

Код программы для файла А:

f = open(’27_2_A.txt’)
n = f.readline()
clusters = [[] for i in range(3)]
for i in range(4119):
    star = list(map(float, f.readline().replace(’,’, ’.’).split()))
    x,y = star[0],star[1]
    if y >= x and y >= -x:
        clusters[0].append(star)
    elif y >= x and y <= - x:
        clusters[1].append(star)
    elif y <= x and y >= -x:
        clusters[2].append(star)

sum_x = sum_y = tx = ty = 0
for i in clusters:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / len(clusters) * 250))
print(int(sum_y / len(clusters) * 250))

Диаграмма для файла Б имеет вид:

PIC

Нанесём на график две прямые: y = 0.5x  и y = − 0.5x  :

PIC

Теперь мы можем разделить кластеры. Точки, которые удовлетворяют пересечению неравенств:

y ≥ 0,5x

y ≥ − 0,5x

принадлежат верхнему(первому) кластеру.

Точки, которые удовлетворяют пересечению неравенств:

y ≥ 0,5x

y ≤ − 0,5x

принадлежат правому(второму) кластеру.

Точки, которые удовлетворяют пересечению неравенств:

y ≤ 0,5x

y ≤ − 0,5x

принадлежат нижнему(третьему) кластеру.

Точки, которые удовлетворяют пересечению неравенств:

y ≥ 0,5x

y ≤ − 0,5x

принадлежат левому(четвертому) кластеру.

Код программы для файла Б:

f = open(’27_2_B.txt’)
n = f.readline()
clusters = [[] for i in range(4)]
for i in range(11268):
    star = list(map(float, f.readline().replace(’,’, ’.’).split()))
    x,y = star[0],star[1]
    if y >= 0.5*x and y >= -0.5*x:
        clusters[0].append(star)
    elif y >= 0.5*x and y <= -0.5*x:
        clusters[1].append(star)
    elif y <= 0.5*x and y >= -0.5*x:
        clusters[2].append(star)
    elif y <= 0.5*x and y <= -0.5*x:
        clusters[3].append(star)

sum_x = sum_y = tx = ty = 0
for i in clusters:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / len(clusters) * 300))
print(int(sum_y / len(clusters) * 300))

Ответ: -9 402 -19 -93

Ошибка.
Попробуйте повторить позже

Задача 3#99577

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиусом R  . Каждая звезда обязательно принадлежит только одному из кластеров.

Истинный центр кластера, или центроид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера минимальна.

Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B(x2,y2)  на плоскости, которое вычисляется по формуле:

d(A, B) = ∘ (x-−-x-)2 +-(y-−-y-)2
            2   1      2   1

В файле A хранятся данные о звёздах двух кластеров, где R = 4  у верхнего кластера и R = 5  у нижнего кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x  , затем координата y  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 3215.

В файле Б хранятся данные о звёздах трёх кластеров, где R = 3  у левого кластера, R = 4  у верхнего кластера и R = 5  у правого кластера. Известно, что количество звёзд не превышает 15682. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс центров кластеров, и Py  – среднее арифметическое ординат центров кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть произведения Px ⋅250  для файла А и Py ⋅250  для файла А, далее целую часть произведения Px ⋅300  для файла Б и Py ⋅300  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Нанесём на график прямую: y = 8 + x  :

PIC

Точки, которые удовлетворяют неравенству: y ≥ 8+ x  принадлежат верхнему(первому) кластеру. Все остальные - нижнему(второму) кластеру.

Код программы для файла А:

f = open(’27_3_A.txt’)
n = f.readline()
clusters = [[] for i in range(2)]
for i in range(3215):
    star = list(map(float, f.readline().replace(’,’, ’.’).split()))
    x,y = star[0],star[1]
    if y >= 8 + x:
        clusters[0].append(star)
    else:
        clusters[1].append(star)

sum_x = sum_y = 0
for i in clusters:
    tx = ty = 0
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / len(clusters) * 250))
print(int(sum_y / len(clusters) * 250))

Диаграмма для файла Б имеет вид:

PIC

Нанесём на график две прямые: y = 7+ x  и y = − 6− x  :

PIC

Теперь можем провести определить какие звезды к каким кластерам относятся.

Если точка находится в пересечении неравенств: y ≥ 7+ x  и y ≥ − 6− x  , то данная точка относится к верхнему (первому) кластеру.

Если точка находится в пересечении неравенств: y ≥ 7+ x  и y ≤ − 6− x  , то данная точка относится к левому (второму) кластеру.

Если точка находится в пересечении неравенств: y ≤ 7+ x  и y ≥ − 6− x  , то данная точка относится к правому (третьему) кластеру.

Код программы для файла Б:

f = open(’27_3_B.txt’)
n = f.readline()
clusters = [[] for i in range(3)]
for i in range(15682):
    star = list(map(float, f.readline().replace(’,’, ’.’).split()))
    x, y = star[0], star[1]
    if y >= 7 + x and y >= -6 - x:
        clusters[0].append(star)
    elif y >= 7 + x and y <= -6 - x:
        clusters[1].append(star)
    elif y <= 7 + x and y >= -6 - x:
        clusters[2].append(star)

sum_x = sum_y = 0
for i in clusters:
    tx = ty = 0
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2 - x1) ** 2 + (y2 - y1) ** 2) ** 0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / len(clusters) * 300))
print(int(sum_y / len(clusters) * 300))

Ответ: -635 1231 -1619 979

Ошибка.
Попробуйте повторить позже

Задача 4#99578

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиусом R  . Каждая звезда обязательно принадлежит только одному из кластеров.

Истинный центр кластера, или центроид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера минимальна. Центроид не вычисляется для колец, он вычисляется только для кластеров, представляющих собой круг.

Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B(x2,y2)  на плоскости, которое вычисляется по формуле:

        ∘ --------------------
d(A, B) =  (x2 − x1)2 + (y2 − y1)2

В файле A хранятся данные о звёздах трёх кластеров, где R = 3  для нижнего кластера и для верхнего внешнего кластера и R = 2  для верхнего внутреннего кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x  , затем координата y  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 966.

В файле Б хранятся данные о звёздах четырёх кластеров, R = 3  для нижнего правого кластера и для верхнего внешнего кластера и R = 2  для верхнего внутреннего кластера и R = 4  для нижнего левого кластера. Известно, что количество звёзд не превышает 4798. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс центров кластеров, и Py  – среднее арифметическое ординат центров кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть произведения P  ⋅333
  x  для файла А и Py ⋅666  для файла А, далее целую часть произведения Px ⋅321  для файла Б и Py ⋅123  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Рассмотрим подробно нижний кластер. Он симметричен относительно оси Oy и Ox. Его радиус равен 3  . Следовательно, если координаты точки удовлетворяют неравенству окружности: x2 + y2 ≤ 9  , значит, это точка принадлежит нижнему кластеру.

Изучим верхний внутренний кластер, его радиус равен 2  . Центр круга находится в точке (-5;4). Следовательно, если координаты точки удовлетворяют неравенству окружности: (x +5)2 + (y− 4)2 ≤ 4  , значит, это точка принадлежит верхнему внутреннему кластеру.

Если точка не удовлетворяет ни одному из выше описанных неравенств, значит, она находится во внешнем кластере (кольце). Поскольку мы не высчитываем центроид колец, то данные точки нас не интересуют.

Код программы для файла А:

f = open(’27_4_A.txt’)
n = f.readline()
clusters = [[] for i in range(2)]
for i in range(966):
    star = list(map(float, f.readline().replace(’,’, ’.’).split()))
    x,y = star[0],star[1]
    if x**2 + y ** 2 <= 9:
        clusters[0].append(star)
    elif (x + 5)**2 + (y - 4) ** 2 <= 4:
        clusters[1].append(star)
sum_x = sum_y = tx = ty = 0
for i in clusters:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / len(clusters) * 333))
print(int(sum_y / len(clusters) * 666))

Диаграмма для файла Б имеет вид:

PIC

Разберем подробнее нижний правый кластер. Центр круга находится в точке (1;-1). Его радиус равен 3  . Следовательно, если координаты точки удовлетворяют неравенству окружности: (x− 1)2 + (y+ 1)2 ≤ 9  , значит, это точка принадлежит нижнему правому кластеру.

Изучим поподробнее нижний левый кластер. Центр круга находится в точке (-5;-5). Его радиус равен 4  . Следовательно, если координаты точки удовлетворяют неравенству окружности: (x+ 5)2 + (y+ 5)2 ≤ 16  , значит, это точка принадлежит нижнему левому кластеру.

Рассмотрим верхний внутренний кластер. Центр круга находится в точке (-6;3). Его радиус равен 2  . Следовательно, если координаты точки удовлетворяют неравенству окружности: (x+ 6)2 + (y− 3)2 ≤ 4  , значит, это точка принадлежит верхнему внутреннему кластеру.

Если точка не удовлетворяет ни одному из выше описанных неравенств, значит, она находится во внешнем кластере (кольце). Поскольку мы не высчитываем центроид колец, то данные точки нас не интересуют.

Код программы для файла Б:

f = open(’27_4_B.txt’)
n = f.readline()
clusters = [[] for i in range(3)]
for i in range(4798):
    star = list(map(float, f.readline().replace(’,’, ’.’).split()))
    x,y = star[0],star[1]
    if ((x - 1) ** 2 + (y  + 1) ** 2) <= 9:
        clusters[0].append(star)
    elif ((x - (-6)) ** 2 + (y - 3) ** 2) <= 4:
        clusters[1].append(star)
    elif ((x + 5)**2 + (y + 5)**2) <= 16:
        clusters[2].append(star)
sum_x = sum_y = tx = ty = 0
for i in clusters:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / len(clusters) * 321))
print(int(sum_y / len(clusters) * 123))

Ответ: -800 1274 -1081 -120

Ошибка.
Попробуйте повторить позже

Задача 5#99579

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиусом R  . Каждая звезда обязательно принадлежит только одному из кластеров.

Истинный центр кластера, или центроид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера минимальна. Центроид не вычисляется для колец, он вычисляется только для кластеров, представляющих собой круг.

Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B(x2,y2)  на плоскости, которое вычисляется по формуле:

        ∘ --------------------
d(A, B) =  (x2 − x1)2 + (y2 − y1)2

В файле A хранятся данные о звёздах двух кластеров, где R = 2.1  у внутреннего кластера и R = 5.1  у внешнего кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x  , затем координата y  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 1029.

В файле Б хранятся данные о звёздах четырёх кластеров, где R = 2.1  у внутренних кластеров, R = 5.1  у внешних кластеров. Известно, что количество звёзд не превышает 8166. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс центров кластеров, и Py  – среднее арифметическое ординат центров кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть произведения Px ⋅525  для файла А и Py ⋅525  для файла А, далее целую часть произведения Px ⋅300  для файла Б и Py ⋅300  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Определим уравнение окружности, внутри которой лежит внутренний кластер. Геометрический центр внутреннего кластера находится приблизительно в точке (0;3.5). Значит, если координаты точки удовлетворяют неравенству окружности:  2         2     2
x + (y− 3.5) ≤ 2.1  , тогда эта звезда относится ко внутреннему кластеру.

Код программы для файла А:

f = open(’27_5_A.txt’)
n = f.readline()
cluster = []
for i in range(1029):
    star = list(map(float, f.readline().replace(’,’, ’.’).split()))
    x, y = star[0], star[1]
    if x ** 2 + (y - 3.5) ** 2 <= 2.1 ** 2:
        cluster.append(star)

sum_x = sum_y = tx = ty = 0
mn = 100000050000
for j in cluster:
    x1, y1 = j
    sm = 0
    for k in cluster:
        x2, y2 = k
        sm += ((x2 - x1) ** 2 + (y2 - y1) ** 2) ** 0.5
    if sm < mn:
        mn = sm
        tx, ty = x1, y1
sum_x += tx
sum_y += ty
print(int(sum_x * 525))
print(int(sum_y * 525))

Диаграмма для файла Б имеет вид:

PIC

Нанесём на график прямую: y = 9.5− x  :

PIC

Теперь можем провести определить какие звезды к каким кластерам относятся.

Сначала разделим на группы по два кластера.

Точки, которые удовлетворяют неравенству: y ≥ 9.5 − x  находятся в верхней (первой) группе.

Точки, которые удовлетворяют неравенству: y ≤ 9.5 − x  находятся в нижней (второй) группе.

Рассмотрим подробно первую группу:

Радиус внутренний кластер равен 2  , геометрический центр кластера находится в точке (8;7). Следовательно, если координаты точки удовлетворяют неравенству окружности:      2        2     2
(x − 8) + (y − 7) ≤ 2.1  , тогда эта звезда относится ко внутреннему кластеру первой группы.

Рассмотрим подробно вторую группу:

Радиус внутренний кластер равен 2.1  , геометрический центр кластера находится в точке (2;2). Следовательно, если координаты точки удовлетворяют неравенству окружности: (x − 2)2 + (y − 2)2 ≤ 2.12  , тогда эта звезда относится ко внутреннему кластеру второй группы.

Код программы для файла Б:

f = open(’27_3_B.txt’)
n = f.readline()
clusters = [[] for i in range(2)]
for i in range(8166):
    star = list(map(float, f.readline().replace(’,’, ’.’).split()))
    x, y = star[0], star[1]
    if y >= 9.5 - x:
        if (x - 8) ** 2 + (y - 7) ** 2 < 2.1 ** 2:
            clusters[0].append(star)
    else:
        if (x - 2) ** 2 + (y - 2) ** 2 < 2.1 ** 2:
            clusters[1].append(star)

sum_x = sum_y = 0
for i in clusters:
    tx = ty = 0
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2 - x1) ** 2 + (y2 - y1) ** 2) ** 0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty

print(int(sum_x / len(clusters) * 300))
print(int(sum_y / len(clusters) * 300))

Ответ: -47 1819 1474 1331

Ошибка.
Попробуйте повторить позже

Задача 6#100940

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиусом R  . Каждая звезда обязательно принадлежит только одному из кластеров. Истинный центр кластера, или центроид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера минимальна. Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B (x2,y2)  на плоскости, которое вычисляется по формуле:

        ∘ --------------------
d(A, B) =  (x2 − x1)2 + (y2 − y1)2

В файле A хранятся данные о звёздах двух кластеров, где R = 5  для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x  , затем координата y  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 1000.

В файле Б хранятся данные о звёздах трех кластеров, где R = 8  для каждого кластера. Известно, что количество звёзд не превышает 10 000. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс центров кластеров, и Py  – среднее арифметическое ординат центров кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть Px ⋅10  для файла А, затем Py ⋅10  для файла А, далее целую часть Px ⋅10  для файла Б и Py ⋅10  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Из нее видно, что все точки, чьи абсциссы больше 0, принадлежат одному кластеру, а абсциссы меньше 0 – другому.

Код программы для файла А:

f = open(’1A.txt’)
n = f.readline()
a = [[] for i in range(2)]
for i in range(999):
    star = list(map(float, f.readline().replace(’,’,’.’).split()))
    if star[0] > 0:
        a[0].append(star)
    else:
        a[1].append(star)
sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 2 * 10))
print(int(sum_y / 2 * 10))

Диаграмма для файла Б имеет вид:

PIC

Из нее видно, что все точки, чьи ординаты больше 0, принадлежать первому кластеру; точки, чьи ординаты находятся в интервале (-30; 0) – второму кластеру; остальные точки – третьему.

Код программы для файла Б:

f = open(’1B.txt’)
n = f.readline()
a = [[] for i in range(3)]
for i in range(9998):
    star = list(map(float, f.readline().replace(’,’,’.’).split()))
    if star[1] > 0:
        a[0].append(star)
    elif star[1] > -30 and star[1] < 0:
        a[1].append(star)
    else:
        a[2].append(star)
sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 3 * 10))
print(int(sum_y / 3 * 10))

Ответ: -108 -374 -101 -183

Ошибка.
Попробуйте повторить позже

Задача 7#101102

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиусом R  . Каждая звезда обязательно принадлежит только одному из кластеров. Истинный центр кластера, или центроид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера минимальна. Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B (x2,y2)  на плоскости, которое вычисляется по формуле:

        ∘ --------------------
d(A, B) =  (x2 − x1)2 + (y2 − y1)2

В файле A хранятся данные о звёздах трех кластеров, где R = 3  для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x  , затем координата y  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 1800.

В файле Б хранятся данные о звёздах четырех кластеров, где R = 7  для каждого кластера. Известно, что количество звёзд не превышает 15000. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс центров кластеров, и Py  – среднее арифметическое ординат центров кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть Px ⋅10  для файла А, затем Py ⋅10  для файла А, далее целую часть Px ⋅10  для файла Б и Py ⋅10  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Из нее видно, что все точки, чьи ординаты больше -5, принадлежат одному кластеру; если ординаты находятся в пределах от -20 до -5, то точки принадлежат второму кластеру, иначе – третьему.

Код программы для файла А:

f = open(’2A.txt’)
n = f.readline()
a = [[] for i in range(3)]
for i in range(1799):
    star = list(map(float, f.readline().replace(’,’, ’.’).split()))
    if star[1] > -5:
        a[0].append(star)
    elif star[1] > -20:
        a[1].append(star)
    else:
        a[2].append(star)

sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 3 * 10))
print(int(sum_y / 3 * 10))

Диаграмма для файла Б имеет вид:

PIC

Из нее видно, что все точки, чьи абсциссы больше 0, принадлежат первому кластеру; иначе точки с абсциссами, которые быольше -52 – второму кластеру; точки, чьи ординаты больше 20 – третьему кластеру; остальные точки – четвертому.

Код программы для файла Б:

f = open(’2B.txt’)
n = f.readline()
a = [[] for i in range(4)]
for i in range(14999):
    star = list(map(float, f.readline().replace(’,’,’.’).split()))
    if star[0] > 0:
        a[0].append(star)
    elif star[0] > -52:
        a[1].append(star)
    elif star[1] > 20:
        a[2].append(star)
    else:
        a[3].append(star)

sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 4 * 10))
print(int(sum_y / 4 * 10))

Ответ: 297 -169 -368 256

Ошибка.
Попробуйте повторить позже

Задача 8#101105

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиусом R. Каждая звезда обязательно принадлежит только одному из кластеров. Истинный центр кластера, или центроид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера минимальна. Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B(x2,y2)  на плоскости, которое вычисляется по формуле:

           --------------------
d(A,B ) = ∘ (x2 − x1)2 + (y2 − y1)2

Аномалиями назовём точки, находящиеся на расстоянии более одной условной единицы от точек кластеров. При расчётах аномалии учитывать не нужно.

В файле A хранятся данные о звёздах двух кластеров, где R = 2  для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x  , затем координата y  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 1000.

В файле Б хранятся данные о звёздах трех кластеров, где R = 6  для каждого кластера. Известно, что количество звёзд не превышает 10 000. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс центров кластеров, и Py  – среднее арифметическое ординат центров кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть произведения Px ⋅100  для файла А, затем Py ⋅100  для файла А, далее целую часть произведения Px ⋅100  для файла Б и Py ⋅100  для файла Б. Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Из нее видно, что все точки первого кластера расположены между абсциссами (-20; 20) и ординатами (0; 40). У второго же кластера все точки имеют абсциссу, большую 0, и ординату, меньшую -60.

Код программы для файла А:

f = open(’3A.txt’)
n = f.readline()
a = [[] for i in range(2)]
for i in range(811):
    star = list(map(float, f.readline().replace(’,’,’.’).split()))
    if (star[1] > 0 and star[1] < 40) and (star[0] > -20 and star[0] < 20):
        a[0].append(star)
    elif star[1] < -60 and star[0] > 0:
        a[1].append(star)

sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 2 * 100))
print(int(sum_y / 2 * 100))

Диаграмма для файла Б имеет вид:

PIC

Из нее видно, что все точки, чьи абсциссы больше -20 и ординаты меньше -60, принадлежат первому кластеру; точки, чьи ординаты принадлежат интервалу (-40; 0) и абсциссы больше -40, – второму кластеру; а точки, чьи абсциссы меньше -60 и ординаты меньше -40, – третьему кластеру.

Код программы для файла Б:

n = f.readline()
a = [[] for i in range(3)]
for i in range(11003):
    star = list(map(float, f.readline().replace(’,’, ’.’).split()))
    if star[1] < -60 and star[0] > -20:
        a[0].append(star)
    elif (star[1] < 0 and star[1] > -40) and star[0] > -40:
        a[1].append(star)
    elif star[1] < -40 and star[0] < -60:
        a[2].append(star)

sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2 - x1) ** 2 + (y2 - y1) ** 2) ** 0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 3 * 100))
print(int(sum_y / 3 * 100))

Ответ: 3383 -2354 -3379 -5675

Ошибка.
Попробуйте повторить позже

Задача 9#101106

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри прямоугольника высотой H  и шириной W  . Каждая звезда обязательно принадлежит только одному из кластеров.

Истинный центр кластера, или центроид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера минимальна.

Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B(x2,y2)  на плоскости, которое вычисляется по формуле:

d(A, B) = ∘ (x-−-x-)2 +-(y-−-y-)2
            2   1      2   1

Аномалиями назовём точки, находящиеся на расстоянии более одной условной единицы от точек кластеров. При расчётах аномалии учитывать не нужно.

В файле A хранятся данные о звёздах пяти кластеров, где H = 3  , W  = 3  для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x, затем координата y. Значения даны в условных единицах. Известно, что количество звёзд не превышает 1600.

В файле B хранятся данные о звёздах четырех кластеров, где H = 9  , W = 9  для каждого кластера. Известно, что количество звёзд не превышает 21000. Структура хранения информации о звездах в файле B аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс центров кластеров, и Py  – среднее арифметическое ординат центров кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть произведения Px ⋅100  для файла А, затем P  ⋅100
 y  для файла А, далее целую часть произведения P ⋅100
 x  для файла Б и P ⋅100
 y  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Рассмотрим интервалы, в которых лежит каждый кластер:

1) − 9 < x < − 4;4 < y < 9

2) 1 < x < 5;3 < y < 8

3) 6 < x < 10;0 < y < 5

4) − 5 < x < 0;− 4 < y < 2

5) − 14 < x < − 9;− 11 < y < − 6

Код программы для файла А:

f = open(’4A.txt’)
n = f.readline()
a = [[] for i in range(5)]
for i in range(1508):
    star = list(map(float, f.readline().replace(’,’, ’.’).split()))
    if (-9 < star[0] < -4) and (4 < star[1] < 9):
        a[0].append(star)
    elif (1 < star[0] < 5) and (3 < star[1] < 8):
        a[1].append(star)
    elif (6 < star[0] < 10) and (0 < star[1] < 5):
        a[2].append(star)
    elif (-5 < star[0] < 0) and (-4 < star[1] < 2):
        a[3].append(star)
    elif (-14 < star[0] < -9) and (-11 < star[1] < -6):
        a[4].append(star)

sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 5 * 100))
print(int(sum_y / 5 * 100))

Диаграмма для файла Б имеет вид:

PIC

Рассмотрим интервалы, в которых лежит каждый кластер:

1) − 19 < x < − 8;− 26 < y < − 14

2) − 6 < x < 5;2 < y < 14

3) x > 5;y > 0

4) − 14 < x < − 3;− 11 < y < 2

Код программы для файла Б:

f = open(’4B.txt’)
n = f.readline()
a = [[] for i in range(4)]
for i in range(18008):
    star = list(map(float, f.readline().replace(’,’, ’.’).split()))
    if (-19 < star[0] < -8) and (-26 < star[1] < -14):
        a[0].append(star)
    elif (-6 < star[0] < 5) and (2 < star[1] < 14):
        a[1].append(star)
    elif (star[0] > 5) and (star[1] > 0):
        a[2].append(star)
    elif (-14 < star[0] < -3) and (-11 < star[1] < 2):
        a[3].append(star)

sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2 - x1) ** 2 + (y2 - y1) ** 2) ** 0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 4 * 100))
print(int(sum_y / 4 * 100))

Ответ: -195 105 -276 -263

Ошибка.
Попробуйте повторить позже

Задача 10#101107

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри прямоугольника высотой H  и шириной W  . Каждая звезда обязательно принадлежит только одному из кластеров.

Истинная периферия кластера, или перифероид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера максимальна.

Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B(x2,y2)  на плоскости, которое вычисляется по формуле:

d(A, B) = ∘ (x-−-x-)2 +-(y-−-y-)2
            2   1      2   1

В файле A хранятся данные о звёздах двух кластеров, где H и W не превышает 4 для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x, затем координата y. Значения даны в условных единицах. Известно, что количество звёзд не превышает 2000.

В файле B хранятся данные о звёздах трех кластеров, где H = W  = 2.33  для каждого кластера. Известно, что количество звёзд не превышает 15000. Структура хранения информации о звездах в файле B аналогична файлу А.

Для каждого файла определите координаты периферии каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс периферий кластеров, и Py  – среднее арифметическое ординат периферий кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть произведения Px ⋅100  для файла А, затем Py ⋅100  для файла А, далее целую часть произведения Px ⋅100  для файла Б и Py ⋅100  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Рассмотрим интервалы, в которых лежит каждый кластер:

1)x > 0

2)x < 0

Код программы для файла А:

f = open(’5A.txt’)
n = f.readline()
a = [[] for i in range(2)]
for i in range(1199):
    star = list(map(float, f.readline().replace(’,’,’.’).split()))
    if star[0] > 0:
        a[0].append(star)
    else:
        a[1].append(star)

sum_x = sum_y = tx = ty = 0
for i in a:
    mx = -100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm > mx:
            mx = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 2 * 100))
print(int(sum_y / 2 * 100))

Диаграмма для файла Б имеет вид:

PIC

Рассмотрим интервалы, в которых лежит каждый кластер:

1)x > 0,y < 0

2)x > 0,y > 0

3)x < 0,y < 0

Код программы для файла Б:

f = open(’5B.txt’)
n = f.readline()
a = [[] for i in range(3)]
for i in range(13997):
    star = list(map(float, f.readline().replace(’,’, ’.’).split()))
    if (star[0] > 0) and (star[1] < 0):
        a[0].append(star)
    elif (star[0] > 0) and (star[1] > 0):
        a[1].append(star)
    else:
        a[2].append(star)

sum_x = sum_y = tx = ty = 0
for i in a:
    mx = -100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm > mx:
            mx = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 3 * 100))
print(int(sum_y / 3 * 100))

Ответ: -86 171 154 -248

Ошибка.
Попробуйте повторить позже

Задача 11#101595

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиусом R  . Каждая звезда обязательно принадлежит только одному из кластеров. Истинный центр кластера, или центроид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера минимальна. Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B (x2,y2)  на плоскости, которое вычисляется по формуле:

        ∘ --------------------
d(A, B) =  (x2 − x1)2 + (y2 − y1)2

В файле A хранятся данные о звёздах десяти кластеров, где R = 1.8  для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x  , затем координата y  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 2000.

В файле Б хранятся данные о звёздах шести кластеров, где R = 7.9  для каждого кластера. Известно, что количество звёзд не превышает 12000. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс центров кластеров, и Py  – среднее арифметическое ординат центров кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть Px ⋅1000  для файла А, затем Py ⋅1000  для файла А, далее целую часть Px ⋅1000  для файла Б и Py ⋅1000  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Рассмотрим все 10 кластеров и координаты, в которых они находятся:

1) x < 0,y > 0

2) 20 < x < 30,60 < y < 70

3) 15 < x < 25,30 < y < 45

4) 0 < x < 10,20 < y < 35

5) 25 < x < 35,− 10 < y < 5

6) 55 < x < 65,− 35 < y < − 20

7) 40 < x < 50,− 35 < y < − 25

8) 30 < x < 40,− 50 < y < − 40

9) 70 < x < 80,− 60 < y < − 45

10) x < 0,y < 0

Код программы для файла А:

f = open(’1A.txt’)
n = f.readline()
a = [[] for i in range(10)]
for i in range(1999):
    star = list(map(float, f.readline().replace(’,’,’.’).split()))
    if star[0] < 0 and star[1] > 0:
        a[0].append(star)
    elif star[0] < 0 and star[1] < 0:
        a[1].append(star)
    elif 20 < star[0] < 30 and 60 < star[1] < 70:
        a[2].append(star)
    elif 15 < star[0] < 25 and 30 < star[1] < 45:
        a[3].append(star)
    elif 0 < star[0] < 10 and 20 < star[1] < 35:
        a[4].append(star)
    elif 25 < star[0] < 35 and -10 < star[1] < 5:
        a[5].append(star)
    elif 55 < star[0] < 65 and -35 < star[1] < -20:
        a[6].append(star)
    elif 40 < star[0] < 50 and -35 < star[1] < -25:
        a[7].append(star)
    elif 30 < star[0] < 40 and -50 < star[1] < -40:
        a[8].append(star)
    elif 70 < star[0] < 80 and -60 < star[1] < -45:
        a[9].append(star)

sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 10 * 1000))
print(int(sum_y / 10 * 1000))
                                                                                                  
                                                                                                  

Диаграмма для файла Б имеет вид:

PIC

Рассмотрим все 6 кластеров и координаты, в которых они находятся:

1) x < 0,y > 0

2) 10 < x < 40,70 < y < 110

3) 130 < x < 160,70 < y < 110

4) 100 < x < 130,20 < y < 60

5) 80 < x < 110,− 30 < y < 10

6) 40 < x < 70,− 140 < y < − 110

Код программы для файла Б:

f = open(’1B.txt’)
n = f.readline()
a = [[] for i in range(6)]
for i in range(11999):
    star = list(map(float, f.readline().replace(’,’,’.’).split()))
    if star[0] < 0 and star[1] > 0:
        a[0].append(star)
    elif 10 < star[0] < 40 and 70 < star[1] < 110:
        a[1].append(star)
    elif 130 < star[0] < 160 and 70 < star[1] < 110:
        a[2].append(star)
    elif 100 < star[0] < 130 and 20 < star[1] < 60:
        a[3].append(star)
    elif 80 < star[0] < 110 and -30 < star[1] < 10:
        a[4].append(star)
    elif 40 < star[0] < 70 and -140 < star[1] < -110:
        a[5].append(star)

sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 6 * 1000))
print(int(sum_y / 6 * 1000))

Ответ: 16858 -1927 58553 35992

Ошибка.
Попробуйте повторить позже

Задача 12#101596

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиусом R  . Каждая звезда обязательно принадлежит только одному из кластеров. Истинный центр кластера, или центроид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера минимальна. Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B(x2,y2)  на плоскости, которое вычисляется по формуле:

           --------------------
d(A,B ) = ∘ (x2 − x1)2 + (y2 − y1)2

Аномалиями назовём точки, находящиеся на расстоянии более трёх условных единиц от точек кластеров. При расчётах аномалии учитывать не нужно.

В файле A хранятся данные о звёздах четырех кластеров, где R = 9  для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x  , затем координата y  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 3000.

В файле Б хранятся данные о звёздах трех кластеров, где R = 15  для каждого кластера. Известно, что количество звёзд не превышает 20 000. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс центров кластеров, и Py  – среднее арифметическое ординат центров кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть произведения Px ⋅1000  для файла А, затем Py ⋅1000  для файла А, далее целую часть произведения Px ⋅1000  для файла Б и Py ⋅1000  для файла Б. Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Рассмотрим все 4 кластера и координаты, в которых они находятся:

1) − 180 < x < − 140,− 150 < y < − 110

2) − 180 < x < − 140,− 200 < y < − 150

3) − 10 < x < 25,− 180 < y < − 140

4) 60 < x < 90,− 55 < y < − 20

Код программы для файла А:

f = open(’2A.txt’)
n = f.readline()
a = [[] for i in range(4)]
for i in range(2145):
    star = list(map(float, f.readline().replace(’,’,’.’).split()))
    if -180 < star[0] < -140 and -150 < star[1] < -110:
        a[0].append(star)
    elif -180 < star[0] < -140 and -200 < star[1] < -150:
        a[1].append(star)
    elif 60 < star[0] < 90 and -55 < star[1] < -20:
        a[2].append(star)
    elif -10 < star[0] < 25 and -180 < star[1] < -140:
        a[3].append(star)

sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 4 * 1000))
print(int(sum_y / 4 * 1000))

Диаграмма для файла Б имеет вид:

PIC

Рассмотрим все 3 кластера и координаты, в которых они находятся:

1) − 40 < x < 0,50 < y < 100

2) 125 < x < 165,− 50 < y < 0

3) 124 < x < 160,− 125 < y < − 75

Код программы для файла Б:

f = open(’2B.txt’)
n = f.readline()
a = [[] for i in range(3)]
for i in range(15032):
    star = list(map(float, f.readline().replace(’,’,’.’).split()))
    if -40 < star[0] < 0 and 50 < star[1] < 100:
        a[0].append(star)
    elif 125 < star[0] < 165 and -50 < star[1] < 0:
        a[1].append(star)
    elif 124 < star[0] < 160 and -125 < star[1] < -75:
        a[2].append(star)

sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 3 * 1000))
print(int(sum_y / 3 * 1000))

Ответ: -58649 -124483 87368 -18008

Ошибка.
Попробуйте повторить позже

Задача 13#101597

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба, а также по блеску звезды. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри прямоугольника высотой H  и шириной W  . Каждая звезда, подходящая под заданный уровень блеска, обязательно принадлежит только одному из кластеров. Остальные звёзды не относятся к рассматриваемым кластерам.

Истинный центр кластера, или центроид, – это одна из звёзд кластера, сумма расстояний от которой до всех остальных звёзд кластера минимальна.

Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B(x2,y2)  на плоскости, которое вычисляется по формуле:

        ∘ --------------------
d(A, B) =  (x2 − x1)2 + (y2 − y1)2

В файле A хранятся данные о звёздах четырех кластеров, где R = 8  для каждого кластера, а звёзды обладают блеском более 6 условных единиц. В каждой строке записана информация об уровне блеска звезды, а тажке о расположении на карте одной звезды: сначала координата x  , затем координата y  и наконец уровень блеска m  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 3000.

В файле Б хранятся данные о звёздах трех кластеров, где R = 15  для каждого кластера, а звёзды обладают блеском от 2 до 5 условных единиц, не включая 2 и 5. Известно, что количество звёзд не превышает 30000. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс центров кластеров, и Py  – среднее арифметическое ординат центров кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть произведения P  ⋅1000
  x  для файла А и Py ⋅1000  для файла А, далее целую часть произведения Px ⋅1000  для файла Б и Py ⋅1000  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Рассмотрим все 4 кластера и координаты, в которых они находятся:

1) − 10 < y < 20

2) x > 0,y < 0

3) − 30 < x < 0

4) все остальные точки

Код программы для файла А:

f = open(’3A.txt’)
n = f.readline()
a = [[] for i in range(4)]
for line in f:
    x, y, m = list(map(float, line.replace(’,’, ’.’).split()))
    if m > 6:
        if x > 0 and y < 0:
            a[0].append([x, y])
        elif -10 < y < 20:
            a[1].append([x, y])
        elif -30 < x < 0:
            a[2].append([x, y])
        else:
            a[3].append([x, y])

sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 4 * 1000))
print(int(sum_y / 4 * 1000))

Диаграмма для файла Б имеет вид:

PIC

Рассмотрим все 3 кластера и координаты, в которых они находятся:

1) x > 45

2) 5 < x < 45

3) все остальные точки

Код программы для файла Б:

f = open(’3B.txt’)
n = f.readline()
a = [[] for i in range(3)]
for line in f:
    x, y, m = list(map(float, line.replace(’,’, ’.’).split()))
    if 2 < m < 5:
        if x > 45:
            a[0].append([x, y])
        elif 5 < x < 45:
            a[1].append([x, y])
        else:
            a[2].append([x, y])

sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 3  * 1000))
print(int(sum_y / 3  * 1000))

Ответ: -22125 -33835 7273 7822

Ошибка.
Попробуйте повторить позже

Задача 14#101598

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба, а также по блеску звезды. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри прямоугольника высотой H  и шириной W  . Каждая звезда, подходящая под заданный уровень блеска, обязательно принадлежит только одному из кластеров. Остальные звёзды не относятся к рассматриваемым кластерам.

Истинный центр кластера, или центроид, – это одна из звёзд кластера, сумма расстояний от которой до всех остальных звёзд кластера минимальна.

Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B(x2,y2)  на плоскости, которое вычисляется по формуле:

        ∘ --------------------
d(A, B) =  (x2 − x1)2 + (y2 − y1)2

В файле A хранятся данные о звёздах двух кластеров, где H = 3  , W = 6  для каждого кластера, а звёзды обладают блеском, в котором целая часть уровня блеска чётна. В каждой строке записана информация об уровне блеска звезды, а тажке о расположении на карте одной звезды: сначала координата x  , затем координата y  и наконец уровень блеска m  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 1500.

В файле Б хранятся данные о звёздах четырёх кластеров, где H = 2  , W  = 8  для каждого кластера, а звёзды обладают блеском, в котором целая часть уровня блеска кратна 5. Известно, что количество звёзд не превышает 40000. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс центров кластеров, и Py  – среднее арифметическое ординат центров кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть произведения Px ⋅1000  для файла А и Py ⋅1000  для файла А, далее целую часть произведения Px ⋅1000  для файла Б и Py ⋅1000  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Рассмотрим все 2 кластера и координаты, в которых они находятся:

1) x > 7

2) x < 7

Код программы для файла А:

f = open(’4A.txt’)
n = f.readline()
a = [[] for i in range(2)]
for line in f:
    x, y, m = list(map(float, line.replace(’,’, ’.’).split()))
    if int(m) % 2 == 0:
        if x > 7:
            a[0].append([x, y])
        else:
            a[1].append([x, y])

sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 2  * 1000))
print(int(sum_y / 2  * 1000))

Диаграмма для файла Б имеет вид:

PIC

Рассмотрим все 4 кластера и координаты, в которых они находятся:

1) x > 7.5

2) x < 7.5,y > 0

3) x > − 9.5,y < − 2

4) все остальные точки

Код программы для файла Б:

f = open(’4B.txt’)
n = f.readline()
a = [[] for i in range(4)]
for line in f:
    x, y, m = list(map(float, line.replace(’,’, ’.’).split()))
    if int(m) % 5 == 0:
        if x > 7.5:
            a[0].append([x, y])
        elif x < 7.5 and y > 0:
            a[1].append([x, y])
        elif x > -9.5 and y < -2:
            a[2].append([x, y])
        else:
            a[3].append([x, y])

sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 4  * 1000))
print(int(sum_y / 4  * 1000))

Ответ: 6761 1530 -1007 -2255

Ошибка.
Попробуйте повторить позже

Задача 15#101599

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба, а также по блеску звезды. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиусом R  . Каждая звезда, подходящая под заданный уровень блеска, обязательно принадлежит только одному из кластеров. Остальные звёзды не относятся к рассматриваемым кластерам.

Истинный центр кластера, или центроид, – это одна из звёзд кластера, сумма расстояний от которой до всех остальных звёзд кластера минимальна.

Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B(x2,y2)  на плоскости, которое вычисляется по формуле:

        ∘ --------------------
d(A, B) =  (x2 − x1)2 + (y2 − y1)2

Аномалиями назовём точки, находящиеся на расстоянии более двух условных единиц от точек кластеров. При расчётах аномалии учитывать не нужно.

В файле A хранятся данные о звёздах трех кластеров, где R = 10  для каждого кластера, а звёзды обладают блеском от 9 до 13 условных единиц, не включая 9 и 13. В каждой строке записана информация об уровне блеска звезды, а тажке о расположении на карте одной звезды: сначала координата x  , затем координата y  и наконец уровень блеска m  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 1000.

В файле Б хранятся данные о звёздах четырех кластеров, где R = 30  для каждого кластера, а звёзды обладают блеском от 3 до 8 условных единиц, не включая 3 и 8. Известно, что количество звёзд не превышает 30000. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс центров кластеров, и Py  – среднее арифметическое ординат центров кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть произведения Px ⋅500  для файла А и Py ⋅500  для файла А, далее целую часть произведения Px ⋅500  для файла Б и Py ⋅500  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Рассмотрим 3 кластера и координаты, в которых они находятся:

1) 65 < x < 90,− 45 < y < − 20

2) 15 < x < 45,− 40 < y < − 15

3) − 50 < x < − 25,− 50 < y < − 20

Код программы для файла А:

f = open(’5A.txt’)
n = f.readline()
a = [[] for i in range(3)]
for line in f:
    x, y, m = list(map(float, line.replace(’,’, ’.’).split()))
    if 9 < m < 13:
        if 65 < x < 90 and -45 < y < -20:
            a[0].append([x, y])
        elif 15 < x < 45 and -40 <  y < -15:
            a[1].append([x, y])
        elif -50 < x < -25 and -50 < y < -20:
            a[2].append([x, y])

sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 3  * 500))
print(int(sum_y / 3  * 500))

Диаграмма для файла Б имеет вид:

PIC

Рассмотрим все 4 кластера и координаты, в которых они находятся:

1) − 200 < x < − 100,175 < y < 275

2) − 100 < x < − 25,− 250 < y < − 160

3) 0 < x < 75,− 325 < y < − 225

4) − 50 < x < 50,100 < y < 190

Код программы для файла Б:

f = open(’5B.txt’)
n = f.readline()
a = [[] for i in range(4)]
for line in f:
    x, y, m = list(map(float, line.replace(’,’, ’.’).split()))
    if 3 < m < 8:
        if -200 < x < -100 and 175 < y < 275:
            a[0].append([x, y])
        elif -100 < x < -25 and -250 <  y < -160:
            a[1].append([x, y])
        elif 0 < x < 75 and -325 < y < -225:
            a[2].append([x, y])
        elif -50 < x < 50 and 100 < y < 190:
            a[3].append([x, y])

sum_x = sum_y = tx = ty = 0
for i in a:
    mn = 100000050000
    for j in i:
        x1, y1 = j
        sm = 0
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 4  * 500))
print(int(sum_y / 4  * 500))

Ответ: 11822 -15475 -22510 -12618

Ошибка.
Попробуйте повторить позже

Задача 16#103235

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиусом R  . Каждая звезда обязательно принадлежит только одному из кластеров. Истинная периферия кластера, или перифероид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера максимальна. Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B (x2,y2)  на плоскости, которое вычисляется по формуле:

        ∘ --------------------
d(A, B) =  (x2 − x1)2 + (y2 − y1)2

В файле A хранятся данные о звёздах двух кластеров, где R = 4  для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x  , затем координата y  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 1000.

В файле Б хранятся данные о звёздах четырех кластеров, где R = 3  для каждого кластера. Известно, что количество звёзд не превышает 10000. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты периферии каждого кластера, затем вычислите два числа: Px  – произведение абсцисс периферий кластеров, и Py  – произведение ординат периферий кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть Px∕100  для файла А, затем Py∕100  для файла А, далее целую часть Px∕100  для файла Б и Py∕100  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Первый кластер находится в отрицательной области абсцисс, а второй – в положительной.

Код программы для файла А:

f = open(’1A.txt’)
n = f.readline()  # Считываем первую строку файла с названиями столбцов
a = [[] for i in range(2)]  # Создаём список для кластеров
# Считваем звёзды и определяем их к кластерам
for i in range(800):
    star = list(map(float, f.readline().replace(’,’,’.’).split()))
    if star[0] < 0:
        a[0].append(star)
    else:
        a[1].append(star)

mul_x = mul_y = 1  # Переменные для произведения
for i in a:
    tx = ty = 0  # Координаты текущей периферии кластера
    mx = -100000050000  # Максимальное расстояние
    for j in i:
        x1, y1 = j
        sm = 0  # Суммарное расстояние
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm > mx:
            mx = sm
            tx, ty = x1, y1
    mul_x *= tx
    mul_y *= ty
print(int(mul_x / 100))
print(int(mul_y / 100))

Диаграмма для файла Б имеет вид:

PIC

Рассмотрим все 4 кластера и координаты, в которых они находятся:

1) x > 0

2) x < 0,y > 0

3) x < − 35

4) все остальные

Код программы для файла Б:

f = open(’1B.txt’)
n = f.readline()  # Считываем первую строку файла с названиями столбцов
a = [[] for i in range(4)]  # Создаём список для кластеров
# Считваем звёзды и определяем их к кластерам
for i in range(10000):
    star = list(map(float, f.readline().replace(’,’,’.’).split()))
    if star[0] > 0:
        a[0].append(star)
    elif (star[0] < 0) and (star[1] > 0):
        a[1].append(star)
    elif star[0] < -35:
        a[2].append(star)
    else:
        a[3].append(star)

mul_x = mul_y = 1  # Переменные для произведения
for i in a:
    tx = ty = 0  # Координаты текущей периферии кластера
    mx = -100000050000  # Максимальное расстояние
    for j in i:
        x1, y1 = j
        sm = 0  # Суммарное расстояние
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm > mx:
            mx = sm
            tx, ty = x1, y1
    mul_x *= tx
    mul_y *= ty
print(int(mul_x / 100))
print(int(mul_y / 100))

Ответ: -38 7 -7106 41705

Ошибка.
Попробуйте повторить позже

Задача 17#103236

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиусом R  . Каждая звезда обязательно принадлежит только одному из кластеров. Истинный центр кластера, или центроид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера минимальна.

Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B(x2,y2)  на плоскости, которое вычисляется по формуле:

        ∘ --------------------
d(A, B) =  (x2 − x1)2 + (y2 − y1)2

Аномалиями назовём точки, находящиеся на расстоянии более одной условной единицы от точек кластеров. При расчётах аномалии учитывать не нужно.

В файле A хранятся данные о звёздах четырех кластеров, где R = 2  для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x  , затем координата y  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 1000.

В файле Б хранятся данные о звёздах трех кластеров, где R = 6  для каждого кластера. Известно, что количество звёзд не превышает 25 000. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  – среднее арифметическое абсцисс центров кластеров, и Py  – среднее арифметическое ординат центров кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть произведения Px ⋅10  для файла А, затем Py ⋅10  для файла А, далее целую часть произведения Px ⋅10  для файла Б и Py ⋅10  для файла Б. Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Рассмотрим все 4 кластера и координаты, в которых они находятся:

1) x > 70,y > 0

2) − 10 < x < 0,y > 0

3) − 50 < x < − 30,− 40 < y < − 20

4) − 30 < x < − 18,y > 0

Код программы для файла А:

f = open(’2A.txt’)
n = f.readline()  # Считываем первую строку файла с названиями столбцов
a = [[] for i in range(4)]  # Создаём список для кластеров
# Считваем звёзды и определяем их к кластерам
for i in range(814):
    star = list(map(float, f.readline().replace(’,’,’.’).split()))
    if (star[0] > 70) and (star[1] > 0):
        a[0].append(star)
    elif (-10 < star[0] < 0) and (star[1] > 0):
        a[1].append(star)
    elif (-50 < star[0] < -30) and (-40 < star[1] < -20):
        a[2].append(star)
    elif (-30 < star[0] < -18) and (star[1] > 0):
        a[3].append(star)

sum_x = sum_y = 0  # Переменные для суммы абсцисс и ординат центров
for i in a:
    tx = ty = 0  # Координаты текущего центра кластера
    mn = 100000050000  # Минимальное расстояние
    for j in i:
        x1, y1 = j
        sm = 0  # Суммарное расстояние
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 4 * 10))
print(int(sum_y / 4 * 10))

Диаграмма для файла Б имеет вид:

PIC

Рассмотрим все 3 кластера и координаты, в которых они находятся:

1) y > 80

2) 40 < x < 60,− 20 < y < 20

3) y < − 80

Код программы для файла Б:

f = open(’2B.txt’)
n = f.readline()  # Считываем первую строку файла с названиями столбцов
a = [[] for i in range(3)]  # Создаём список для кластеров
# Считваем звёзды и определяем их к кластерам
for i in range(20012):
    star = list(map(float, f.readline().replace(’,’,’.’).split()))
    if star[1] > 80:
        a[0].append(star)
    elif (40 < star[0] < 60) and (-20 < star[1] < 20):
        a[1].append(star)
    elif star[1] < -80:
        a[2].append(star)

sum_x = sum_y = 0  # Переменные для суммы абсцисс и ординат центров
for i in a:
    tx = ty = 0  # Координаты текущего центра кластера
    mn = 100000050000  # Минимальное расстояние
    for j in i:
        x1, y1 = j
        sm = 0  # Суммарное расстояние
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 3 * 10))
print(int(sum_y / 3 * 10))

Ответ: 19 400 69 18

Ошибка.
Попробуйте повторить позже

Задача 18#103237

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба, а также по блеску звезды. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга с радиусом R  . Каждая звезда, подходящая под заданный уровень блеска, обязательно принадлежит только одному из кластеров. Остальные звёзды не относятся к рассматриваемым кластерам.

Истинный центр кластера, или центроид, – это одна из звёзд кластера, сумма расстояний от которой до всех остальных звёзд кластера минимальна.

Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B(x2,y2)  на плоскости, которое вычисляется по формуле:

        ∘ --------------------
d(A, B) =  (x2 − x1)2 + (y2 − y1)2

В файле A хранятся данные о звёздах четырех кластеров, где R = 4  для каждого кластера, а звёзды обладают блеском более 20 и менее 40 условных единиц, целая часть которых кратна 9. В каждой строке записана информация об уровне блеска звезды, а также о расположении на карте одной звезды: сначала координата x  , затем координата    y  и наконец уровень блеска m  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 3000.

В файле Б хранятся данные о звёздах пяти кластеров, где R = 2  для каждого кластера, а звёзды обладают блеском более 45 и менее 98 условных единиц, целая часть которых оканчивается на четную цифру. Известно, что количество звёзд не превышает 15000. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс центров кластеров, и Py  – среднее арифметическое ординат центров кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть P
 x  для файла А и P
  y  для файла А, далее целую часть Px  для файла Б и Py  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Рассмотрим все 4 кластера и координаты, которыми их можно последовательно отделить:

1) y > 60

2) y > 20

3) x > 0

4) все остальные точки

Код программы для файла А:

# распределение на кластеры с помощью метода dbscan
from math import *

f = open(’3A.txt’)
s = f.readline()
# сохраняем массив данных
st = [list(map(float, i.replace(’,’, ’.’).split())) for i in f]
# цикл для выделения индексов первых звезд в каждом кластере, условие в скобках необходимо менять для каждого кластера
# for i in range(len(st)):
#     if (20 > st[i][1] and st[i][0] < 0) and 20 < st[i][2] < 40 and int(st[i][2]) % 9 == 0:
#         print(i)
#         break

# массив с кластерами
a = [[[st[84][0], st[84][1]]], [[st[438][0], st[438][1]]], [[st[841][0], st[841][1]]], [[st[1212][0], st[1212][1]]]]
st.pop(84), st.pop(438), st.pop(841), st.pop(1212)

# удаляем из массива звезды с неподходящим блеском
for i in range(len(st)):
    if (20 > st[i][2] or st[i][2] > 40) or int(st[i][2]) % 9 != 0:
        st[i] = ’*’

# реализация метода dbscan
for k in range(4):
    for j in a[k]:
        for i in range(len(st)):
            if st[i] != ’*’:
                p = [st[i][0], st[i][1]]
                if dist(p, j) < 10 and int(st[i][2]) % 9 == 0:
                    a[k].append(p)
                    st[i] = ’*’

# распределение на кластеры с помощью значений координат
f = open(’3A.txt’)
n = f.readline()  # Считываем первую строку файла с названиями столбцов
a = [[] for i in range(4)]  # Создаём список для кластеров
for line in f:  # Считываем звёзды и определяем их к кластерам
    x, y, m = list(map(float, line.replace(’,’, ’.’).split()))
    if 20 < m < 40 and int(m) % 9 == 0:
        if y > 60:
            a[0].append([x, y])
        elif y > 20:
                                                                                                  
                                                                                                  
            a[1].append([x, y])
        elif x > 0:
            a[2].append([x, y])
        else:
            a[3].append([x, y])

sum_x = sum_y = 0  # Переменные для суммы абсцисс и ординат центров
for i in a:
    tx = ty = 0  # Координаты текущего центра кластера
    mn = 100000050000  # Минимальное расстояние
    for j in i:
        x1, y1 = j
        sm = 0  # Суммарное расстояние
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 4))
print(int(sum_y / 4))

Диаграмма для файла Б имеет вид:

PIC

Рассмотрим все 5 кластеров и координаты, которыми их можно последовательно отделить:

1) y > 0

2) x < − 50

3) x < − 20

4) y > − 50

5) все остальные точки

Код программы для файла Б:

# распределение на кластеры с помощью метода dbscan
from math import *

f = open(’3B.txt’)
s = f.readline()
# сохраняем массив данных
st = [list(map(float, i.replace(’,’, ’.’).split())) for i in f]
# for i in range(len(st)):
#     if (st[i][1] < -50 and st[i][0] > 0) and 45 < st[i][2] < 98 and (int(st[i][2]) % 10) % 2 == 0:
#         print(i)
#         break
a = [[[st[6002][0], st[6002][1]]], [[st[8002][0], st[8002][1]]], [[st[1][0], st[1][1]]], [[st[2000][0], st[2000][1]]], [[st[4002][0], st[4002][1]]]]
st.pop(6002), st.pop(8002), st.pop(1), st.pop(2000), st.pop(4002)
for i in range(len(st)):
    if (45 > st[i][2] or st[i][2] > 98) or (int(st[i][2]) % 10) % 2 != 0:
        st[i] = ’*’

for k in range(5):
    for j in a[k]:
        for i in range(len(st)):
            if st[i] != ’*’:
                p = [st[i][0], st[i][1]]
                if dist(p, j) < 5 and (int(st[i][2]) % 10) % 2 == 0:
                    a[k].append(p)
                    st[i] = ’*’

# распеределение на кластеры с помощью значений координат
f = open(’3B.txt’)
n = f.readline()  # Считываем первую строку файла с названиями столбцов
a = [[] for i in range(5)]  # Создаём список для кластеров
for line in f:  # Считваем звёзды и определяем их к кластерам
    x, y, m = list(map(float, line.replace(’,’, ’.’).split()))
    if 45 < m < 98 and (int(m) % 10) % 2 == 0:
        if y > 0:
            a[0].append([x, y])
        elif x < -50:
            a[1].append([x, y])
        elif x < -20:
            a[2].append([x, y])
        elif y > -50:
            a[3].append([x, y])
        else:
                                                                                                  
                                                                                                  
            a[4].append([x, y])

sum_x = sum_y = 0  # Переменные для суммы абсцисс и ординат центров
for i in a:
    tx = ty = 0  # Координаты текущего центра кластера
    mn = 100000050000  # Минимальное расстояние
    for j in i:
        x1, y1 = j
        sm = 0  # Суммарное расстояние
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 5))
print(int(sum_y / 5))

Ответ: -31 23 -21 -34

Ошибка.
Попробуйте повторить позже

Задача 19#103238

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиусом R  . Каждая звезда обязательно принадлежит только одному из кластеров.

Истинный центр кластера, или центроид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера минимальна.

Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B(x2,y2)  на плоскости, которое вычисляется по формуле:

d(A, B) = ∘ (x-−-x-)2 +-(y-−-y-)2
            2   1      2   1

В файле A хранятся данные о звёздах двух кластеров, где R = 5  . В каждой строке записана информация о расположении на карте одной звезды: сначала координата x  , затем координата y  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 1200.

В файле Б хранятся данные о звёздах трёх кластеров, где R = 8  . Известно, что количество звёзд не превышает 15000. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Px  — произведение абсцисс центров кластеров, и Py  – произведение ординат центров кластеров.

В ответе запишите два числа через пробел: сначала целую часть произведения Px ⋅Py ⋅100  для файла А, далее целую часть произведения Px ⋅Py ⋅1000 000000  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Проведем между ними прямую, разделяющую их. Прямая проходит через две точки: (− 2,4),(− 4;1)

Уравнение прямой по двум точкам имеет вид:

-x+-2- = y−-4-
− 4+ 2   1− 4

2y − 3x = 14

Соответственно, точки, которые удовлетворяют неравенству

y < 1.5⋅x +7

принадлежат правому кластеру, а остальные – левому

Код программы для файла А:

f = open(’4A.txt’)
n = f.readline()  # Считываем первую строку файла с названиями столбцов
a = [[] for i in range(2)]  # Создаём список для кластеров
for line in f:  # Считваем звёзды и определяем их к кластерам
    x, y = list(map(float, line.replace(’,’, ’.’).split()))
    if y < 1.5 * x + 7:
        a[0].append([x, y])
    else:
        a[1].append([x, y])

mul_x = mul_y = 1  # Переменные для произведения абсцисс и ординат центров
for i in a:
    tx = ty = 0  # Координаты текущего центра кластера
    mn = 100000050000  # Минимальное расстояние
    for j in i:
        x1, y1 = j
        sm = 0  # Суммарное расстояние
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    mul_x *= tx
    mul_y *= ty
print(int(mul_x * mul_y * 100))

Диаграмма для файла Б имеет вид:

PIC

Проведем между ними прямые, разделяющие их.

Первая прямая проходит через две точки: (1.8;0.2),(2.6;1.2)

Уравнение прямой по двум точкам имеет вид:

 x− 1.8    y− 0.2
--------= --------
2.6− 1.8   1.2− 0.2

x− 1.8 = 0.8y− 0.16

y = 1.25x− 2.05

Соответственно, точки, которые удовлетворяют неравенству

y < 1.25x− 2.05

принадлежат правому кластеру.

Вторая прямая проходит через две точки: (1.2;0.4),(0.2;1.2)

Уравнение прямой по двум точкам имеет вид:

 x− 1.2    y− 0.4
--------= --------
0.2− 1.2   1.2− 0.4

0.8x − 0.96 = 0.4− y

y = − 0.8x+ 1.36

Соответственно, точки, которые удовлетворяют неравенству

y < − 0.8 ⋅x+ 1.36

принадлежат левому кластеру.

Остальные точки принадлежат кластеру по центру.

Код программы для файла Б:

f = open(’4B.txt’)
n = f.readline()  # Считываем первую строку файла с названиями столбцов
a = [[] for i in range(3)]  # Создаём список для кластеров
for line in f:  # Считваем звёзды и определяем их к кластерам
    x, y = list(map(float, line.replace(’,’, ’.’).split()))
    if y < 1.25 * x - 2.05:
        a[0].append([x, y])
    elif y < -0.8 * x + 1.36:
        a[1].append([x, y])
    else:
        a[2].append([x, y])

mul_x = mul_y = 1  # Переменные для произведения абсцисс и ординат центров
for i in a:
    tx = ty = 0  # Координаты текущего центра кластера
    mn = 100000050000  # Минимальное расстояние
    for j in i:
        x1, y1 = j
        sm = 0  # Суммарное расстояние
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm < mn:
            mn = sm
            tx, ty = x1, y1
    mul_x *= tx
    mul_y *= ty
print(int(mul_y * mul_x * 1_000_000_000))

Ответ: 2505 220

Ошибка.
Попробуйте повторить позже

Задача 20#103239

Учёный решил провести кластеризацию некоторого множества звёзд по их расположению на карте звёздного неба, а также по блеску звезды. Кластер звёзд – это набор звёзд (точек) на графике, лежащий внутри круга радиуса R  . Каждая звезда, подходящая под заданный уровень блеска, обязательно принадлежит только одному из кластеров. Остальные звёзды не относятся к рассматриваемым кластерам.

Истинная периферия кластера, или перифероид, – это одна из звёзд на графике, сумма расстояний от которой до всех остальных звёзд кластера максимальна.

Под расстоянием понимается расстояние Евклида между двумя точками A(x1,y1)  и B(x2,y2)  на плоскости, которое вычисляется по формуле:

        ∘ --------------------
d(A, B) =  (x2 − x1)2 + (y2 − y1)2

Аномалиями назовём точки, находящиеся на расстоянии более R  условных единиц от точек кластеров. При расчётах аномалии учитывать не нужно.

В файле A хранятся данные о звёздах шести кластеров, где R = 10  для каждого кластера, а звёзды обладают блеском условных единиц, целая часть которых четна. В каждой строке записана информация об уровне блеска звезды, а также о расположении на карте одной звезды: сначала координата x  , затем координата y  и наконец уровень блеска m  . Значения даны в условных единицах, которые представлены вещественными числами. Известно, что количество звёзд не превышает 3000.

В файле Б хранятся данные о звёздах трех кластеров, где R = 3  для каждого кластера, а звёзды обладают блеском условных единиц, целая часть которых нечетна. Известно, что количество звёзд не превышает 20000. Структура хранения информации о звездах в файле Б аналогична файлу А.

Для каждого файла определите координаты периферии каждого кластера, затем вычислите два числа: Px  — среднее арифметическое абсцисс периферий кластеров, и Py  – среднее арифметическое ординат периферий кластеров.

В ответе запишите четыре числа через пробел: сначала целую часть Px  для файла А и Py  для файла А, далее целую часть произведения Px ⋅500  для файла Б и Py ⋅500  для файла Б.

Возможные данные одного из файлов иллюстрированы графиком.

Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию. Для выполнения задания используйте данные из прилагаемого файла.

PIC

Вложения к задаче
Показать ответ и решение

Для начала визуально оценим данные в условии кластеры. Для этого откроем предложенные файлы в Excel  , перейдем в раздел «Вставка → Диаграммы → Точечная».

Диаграмма для файла А имеет вид:

PIC

Рассмотрим 6 кластеров и координаты, в которых они находятся:

1) x < − 280,y > 150

2) x < − 260,− 50 < y < 50

3) − 140 < x < − 100,− 200 < y < − 150

4) 140 < x < 200,− 100 < y < 0

5) 180 < x < 215,y < − 200

6) 215 < x < 250,y < − 200

Код программы для файла А:

f = open(’5A.txt’)
n = f.readline()  # Считываем первую строку файла с названиями столбцов

#распределение звезд на кластеры с помощью метода dbscan

# сохраняем массив данных
st = [list(map(float, i.replace(’,’, ’.’).split())) for i in f]
# подбираем по 1 звезде для каждого кластера меняя параметры в скобках
# for i in range(len(st)):
#     if (215 < st[i][0] < 250 and -200 > st[i][1]) and int(st[i][2]) % 2 == 0:
#         print(i)
#         break

a = [[[st[338][0], st[338][1]]], [[st[1332][0], st[1332][1]]], [[st[2][0], st[2][1]]], [[st[999][0], st[999][1]]], [[st[1666][0], st[1666][1]]], [[st[666][0], st[666][1]]]]

st.pop(1666), st.pop(1332), st.pop(999), st.pop(666), st.pop(338), st.pop(2)

# отсеиваем все звезды с неподходящим блеском
for i in range(len(st)):
    if int(st[i][2]) % 2 != 0:
        st[i] = ’*’
# разделяем звезды на кластеры методом dbscan
for k in range(6):
    for j in a[k]:
        for i in range(len(st)):
            if st[i] != ’*’:
                p = [st[i][0], st[i][1]]
                if dist(p, j) < 10 and int(st[i][2]) % 2 == 0:
                    a[k].append(p)
                    st[i] = ’*’

# распределение звезд на кластеры с помощью координат

a = [[] for i in range(6)]  # Создаём список для кластеров
for line in f:  # Считваем звёзды и определяем их к кластерам
    x, y, m = list(map(float, line.replace(’,’, ’.’).split()))
    if int(m) % 2 == 0:
        if (x < -280) and (y > 150):
            a[0].append([x, y])
        elif (x < -260) and (-50 < y < 50):
            a[1].append([x, y])
        elif (-140 < x < -100) and (-200 < y < -150):
                                                                                                  
                                                                                                  
            a[2].append([x, y])
        elif (140 < x < 200) and (-100 < y < 0):
            a[3].append([x, y])
        elif (180 < x < 215) and (y < -200):
            a[4].append([x, y])
        elif (215 < x < 250) and (y < -200):
            a[5].append([x, y])

sum_x = sum_y = 0  # Переменные для суммы абсцисс и ординат периферий
for i in a:
    tx = ty = 0  # Координаты текущей периферии кластера
    mx = -100000050000  # Максимальное расстояние
    for j in i:
        x1, y1 = j
        sm = 0  # Суммарное расстояние
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm > mx:
            mx = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 6))
print(int(sum_y / 6))

Диаграмма для файла Б имеет вид:

PIC

Рассмотрим все 3 кластера и координаты, в которых они находятся:

1) − 17 < x < − 5,40 < y < 50

2) 40 < x < 50,8 < y < 20

3)− 15 < x < 0,− 35 < y < − 20

Код программы для файла Б:

f = open(’5B.txt’)
n = f.readline()  # Считываем первую строку файла с названиями столбцов

#распределение звезд на кластеры с помощью метода dbscan

# сохраняем массив данных
st = [list(map(float, i.replace(’,’, ’.’).split())) for i in f]
# подбираем по 1 звезде для каждого кластера меняя параметры в скобках
# for i in range(len(st)):
#     if (40 < st[i][0] < 50 and 8 < st[i][1] < 20) and int(st[i][2]) % 2 != 0:
#         print(i)
#         break

a = [[[st[8000][0], st[8000][1]]], [[st[4003][0], st[4003][1]]], [[st[2][0], st[2][1]]]]

st.pop(8000), st.pop(4003), st.pop(2)

# отсеиваем все звезды с неподходящим блеском
for i in range(len(st)):
    if int(st[i][2]) % 2 == 0:
        st[i] = ’*’
# разделяем звезды на кластеры методом dbscan
for k in range(3):
    for j in a[k]:
        for i in range(len(st)):
            if st[i] != ’*’:
                p = [st[i][0], st[i][1]]
                if dist(p, j) < 3 and int(st[i][2]) % 2 != 0:
                    a[k].append(p)
                    st[i] = ’*’

# распределение звезд на кластеры с помощью координат

a = [[] for i in range(3)]  # Создаём список для кластеров
for line in f:  # Считваем звёзды и определяем их к кластерам
    x, y, m = list(map(float, line.replace(’,’, ’.’).split()))
    if int(m) % 2 != 0:
        if (-17 < x < -5) and (40 < y < 50):
            a[0].append([x, y])
        elif (40 < x < 50) and (8 <  y < 20):
            a[1].append([x, y])
        elif (-15 < x < 0) and (-35 < y < -20):
                                                                                                  
                                                                                                  
            a[2].append([x, y])

sum_x = sum_y = 0  # Переменные для суммы абсцисс и ординат периферий
for i in a:
    tx = ty = 0  # Координаты текущей периферии кластера
    mx = -100000050000  # Максимальное расстояние
    for j in i:
        x1, y1 = j
        sm = 0  # Суммарное расстояние
        for k in i:
            x2, y2 = k
            sm += ((x2-x1)**2 + (y2-y1)**2)**0.5
        if sm > mx:
            mx = sm
            tx, ty = x1, y1
    sum_x += tx
    sum_y += ty
print(int(sum_x / 3 * 500))
print(int(sum_y / 3 * 500))

Ответ: -14 -99 4765 6388
Рулетка
Вы можете получить скидку в рулетке!