백준 2108: 통계학

 

 
 

문제 설명

 

 

수를 처리하는 것은 통계학에서 상당히 중요한 일이다. 통계학에서 N개의 수를 대표하는 기본 통계값에는

 

다음과 같은 것들이 있다. 단, N은 홀수라고 가정하자.

 

 

  1. 산술평균 : N개의 수들의 합을 N으로 나눈 값
  2. 중앙값 : N개의 수들을 증가하는 순서로 나열했을 경우 그 중앙에 위치하는 값
  3. 최빈값 : N개의 수들 중 가장 많이 나타나는 값

  4. 범위 : N개의 수들 중 최댓값과 최솟값의 차이

 

 

N개의 수가 주어졌을 때, 네 가지 기본 통계값을 구하는 프로그램을 작성하시오.

 

 

 

 

 

 

입력

 

 

첫째 줄에 수의 개수 N(1 ≤ N ≤ 500,000)이 주어진다. 단, N은 홀수이다. 그 다음 N개의 줄에는 정수들이 주어진다.

 

입력되는 정수의 절댓값은 4,000을 넘지 않는다.

 

 

 

 

 

 

출력

 

 

첫째 줄에는 산술평균을 출력한다. 소수점 이하 첫째 자리에서 반올림한 값을 출력한다.

 

둘째 줄에는 중앙값을 출력한다.

 

셋째 줄에는 최빈값을 출력한다. 여러 개 있을 때에는 최빈값 중 두 번째로 작은 값을 출력한다.

 

넷째 줄에는 범위를 출력한다.

 

 

 

 

 

 

내 답

 

1. 수를 입력받아 배열에 저장할 때, 수의 총합인 sum변수를 선언해 총합을 구해두었다.

 

 

2. 최빈수를 구하기 위해 카운트 배열을 쓰고자 했으나,

 

수 범위를 500,000까지인 것으로 잘못 읽어 메모리 초과 발생을 우려해 Map 자료형을 선택했다.

 

또한 최빈수가 여러개일 때 그 수를 저장하기 위해 리스트를 사용했다.

 

 

3. 또한 Arrays.sort를 통해 최대값과 최소값(arr[N-1]-arr[0]) 차이, 중앙값(arr[N/2])을 얻어냈다.

 

 

 

>> 결과적으로 최빈수를 구하는 과정에서 list를 만들고, Collections.sort를 사용한 것, map자료형을 사용한 것이

 

실행속도를 늦춘 원인으로 판단했다. 크기 8001짜리 카운트 배열을 활용해 구했다면 훨씬 빠를 것으로 예상했다. 

 

import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collections;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.PriorityQueue;
import java.util.Scanner;

public class Main {
	public static void main(String[] args) {
		Scanner sc = new Scanner(System.in);
		StringBuilder sb = new StringBuilder();

		Map<Integer, Integer> map = new HashMap<>(); // 최빈값 계산

		int n = sc.nextInt();
		int[] arr = new int[n];

		int sum = 0;
		// 입력받으면서 총합 구함
		for (int i = 0; i < n; i++) {
			int tmp = sc.nextInt();
			arr[i] = tmp;
			sum += tmp;
			// 해당 값의 빈도를 카운트
			if (map.containsKey(tmp)) {
				map.put(tmp, map.get(tmp) + 1);
			} else {
				map.put(tmp, 1);
			}
		}

		// 산술평균 출력
		sb.append(Math.round((double) sum / n)).append('\n');
		// 중앙값 계산
		Arrays.sort(arr); // 오름차순 정렬
		sb.append(arr[n / 2]).append('\n');

		// 최빈값 계산
		int max = 0;
		List<Integer> list = new ArrayList<>();
		for (int key : map.keySet()) {
			if (map.get(key) > max) {
				max = map.get(key);
				list.clear();
				list.add(key);
			} else if (map.get(key) == max) {
				list.add(key);
			}
		}
		Collections.sort(list);
		if (list.size() <= 1) {
			sb.append(list.get(0)).append('\n');
		} else {
			sb.append(list.get(1)).append('\n');
		}
		
		// 최대값, 최소값 차이
		sb.append(arr[n - 1] - arr[0]);

		System.out.println(sb);
	}
}

 

 

 

 

개선 사항

 

import java.util.Arrays;
import java.util.Scanner;

public class Main {
    public static void main(String[] args) {
        Scanner sc = new Scanner(System.in);
        StringBuilder sb = new StringBuilder();

        int n = sc.nextInt();
        int[] arr = new int[n];
        int[] count = new int[8001]; // -4000 ~ 4000 범위를 담을 수 있는 배열

        int sum = 0;
        int maxFrequency = 0;
        // 입력받으면서 총합과 빈도 계산
        for (int i = 0; i < n; i++) {
            int value = sc.nextInt();
            arr[i] = value;
            sum += value;
            count[value + 4000]++; // -4000 ~ 4000을 0 ~ 8000으로 매핑
            maxFrequency = Math.max(maxFrequency, count[value + 4000]);
        }

        // 산술평균 계산 (반올림)
        sb.append(Math.round((double) sum / n)).append('\n');

        // 중앙값 계산을 위해 정렬
        Arrays.sort(arr);
        sb.append(arr[n / 2]).append('\n');

        // 최빈값 계산
        int max = Integer.MAX_VALUE;
        boolean foundSecond = false;
        for (int i = 0; i < count.length; i++) {
            if (count[i] == maxFrequency) {
                if (max == Integer.MAX_VALUE) {
                    max = i - 4000;
                } else if (!foundSecond) {
                    max = i - 4000;
                    foundSecond = true;
                }
            }
        }
        sb.append(mode).append('\n');

        // 최대값과 최소값의 차이 계산
        sb.append(arr[n - 1] - arr[0]).append('\n');

        // 결과 출력
        System.out.println(sb);
    }
}

 

 

  1. 수를 입력받을 때, sum값을 구하는 것 뿐 아니라 카운트배열을 활용해 바로 카운트하고,

    최빈값도 갱신하여 구함



  2. 카운트 배열을 순회하며 최빈값을 만나면 저장해두고,

    그다음 큰 수에서 최빈값을 마주치면 해당 값을 최빈값으로 갱신


    문제를 더 잘 읽자..!!