[Python] 해시(3) 베스트앨범

Updated: Categories:

https://programmers.co.kr/learn/courses/30/lessons/42579

문제설명

스트리밍 사이트에서 장르 별로 가장 많이 재생된 노래를 두 개씩 모아 베스트 앨범을 출시하려 합니다. 노래는 고유 번호로 구분하며, 노래를 수록하는 기준은 다음과 같습니다.

  1. 속한 노래가 많이 재생된 장르를 먼저 수록합니다.
  2. 장르 내에서 많이 재생된 노래를 먼저 수록합니다.
  3. 장르 내에서 재생 횟수가 같은 노래 중에서는 고유 번호가 낮은 노래를 먼저 수록합니다.

노래의 장르를 나타내는 문자열 배열 genres와 노래별 재생 횟수를 나타내는 정수 배열 plays가 주어질 때, 베스트 앨범에 들어갈 노래의 고유 번호를 순서대로 return 하도록 solution 함수를 완성하세요.

제한사항

  • genres[i]는 고유번호가 i인 노래의 장르입니다.
  • plays[i]는 고유번호가 i인 노래가 재생된 횟수입니다.
  • genres와 plays의 길이는 같으며, 이는 1 이상 10,000 이하입니다.
  • 장르 종류는 100개 미만입니다.
  • 장르에 속한 곡이 하나라면, 하나의 곡만 선택합니다.
  • 모든 장르는 재생된 횟수가 다릅니다.

입출력 예

genres plays return
[classic, pop, classic, classic, pop] [500, 600, 150, 800, 2500] [4, 1, 3, 0]

입출력 예 설명

classic 장르는 1,450회 재생되었으며, classic 노래는 다음과 같습니다.

  • 고유 번호 3: 800회 재생
  • 고유 번호 0: 500회 재생
  • 고유 번호 2: 150회 재생

pop 장르는 3,100회 재생되었으며, pop 노래는 다음과 같습니다.

  • 고유 번호 4: 2,500회 재생
  • 고유 번호 1: 600회 재생

따라서 pop 장르의 [4, 1]번 노래를 먼저, classic 장르의 [3, 0]번 노래를 그다음에 수록합니다.


아이디어

  1. 노래는 id, 장르, 재생횟수 정보를 가지고 있고 해시를 활용해 어떻게 묶을지가 중요
  2. 해시(딕셔너리)를 활용하여 장르 : [[id1, 재생횟수],[id2, 재생횟수]] 형태로 묶어준다.
  3. 딕셔너리의 value 리스트를 재생횟수의 내림차순으로 정렬하고, 거기서 2개의 리스트의 id만을 추출한다.
  4. 추출한 id리스트를 해당 장르의 재생횟수 총합과 묶는다 (딕셔너리).
  5. 그 딕셔너리의 item 리스트를 다시 재생횟수 총합의 내림차순으로 정렬한다.
  6. 정렬된 item 리스트에서 id만 추출한다.

알게 된 함수/방법

  • defaultdict(_) : 입력값에 자료형이나 람다 함수를 넣어 기본값을 정의할 수 있는 딕셔너리.
  • itemgetter(_) : sorted함수 안에서 key의 값으로 사용됨. 2차원 리스트일 경우 원소 리스트의 _열을 기준으로 정렬된다. (key에 lambda x:x[_] 를 넣은것과 동일)
  • enumerate(zip(리스트)) : zip으로 두 리스트를 묶고 순회하면 튜플로 출력, 그 튜플에 인덱스까지 추출하기
  • sum(2차원리스트, []) : 2차원리스트 입력시 1차원리스트로 반환.

정답 코드

from collections import defaultdict
from operator import itemgetter
def solution(genres, plays):
    dic_g = defaultdict(lambda : [])
    for i, z in enumerate(zip(genres, plays)):
        dic_g[z[0]].append([i, z[1]])

    dic_n = {}
    for v in dic_g.values():
        v = sorted(v, key=itemgetter(1), reverse=True)
        key = sum([ i[1] for i in v])   
        value = [i[0] for i in v][0:2]  
        dic_n[key] = value

    item = sorted(dic_n.items(), key=itemgetter(0), reverse=True)
    answer = sum([i[1] for i in item], [])
    return answer